Fugu-MT 論文翻訳(概要): A Configurable Library for Generating and Manipulating Maze Datasets

論文の概要: A Configurable Library for Generating and Manipulating Maze Datasets

arxiv url: http://arxiv.org/abs/2309.10498v2
Date: Tue, 24 Oct 2023 21:42:01 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-26 19:39:27.350142
Title: A Configurable Library for Generating and Manipulating Maze Datasets
Title（参考訳）: mazeデータセットの生成と操作のための構成可能なライブラリ
Authors: Michael Igorevich Ivanitskiy, Rusheb Shah, Alex F. Spies, Tilman R\"auker, Dan Valentine, Can Rager, Lucia Quirke, Chris Mathwin, Guillaume Corlouer, Cecilia Diniz Behn, Samy Wu Fung
Abstract要約: 迷路は様々な生成アルゴリズムのために優れたテストベッドとして機能する。我々は、maze-solvingタスクからなるデータセットの生成、処理、視覚化のための包括的なライブラリである、$textttmaze-dataset$を提示する。
参考スコア（独自算出の注目度）: 0.9268994664916388
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Understanding how machine learning models respond to distributional shifts is a key research challenge. Mazes serve as an excellent testbed due to varied generation algorithms offering a nuanced platform to simulate both subtle and pronounced distributional shifts. To enable systematic investigations of model behavior on out-of-distribution data, we present $\texttt{maze-dataset}$, a comprehensive library for generating, processing, and visualizing datasets consisting of maze-solving tasks. With this library, researchers can easily create datasets, having extensive control over the generation algorithm used, the parameters fed to the algorithm of choice, and the filters that generated mazes must satisfy. Furthermore, it supports multiple output formats, including rasterized and text-based, catering to convolutional neural networks and autoregressive transformer models. These formats, along with tools for visualizing and converting between them, ensure versatility and adaptability in research applications.
Abstract（参考訳）: 分散シフトに機械学習モデルがどのように反応するかを理解することは、重要な研究課題である。 Mazesは、微妙な分布シフトと顕著な分布シフトの両方をシミュレートするニュアンスなプラットフォームを提供する様々な生成アルゴリズムのために、優れたテストベッドとして機能する。そこで本研究では,maze処理タスクからなるデータセットの生成,処理,視覚化のための包括的なライブラリである$\texttt{maze-dataset}$を提案する。このライブラリを使用すると、研究者はデータセットを簡単に作成でき、使用する生成アルゴリズム、選択したアルゴリズムに供給されるパラメータ、迷路を生成するフィルタを満たさなければならない。さらに、ラスタライズドおよびテキストベースを含む複数の出力フォーマットをサポートし、畳み込みニューラルネットワークと自己回帰トランスフォーマーモデルに対応している。これらのフォーマットは、可視化と変換のためのツールとともに、研究アプリケーションにおける汎用性と適応性を保証する。

関連論文リスト

SnipGen: A Mining Repository Framework for Evaluating LLMs for Code [51.07471575337676]
言語モデル(LLM)は、コードリポジトリを含む広範なデータセットに基づいてトレーニングされる。それらの有効性を評価することは、トレーニングに使用されるデータセットと評価に使用されるデータセットとが重複する可能性があるため、大きな課題となる。 SnipGenは、コード生成のために、様々な下流タスクをまたいだ迅速なエンジニアリングを活用するように設計された包括的なリポジトリマイニングフレームワークである。
論文参考訳（メタデータ） (2025-02-10T21:28:15Z)
Generating Realistic Tabular Data with Large Language Models [49.03536886067729]
大規模言語モデル(LLM)は多様なタスクに使われてきたが、特徴と対象変数の正確な相関は捉えていない。そこで本研究では,LLMに基づく3つの重要な改良を加えて,実データの特徴クラス相関を正しく把握する手法を提案する。実験の結果,本手法は下流タスクにおいて,20個のデータセット上で10個のSOTAベースラインを著しく上回っていることがわかった。
論文参考訳（メタデータ） (2024-10-29T04:14:32Z)
Exploring Beyond Logits: Hierarchical Dynamic Labeling Based on Embeddings for Semi-Supervised Classification [49.09505771145326]
モデル予測に依存しない階層型動的ラベル付け(HDL)アルゴリズムを提案し,画像埋め込みを用いてサンプルラベルを生成する。本手法は,半教師付き学習における擬似ラベル生成のパラダイムを変える可能性がある。
論文参考訳（メタデータ） (2024-04-26T06:00:27Z)
Contrastive Transformer Learning with Proximity Data Generation for Text-Based Person Search [60.626459715780605]
記述的なテキストクエリーを与えられたテキストベースの人物検索は、画像ギャラリーからベストマッチした人物を検索することを目的としている。このようなクロスモーダル検索タスクは、重要なモダリティギャップ、きめ細かい相違、注釈付きデータの不十分さのため、かなり難しい。本稿では,テキストに基づく人物検索のための2つのトランスフォーマーモデルを提案する。
論文参考訳（メタデータ） (2023-11-15T16:26:49Z)
Dataset Factory: A Toolchain For Generative Computer Vision Datasets [0.9013233848500058]
メタデータからサンプルの保存と処理を分離する「データセットファクトリ」を提案する。これにより、機械学習チームや個々の研究者に対して、大規模にデータ中心の操作が可能になる。
論文参考訳（メタデータ） (2023-09-20T19:43:37Z)
Diffusion Model is an Effective Planner and Data Synthesizer for Multi-Task Reinforcement Learning [101.66860222415512]
Multi-Task Diffusion Model (textscMTDiff) は、トランスフォーマーのバックボーンを組み込んだ拡散に基づく手法であり、生成計画とデータ合成のための素早い学習を行う。生成計画において、textscMTDiffはMeta-World上の50のタスクとMaze2D上の8のマップで最先端のアルゴリズムより優れています。
論文参考訳（メタデータ） (2023-05-29T05:20:38Z)
TSGM: A Flexible Framework for Generative Modeling of Synthetic Time Series [61.436361263605114]
時系列データは、研究者と産業組織間のデータの共有を妨げるため、しばしば不足または非常に敏感である。本稿では,合成時系列の生成モデリングのためのオープンソースフレームワークである時系列生成モデリング(TSGM)を紹介する。
論文参考訳（メタデータ） (2023-05-19T10:11:21Z)
Creating Synthetic Datasets for Collaborative Filtering Recommender Systems using Generative Adversarial Networks [1.290382979353427]
機械学習における研究と教育には、必要なトレーニング、検証、テストタスクを処理するために、多様な、代表的でオープンなデータセットが必要です。この研究の多様性を養うためには、既存のデータセットを合成データセットで補強する必要がある。本稿では,協調フィルタリングデータセットを生成するGAN(Generative Adversarial Network)に基づく手法を提案する。
論文参考訳（メタデータ） (2023-03-02T14:23:27Z)
Variational Autoencoding Neural Operators [17.812064311297117]
関数型データによる教師なし学習は、コンピュータビジョン、気候モデリング、物理システムへの応用を含む機械学習研究の新たなパラダイムである。本稿では,大規模な演算子学習アーキテクチャを変分オートエンコーダとして機能させる汎用戦略として,変分オートエンコードニューラル演算子(VANO)を提案する。
論文参考訳（メタデータ） (2023-02-20T22:34:43Z)
Dataset Interfaces: Diagnosing Model Failures Using Controllable Counterfactual Generation [85.13934713535527]
分散シフトは、機械学習モデルの主要な障害源である。入力データセットとユーザが指定したシフトを与えられたフレームワークは、望ましいシフトを示すインスタンスを返す。本稿では,このデータセットインターフェースをImageNetデータセットに適用することにより,分散シフトの多種多様さにまたがるモデル動作の学習が可能になることを示す。
論文参考訳（メタデータ） (2023-02-15T18:56:26Z)
Merlion: A Machine Learning Library for Time Series [73.46386700728577]
Merlionは時系列のためのオープンソースの機械学習ライブラリである。モデルの統一インターフェースと、異常検出と予測のためのデータセットを備えている。 Merlionはまた、本番環境でのモデルのライブデプロイメントと再トレーニングをシミュレートするユニークな評価フレームワークも提供する。
論文参考訳（メタデータ） (2021-09-20T02:03:43Z)
Benchpress: A Scalable and Versatile Workflow for Benchmarking Structure Learning Algorithms [1.7188280334580197]
確率的グラフィカルモデルは、データ生成メカニズムをモデル化するための一般的なアプローチである。我々は、スケーラブルで再現性があり、プラットフォームに依存しないベンチマークを作成するために、Benchpressという新しいSnakemakeワークフローを提案する。ベイジアンネットワークを5つの典型的なデータシナリオで学習するためのこのワークフローの適用性を実証する。
論文参考訳（メタデータ） (2021-07-08T14:19:28Z)
Out-of-distribution Detection and Generation using Soft Brownian Offset Sampling and Autoencoders [1.313418334200599]
ディープニューラルネットワークは、分散検出の改善によって部分的に修復される過信に苦しむことが多い。本稿では,所定の分布内データセットに基づいて分散外データセットを生成できる新しい手法を提案する。この新しいデータセットは、与えられたデータセットと機械学習タスクの配信外検出を改善するために使用できる。
論文参考訳（メタデータ） (2021-05-04T06:59:24Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。