論文の概要: LocoMuJoCo: A Comprehensive Imitation Learning Benchmark for Locomotion
- arxiv url: http://arxiv.org/abs/2311.02496v2
- Date: Thu, 30 Nov 2023 17:47:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-01 22:56:16.150949
- Title: LocoMuJoCo: A Comprehensive Imitation Learning Benchmark for Locomotion
- Title(参考訳): locomujoco:locomotionのための総合的模倣学習ベンチマーク
- Authors: Firas Al-Hafez and Guoping Zhao and Jan Peters and Davide Tateo
- Abstract要約: 模倣学習は、エンボディエージェントでアジャイルの移動を可能にするための大きな約束を持っています。
本稿では,ILアルゴリズムの厳密な評価と比較を容易にするための新しいベンチマークを提案する。
このベンチマークは四足歩行、二足歩行、筋骨格人体モデルを含む多様な環境を含む。
- 参考スコア(独自算出の注目度): 20.545058017790428
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Imitation Learning (IL) holds great promise for enabling agile locomotion in
embodied agents. However, many existing locomotion benchmarks primarily focus
on simplified toy tasks, often failing to capture the complexity of real-world
scenarios and steering research toward unrealistic domains. To advance research
in IL for locomotion, we present a novel benchmark designed to facilitate
rigorous evaluation and comparison of IL algorithms. This benchmark encompasses
a diverse set of environments, including quadrupeds, bipeds, and
musculoskeletal human models, each accompanied by comprehensive datasets, such
as real noisy motion capture data, ground truth expert data, and ground truth
sub-optimal data, enabling evaluation across a spectrum of difficulty levels.
To increase the robustness of learned agents, we provide an easy interface for
dynamics randomization and offer a wide range of partially observable tasks to
train agents across different embodiments. Finally, we provide handcrafted
metrics for each task and ship our benchmark with state-of-the-art baseline
algorithms to ease evaluation and enable fast benchmarking.
- Abstract(参考訳): Imitation Learning (IL)は、エンボディエージェントでアジャイルの移動を可能にするための大きな約束を持っています。
しかし、既存のlocomotionベンチマークの多くは、主に単純化されたおもちゃのタスクに焦点を当てており、しばしば現実のシナリオの複雑さを捉えず、非現実的なドメインに対する研究の運営に失敗した。
そこで本研究では,ILアルゴリズムの厳密な評価と比較を容易にするための新しいベンチマークを提案する。
このベンチマークは、四足歩行、二足歩行、筋骨格の人間モデルを含む多様な環境を包含しており、それぞれが実際のノイズモーションキャプチャデータ、グランド・トゥルート・エキスパート・データ、グランド・トゥルート・サブ・オプティカル・データなどの包括的なデータセットを伴い、難易度レベルのスペクトルをまたいで評価することができる。
学習エージェントの堅牢性を高めるために、動的ランダム化のための簡単なインタフェースを提供し、異なる実施形態でエージェントを訓練するための広範囲な部分観測可能なタスクを提供する。
最後に、各タスクに手作りのメトリクスを提供し、評価を容易にし、高速なベンチマークを可能にする最先端のベースラインアルゴリズムでベンチマークを出荷する。
関連論文リスト
- NUMOSIM: A Synthetic Mobility Dataset with Anomaly Detection Benchmarks [5.852777557137612]
本稿では,自動ベンチマーク手法の制御,倫理的,多様な環境を提供する合成モビリティデータセットNUMOSIMを紹介する。
NUMOSIMは様々な現実的なモビリティシナリオをシミュレートし、典型的な動作と異常な動作の両方を包含する。
NUMOSIMデータセットへのオープンアクセスと、包括的なドキュメント、評価指標、ベンチマーク結果を提供する。
論文 参考訳(メタデータ) (2024-09-04T18:31:24Z) - A Practitioner's Guide to Continual Multimodal Pretraining [83.63894495064855]
マルチモーダル・ファンデーション・モデルは視覚と言語を交わす多くのアプリケーションに役立っている。
モデルを更新し続けるために、継続事前トレーニングの研究は主に、大規模な新しいデータに対する頻度の低い、差別的な更新、あるいは頻繁に行われるサンプルレベルの更新のシナリオを探求する。
本稿では,FoMo-in-Flux(FoMo-in-Flux)について紹介する。
論文 参考訳(メタデータ) (2024-08-26T17:59:01Z) - Learning Generalizable Human Motion Generator with Reinforcement Learning [95.62084727984808]
テキスト駆動型ヒューマンモーション生成は、コンピュータ支援コンテンツ作成において重要なタスクの1つである。
既存の方法は訓練データ中の特定の動作表現に過度に適合することが多く、一般化する能力を妨げている。
一般化可能なヒューマンモーション生成のための強化学習において,パスとエラーのパラダイムを取り入れた textbfInstructMotion を提案する。
論文 参考訳(メタデータ) (2024-05-24T13:29:12Z) - Are You Being Tracked? Discover the Power of Zero-Shot Trajectory
Tracing with LLMs! [3.844253028598048]
LLMTrackは、ゼロショット軌道認識にLLMをどのように活用できるかを示すモデルである。
本研究では,屋内シナリオと屋外シナリオを特徴とする異なる軌跡を用いて,現実のデータセットを用いてモデルを評価した。
論文 参考訳(メタデータ) (2024-03-10T12:50:35Z) - Waymax: An Accelerated, Data-Driven Simulator for Large-Scale Autonomous
Driving Research [76.93956925360638]
Waymaxは、マルチエージェントシーンにおける自動運転のための新しいデータ駆動シミュレータである。
TPU/GPUなどのハードウェアアクセラレータで完全に動作し、トレーニング用のグラフ内シミュレーションをサポートする。
我々は、一般的な模倣と強化学習アルゴリズムのスイートをベンチマークし、異なる設計決定に関するアブレーション研究を行った。
論文 参考訳(メタデータ) (2023-10-12T20:49:15Z) - DTC: Deep Tracking Control [16.2850135844455]
本研究では,両世界の強靭性,フット配置精度,地形の一般化を両世界の利点と組み合わせたハイブリッド制御アーキテクチャを提案する。
深層ニューラルネットワークポリシは、最適化された足場を追跡することを目的として、シミュレーションでトレーニングされている。
モデルベースに比べて滑りやすい地盤や変形可能な地盤が存在する場合の強靭性を示す。
論文 参考訳(メタデータ) (2023-09-27T07:57:37Z) - Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based
Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。
我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。
時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文 参考訳(メタデータ) (2022-07-17T07:05:39Z) - Basket-based Softmax [12.744577044692276]
我々は,バスケットベースソフトマックス(BBS)と呼ばれる新しい採鉱訓練戦略を提案する。
各トレーニングサンプルに対して、他のデータセットから負のクラスをマイニングする手がかりとして、類似度スコアを同時に採用する。
実世界とシミュレーションされたデータセットを用いて、顔認識と再識別のタスクにおけるBBSの効率性と優位性を実証する。
論文 参考訳(メタデータ) (2022-01-23T16:43:29Z) - Towards Optimal Strategies for Training Self-Driving Perception Models
in Simulation [98.51313127382937]
合成ドメインのみにおけるラベルの使用に焦点を当てる。
提案手法では,ニューラル不変表現の学習方法と,シミュレータからデータをサンプリングする方法に関する理論的にインスピレーションを得た視点を導入する。
マルチセンサーデータを用いた鳥眼視車両分割作業におけるアプローチについて紹介する。
論文 参考訳(メタデータ) (2021-11-15T18:37:43Z) - Multitask Adaptation by Retrospective Exploration with Learned World
Models [77.34726150561087]
本稿では,タスク非依存ストレージから取得したMBRLエージェントのトレーニングサンプルを提供するRAMaというメタ学習型アドレッシングモデルを提案する。
このモデルは、期待されるエージェントのパフォーマンスを最大化するために、ストレージから事前のタスクを解く有望な軌道を選択することで訓練される。
論文 参考訳(メタデータ) (2021-10-25T20:02:57Z) - SVIRO: Synthetic Vehicle Interior Rear Seat Occupancy Dataset and
Benchmark [11.101588888002045]
SVIROは10台の異なる車両の旅客室におけるシーンの合成データセットである。
限られたバリエーションに基づいて学習した際の一般化能力と信頼性について、機械学習に基づくアプローチを解析する。
論文 参考訳(メタデータ) (2020-01-10T14:44:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。