論文の概要: The Role of Domain Randomization in Training Diffusion Policies for Whole-Body Humanoid Control
- arxiv url: http://arxiv.org/abs/2411.01349v1
- Date: Sat, 02 Nov 2024 19:33:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-05 21:27:38.721587
- Title: The Role of Domain Randomization in Training Diffusion Policies for Whole-Body Humanoid Control
- Title(参考訳): 全体ヒューマノイドの訓練拡散政策におけるドメインランダム化の役割
- Authors: Oleg Kaidanov, Firas Al-Hafez, Yusuf Suvari, Boris Belousov, Jan Peters,
- Abstract要約: Policies Diffusion (DPs)は、ロボット操作の驚くべき結果を示している。
本稿では,人体全体制御のためのDPの性能に及ぼすデータセットの多様性とサイズの影響について検討する。
- 参考スコア(独自算出の注目度): 14.36344580057985
- License:
- Abstract: Humanoids have the potential to be the ideal embodiment in environments designed for humans. Thanks to the structural similarity to the human body, they benefit from rich sources of demonstration data, e.g., collected via teleoperation, motion capture, or even using videos of humans performing tasks. However, distilling a policy from demonstrations is still a challenging problem. While Diffusion Policies (DPs) have shown impressive results in robotic manipulation, their applicability to locomotion and humanoid control remains underexplored. In this paper, we investigate how dataset diversity and size affect the performance of DPs for humanoid whole-body control. In a simulated IsaacGym environment, we generate synthetic demonstrations by training Adversarial Motion Prior (AMP) agents under various Domain Randomization (DR) conditions, and we compare DPs fitted to datasets of different size and diversity. Our findings show that, although DPs can achieve stable walking behavior, successful training of locomotion policies requires significantly larger and more diverse datasets compared to manipulation tasks, even in simple scenarios.
- Abstract(参考訳): ヒューマノイドは、人間のために設計された環境において理想的な実施形態となる可能性がある。
人体と構造的類似性のおかげで、遠隔操作、モーションキャプチャー、さらにはタスクを実行する人間のビデオを使って収集された、リッチなデモデータソースの恩恵を受けることができる。
しかし、デモからポリシーを抽出することは依然として難しい問題である。
Diffusion Policies (DPs) はロボット操作において顕著な成果を上げているが、ロコモーションやヒューマノイド制御への適用性はまだ未熟だ。
本稿では,データセットの多様性とサイズがヒューマノイド全身制御におけるDPの性能に与える影響について検討する。
模擬IsasaGym環境では,種々のドメインランダム化(DR)条件下でのAMPエージェントの訓練により合成デモを生成し,異なるサイズと多様性のデータセットに適合するDPを比較した。
以上の結果から,DPは歩行行動の安定を達成できるが,ロコモーションポリシーのトレーニング成功には,単純なシナリオであっても操作タスクよりもはるかに大きく,多様なデータセットが必要であることが示唆された。
関連論文リスト
- DivDiff: A Conditional Diffusion Model for Diverse Human Motion Prediction [9.447439259813112]
本研究では,より多様で現実的な人間の動きを予測するために,DivDiffと呼ばれる条件拡散に基づく生成モデルを提案する。
具体的には、DivDiffはDDPMをバックボーンとして使用し、離散コサイン変換(DCT)とトランスフォーマー機構を組み込んでいます。
本研究では,人体運動に対する人間の骨格制約を強制するために,多種多様な強化サンプリング機能 (DRSF) を設計する。
論文 参考訳(メタデータ) (2024-08-16T04:51:32Z) - Movement Primitive Diffusion: Learning Gentle Robotic Manipulation of Deformable Objects [14.446751610174868]
運動原始拡散(英: Movement Primitive Diffusion、MPD)は、ロボット支援手術における模倣学習(IL)の新しい手法である。
MPDは拡散型模倣学習(DIL)の汎用性と確率的動特性プリミティブ(ProDMP)の高品質な運動生成能力を組み合わせる
実世界および実世界の様々なロボット作業におけるMPDの評価を,状態観察と画像観察の両方で行う。
論文 参考訳(メタデータ) (2023-12-15T18:24:28Z) - H-GAP: Humanoid Control with a Generalist Planner [45.50995825122686]
ヒューマノイド一般自動符号化プランナー(Humanoid Generalist Autoencoding Planner、H-GAP)は、人間のモーションキャプチャーデータから派生したヒューマノイド軌道に基づいて訓練された生成モデルである。
56自由度ヒューマノイドでは、H-GAPが幅広い運動行動の表現と生成を学習していることが実証的に証明されている。
また,H-GAPのスケーリング特性に関する実証的研究を行い,データの追加による性能向上の可能性を示した。
論文 参考訳(メタデータ) (2023-12-05T11:40:24Z) - Robust Visual Sim-to-Real Transfer for Robotic Manipulation [79.66851068682779]
シミュレーションにおけるビジュモータポリシーの学習は、現実世界よりも安全で安価である。
しかし、シミュレーションデータと実データとの相違により、シミュレータ訓練されたポリシーは実際のロボットに転送されると失敗することが多い。
視覚的なsim-to-real領域ギャップを埋める一般的なアプローチは、ドメインランダム化(DR)である。
論文 参考訳(メタデータ) (2023-07-28T05:47:24Z) - Executing your Commands via Motion Diffusion in Latent Space [51.64652463205012]
本研究では,動作遅延に基づく拡散モデル(MLD)を提案し,条件付き入力に対応する鮮明な動き列を生成する。
我々のMDDは、広範囲な人体運動生成タスクにおいて、最先端の手法よりも大幅に改善されている。
論文 参考訳(メタデータ) (2022-12-08T03:07:00Z) - DeXtreme: Transfer of Agile In-hand Manipulation from Simulation to
Reality [64.51295032956118]
我々は人型ロボットの手で頑健な操作を行える政策を訓練する。
本研究は,各種ハードウェアおよびシミュレータのデクスタラス操作におけるsim-to-real転送の可能性を再確認する。
論文 参考訳(メタデータ) (2022-10-25T01:51:36Z) - DexTransfer: Real World Multi-fingered Dexterous Grasping with Minimal
Human Demonstrations [51.87067543670535]
本研究では,少数の人間によるデモンストレーションを行い,見えない物体のポーズを学習するロボット学習システムを提案する。
我々は,物体の点群を入力として捉え,物体を異なる初期ロボット状態から把握するための連続的な動作を予測する,厳密な把握ポリシーを訓練する。
我々のデータセットから学んだポリシーは、シミュレーションと現実世界の両方で見えないオブジェクトのポーズをうまく一般化することができる。
論文 参考訳(メタデータ) (2022-09-28T17:51:49Z) - Learning Latent Traits for Simulated Cooperative Driving Tasks [10.009803620912777]
我々は,人間の行動や嗜好の観点から,人間のコンパクトな潜在表現を捉えることのできるフレームワークを構築した。
そして、注意を散らす運転行動の1形態をモデル化するための軽量なシミュレーション環境、HMIway-envを構築します。
最終的にこの環境を利用して、ドライバを識別する能力と介入ポリシーの有効性の両方を定量化します。
論文 参考訳(メタデータ) (2022-07-20T02:27:18Z) - Multi-Domain Joint Training for Person Re-Identification [51.73921349603597]
ReID(Deep Learning-based person Re-IDentification)は、優れたパフォーマンスを達成するために、大量のトレーニングデータを必要とすることが多い。
多様な環境からより多くのトレーニングデータを集めることで、ReIDのパフォーマンスが向上する傾向にある。
本稿では,パラメータを様々な要因に適応させることができる,Domain-Camera-Sample Dynamic Network (DCSD) というアプローチを提案する。
論文 参考訳(メタデータ) (2022-01-06T09:20:59Z) - TrafficSim: Learning to Simulate Realistic Multi-Agent Behaviors [74.67698916175614]
リアル交通シミュレーションのためのマルチエージェント行動モデルであるTrafficSimを提案する。
特に、暗黙の潜在変数モデルを利用して、共同アクターポリシーをパラメータ化する。
TrafficSimは、多様なベースラインと比較して、より現実的で多様なトラフィックシナリオを生成します。
論文 参考訳(メタデータ) (2021-01-17T00:29:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。