論文の概要: DreamControl-v2: Simpler and Scalable Autonomous Humanoid Skills via Trainable Guided Diffusion Priors
- arxiv url: http://arxiv.org/abs/2604.00202v1
- Date: Tue, 31 Mar 2026 20:11:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-02 16:44:31.706398
- Title: DreamControl-v2: Simpler and Scalable Autonomous Humanoid Skills via Trainable Guided Diffusion Priors
- Title(参考訳): DreamControl-v2: トレーニング可能なガイド付き拡散プリミティブによる、よりシンプルでスケーラブルな自律型ヒューマノイドスキル
- Authors: Sudarshan Harithas, Sangkyung Kwak, Pushkal Katara, Srujan Deolasee, Dvij Kalaria, Srinath Sridhar, Sai Vemprala, Ashish Kapoor, Jonathan Chung-Kuan Huang,
- Abstract要約: 本研究では,ヒューマノイドロボットの運動空間に直接誘導拡散モデルを訓練する改良されたフレームワークを提案する。
我々のアプローチは、より大きなトレーニングデータ混在のために、幅広いスキルを捉えていることを実証しています。
下流のロバストなRLポリシーを実現するためには,参照トラジェクトリの生成が重要であることを示す。
- 参考スコア(独自算出の注目度): 20.558671221723422
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Developing robust autonomous loco-manipulation skills for humanoids remains an open problem in robotics. While RL has been applied successfully to legged locomotion, applying it to complex, interaction-rich manipulation tasks is harder given long-horizon planning challenges for manipulation. A recent approach along these lines is DreamControl, which addresses these issues by leveraging off-the-shelf human motion diffusion models as a generative prior to guide RL policies during training. In this paper, we investigate the impact of DreamControl's motion prior and propose an improved framework that trains a guided diffusion model directly in the humanoid robot's motion space, aggregating diverse human and robot datasets into a unified embodiment space. We demonstrate that our approach captures a wider range of skills due to the larger training data mixture and establishes a more automated pipeline by removing the need for manual filtering interventions. Furthermore, we show that scaling the generation of reference trajectories is important for achieving robust downstream RL policies. We validate our approach through extensive experiments in simulation and on a real Unitree-G1.
- Abstract(参考訳): ヒューマノイドのための堅牢な自律的ロコ操作技術を開発することは、ロボット工学において未解決の問題である。
RLは足の移動にうまく適用されているが、操作のための長期計画課題を考えると、複雑な相互作用に富んだ操作タスクに適用することは困難である。
これらの線に沿った最近のアプローチであるDreamControlは、トレーニング中のRLポリシーを導くための生成として、市販の人間の動き拡散モデルを活用することで、これらの問題に対処する。
本稿では,DreamControlの動作の影響を調査し,ヒューマノイドロボットの運動空間に直接誘導拡散モデルを訓練し,多様な人やロボットのデータセットを統一的なエンボディメント空間に集約するフレームワークを提案する。
当社のアプローチでは、トレーニングデータの組み合わせが大きいため、幅広いスキルを捉え、手動フィルタリングの介入を不要にすることで、より自動化されたパイプラインを確立することを実証しています。
さらに,ロバストな下流RLポリシーを実現するためには,参照軌道の生成が重要であることを示す。
シミュレーションおよび実Unitree-G1上での広範囲な実験により,本手法の有効性を検証した。
関連論文リスト
- ZeroWBC: Learning Natural Visuomotor Humanoid Control Directly from Human Egocentric Video [52.78703020909145]
我々は、人間中心のビデオから直接、自然なヒューマノイドビジュモータ制御ポリシーを学ぶ新しいフレームワークであるZeroWBCを紹介した。
提案手法はまず視覚言語モデル(VLM)を微調整し,テキスト命令とエゴセントリックな視覚コンテキストに基づく将来の身体全体の動作を予測する。
ユニツリーG1ヒューマノイドロボットの実験では,動作の自然性と汎用性において,本手法がベースラインアプローチより優れていることが示された。
論文 参考訳(メタデータ) (2026-03-10T04:19:43Z) - EgoHumanoid: Unlocking In-the-Wild Loco-Manipulation with Robot-Free Egocentric Demonstration [67.13034606664333]
EgoHumanoidは、エゴセントリックな人間のデモを使って視覚言語アクションポリシーを共同訓練する最初のフレームワークである。
スケーラブルな人的データ収集のためのポータブルシステムを開発した。
論文 参考訳(メタデータ) (2026-02-10T18:59:03Z) - DreamControl: Human-Inspired Whole-Body Humanoid Control for Scene Interaction via Guided Diffusion [21.619868038556987]
本稿では,自律型全身ヒューマノイドスキルの学習手法であるDreamControlを紹介する。
我々の中心となるイノベーションは、人間の動きデータに基づいて事前訓練された拡散を使うことです。
本研究では,Unitree G1ロボットにおけるDreamControlの有効性を検証する。
論文 参考訳(メタデータ) (2025-09-17T18:35:43Z) - Dexplore: Scalable Neural Control for Dexterous Manipulation from Reference-Scoped Exploration [58.4036440289082]
ハンドオブジェクトモーションキャプチャ(MoCap)は、大規模でコンタクトに富んだデモと、器用なロボットスコープの約束を提供する。
Dexploreは、リポジトリとトラッキングを実行し、MoCapから直接ロボット制御ポリシーを学習する、統一された単一ループ最適化である。
論文 参考訳(メタデータ) (2025-09-11T17:59:07Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Learning Bipedal Walking for Humanoids with Current Feedback [5.429166905724048]
アクチュエータレベルでの不正確なトルクトラッキングから生じるヒューマノイドロボットのシム2リアルギャップ問題を克服するためのアプローチを提案する。
提案手法は、実際のHRP-5Pヒューマノイドロボットに展開して二足歩行を実現するシミュレーションにおいて、一貫したエンドツーエンドのポリシーをトレーニングする。
論文 参考訳(メタデータ) (2023-03-07T08:16:46Z) - Model Predictive Control for Fluid Human-to-Robot Handovers [50.72520769938633]
人間の快適さを考慮に入れた計画運動は、人間ロボットのハンドオーバプロセスの一部ではない。
本稿では,効率的なモデル予測制御フレームワークを用いてスムーズな動きを生成することを提案する。
ユーザ数名の多様なオブジェクトに対して,人間とロボットのハンドオーバ実験を行う。
論文 参考訳(メタデータ) (2022-03-31T23:08:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。