Fugu-MT 論文翻訳(概要): Human-Humanoid Robots Cross-Embodiment Behavior-Skill Transfer Using Decomposed Adversarial Learning from Demonstration

論文の概要: Human-Humanoid Robots Cross-Embodiment Behavior-Skill Transfer Using Decomposed Adversarial Learning from Demonstration

arxiv url: http://arxiv.org/abs/2412.15166v1
Date: Thu, 19 Dec 2024 18:41:45 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-20 18:44:16.255898
Title: Human-Humanoid Robots Cross-Embodiment Behavior-Skill Transfer Using Decomposed Adversarial Learning from Demonstration
Title（参考訳）: ヒト・ヒューマノイドロボットのクロス・エボディメント・行動-デモテーションからの逆転学習を用いたスキル伝達
Authors: Junjia Liu, Zhuo Li, Minghao Yu, Zhipeng Dong, Sylvain Calinon, Darwin Caldwell, Fei Chen,
Abstract要約: 本稿では,デジタル人間モデルを共通プロトタイプとして使用することにより,データのボトルネックを低減するための転送可能なフレームワークを提案する。このモデルは、人間による実演から、敵対的な模倣を通して行動プリミティブを学習し、複雑なロボット構造を機能的な構成要素に分解する。本フレームワークは,多種多様な構成のヒューマノイドロボット5体を用いて検証した。
参考スコア（独自算出の注目度）: 9.42179962375058
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Humanoid robots are envisioned as embodied intelligent agents capable of performing a wide range of human-level loco-manipulation tasks, particularly in scenarios requiring strenuous and repetitive labor. However, learning these skills is challenging due to the high degrees of freedom of humanoid robots, and collecting sufficient training data for humanoid is a laborious process. Given the rapid introduction of new humanoid platforms, a cross-embodiment framework that allows generalizable skill transfer is becoming increasingly critical. To address this, we propose a transferable framework that reduces the data bottleneck by using a unified digital human model as a common prototype and bypassing the need for re-training on every new robot platform. The model learns behavior primitives from human demonstrations through adversarial imitation, and the complex robot structures are decomposed into functional components, each trained independently and dynamically coordinated. Task generalization is achieved through a human-object interaction graph, and skills are transferred to different robots via embodiment-specific kinematic motion retargeting and dynamic fine-tuning. Our framework is validated on five humanoid robots with diverse configurations, demonstrating stable loco-manipulation and highlighting its effectiveness in reducing data requirements and increasing the efficiency of skill transfer across platforms.
Abstract（参考訳）: ヒューマノイドロボットは、広範囲の人間レベルのロコ操作タスク、特に厳格かつ反復的な労働を必要とするシナリオを実行することができる、体現された知的エージェントとして想定されている。しかし、ヒューマノイドロボットの高度な自由度のため、これらのスキルの習得は困難であり、ヒューマノイドのための十分なトレーニングデータを集めることは、手間のかかるプロセスである。新しいヒューマノイドプラットフォームが急速に導入されるにつれ、汎用的なスキル伝達を可能にするクロス・エボディメント・フレームワークがますます重要になっている。そこで本研究では,デジタル人間モデルを共通プロトタイプとして使用し,新たなロボットプラットフォーム上での再トレーニングの必要性を回避し,データのボトルネックを軽減するためのトランスファー可能なフレームワークを提案する。モデルは、人間による擬態を通して行動プリミティブを学習し、複雑なロボット構造は機能的な構成要素に分解され、それぞれ独立して訓練され、動的に調整される。タスクの一般化は、人間と物体の相互作用グラフを通じて達成され、エンボディメント固有のキネマティック・モーション・リターゲティングと動的微調整によって、異なるロボットにスキルが伝達される。本フレームワークは, 多様な構成のヒューマノイドロボット5体を用いて, 安定したロコ操作を実証し, データ要求の低減とプラットフォーム間のスキル伝達効率の向上に有効性を強調した。

関連論文リスト

H-RDT: Human Manipulation Enhanced Bimanual Robotic Manipulation [27.585828712261232]
H-RDT(Human to Robotics Diffusion Transformer)は、人間の操作データを利用してロボット操作能力を向上する新しいアプローチである。私たちの重要な洞察は、大規模なエゴセントリックな人間操作ビデオとペアの3Dハンドポーズアノテーションが、自然な操作戦略を捉えたリッチな行動優先を提供するということです。本研究では,(1)大規模な人間操作データに対する事前トレーニング,(2)モジュール型アクションエンコーダとデコーダを用いたロボット固有のデータに対するクロスエボディメント微調整という2段階の訓練パラダイムを導入する。
論文参考訳（メタデータ） (2025-07-31T13:06:59Z)
Towards Human-level Intelligence via Human-like Whole-Body Manipulation [10.199110135230674]
Astribot Suiteは、多様な環境にまたがる日常的なタスクを対象とする、全身操作のためのロボット学習スイートである。以上の結果から,Astribotのエボディメント,遠隔操作インターフェース,学習パイプラインの統合は,実世界の汎用的な全身ロボット操作への重要な一歩であることが示唆された。
論文参考訳（メタデータ） (2025-07-23T02:23:41Z)
OminiAdapt: Learning Cross-Task Invariance for Robust and Environment-Aware Robotic Manipulation [1.4719692998274154]
本稿では,ヒューマノイドロボットに適した模倣学習アルゴリズムを提案する。主な課題に焦点をあてて,提案アルゴリズムは環境障害を抑制する。実験の結果,提案手法は様々なタスクシナリオに対して頑健さとスケーラビリティを示すことがわかった。
論文参考訳（メタデータ） (2025-03-27T08:28:22Z)
Human-Agent Joint Learning for Efficient Robot Manipulation Skill Acquisition [48.65867987106428]
本稿では,人間とロボットの協調学習システムについて紹介する。これにより、ロボットエンドエフェクターの制御を学習支援エージェントと共有することができる。これにより、ダウンストリームタスクにおいて、収集されたデータが十分な品質であることを保証しながら、人間の適応の必要性を減らすことができる。
論文参考訳（メタデータ） (2024-06-29T03:37:29Z)
Mitigating the Human-Robot Domain Discrepancy in Visual Pre-training for Robotic Manipulation [16.809190349155525]
そこで本研究では,容易に利用可能な人間ロボットのビデオデータを利用して,ドメインギャップを埋める新しい適応パラダイムを提案する。提案手法では,人間とロボットのビデオのセマンティクスを整列させるために,人間ロボットのアライメント損失を用いて,事前学習したモデルをパラメータ効率よくロボット領域に適応させる。
論文参考訳（メタデータ） (2024-06-20T11:57:46Z)
HumanoidBench: Simulated Humanoid Benchmark for Whole-Body Locomotion and Manipulation [50.616995671367704]
そこで本研究では,人型ロボットが器用な手を備えた,高次元シミュレーション型ロボット学習ベンチマークHumanoidBenchを提案する。その結果,現在最先端の強化学習アルゴリズムがほとんどのタスクに支障をきたすのに対して,階層的学習アプローチはロバストな低レベルポリシーに支えられた場合,優れた性能を達成できることがわかった。
論文参考訳（メタデータ） (2024-03-15T17:45:44Z)
RoboGen: Towards Unleashing Infinite Data for Automated Robot Learning via Generative Simulation [68.70755196744533]
RoboGenはジェネレーティブなロボットエージェントで、ジェネレーティブなシミュレーションを通じて、さまざまなロボットのスキルを自動的に学習する。我々の研究は、大規模モデルに埋め込まれた広範囲で多目的な知識を抽出し、それらをロボット工学の分野に移す試みである。
論文参考訳（メタデータ） (2023-11-02T17:59:21Z)
RoboCat: A Self-Improving Generalist Agent for Robotic Manipulation [33.10577695383743]
ロボット操作のためのマルチタスク汎用エージェントRoboCatを提案する。このデータは、シミュレートされた本物のロボットアームから、さまざまな観察とアクションのセットでモーターコントロールスキルの大規模なレパートリーにまたがる。 RoboCatでは、ゼロショットだけでなく、100-1000例のみを用いて適応することで、新しいタスクやロボットに一般化する能力を実証する。
論文参考訳（メタデータ） (2023-06-20T17:35:20Z)
Learning a Universal Human Prior for Dexterous Manipulation from Human Preference [35.54663426598218]
本稿では,ビデオ上での人間の嗜好を直接フィードバックすることで,人類の普遍性を学習するフレームワークを提案する。多様な警察を反復的に生成し、軌道上の人間の嗜好を収集することにより、タスクに依存しない報酬モデルを訓練する。提案手法は,ロボットの手の動作を,目に見えないタスクを含む多様なタスクで実証的に示す。
論文参考訳（メタデータ） (2023-04-10T14:17:33Z)
HERD: Continuous Human-to-Robot Evolution for Learning from Human Demonstration [57.045140028275036]
本研究では,マイクロ進化的強化学習を用いて,操作スキルを人間からロボットに伝達可能であることを示す。本稿では,ロボットの進化経路とポリシーを協調的に最適化する多次元進化経路探索アルゴリズムを提案する。
論文参考訳（メタデータ） (2022-12-08T15:56:13Z)
Learning Reward Functions for Robotic Manipulation by Observing Humans [92.30657414416527]
我々は、ロボット操作ポリシーのタスク非依存報酬関数を学習するために、幅広い操作タスクを解く人間のラベル付きビデオを使用する。学習された報酬は、タイムコントラストの目的を用いて学習した埋め込み空間におけるゴールまでの距離に基づいている。
論文参考訳（メタデータ） (2022-11-16T16:26:48Z)
Learning Bipedal Robot Locomotion from Human Movement [0.791553652441325]
本研究では、実世界の二足歩行ロボットに、モーションキャプチャーデータから直接の動きを教えるための強化学習に基づく手法を提案する。本手法は,シミュレーション環境下でのトレーニングから,物理ロボット上での実行へシームレスに移行する。本研究では,ダイナミックウォークサイクルから複雑なバランスや手振りに至るまでの動作を内製したヒューマノイドロボットについて実演する。
論文参考訳（メタデータ） (2021-05-26T00:49:37Z)
Learning Predictive Models From Observation and Interaction [137.77887825854768]
世界との相互作用から予測モデルを学ぶことで、ロボットのようなエージェントが世界がどのように働くかを学ぶことができる。しかし、複雑なスキルのダイナミクスを捉えるモデルを学ぶことは大きな課題である。本研究では,人間などの他のエージェントの観察データを用いて,トレーニングセットを増強する手法を提案する。
論文参考訳（メタデータ） (2019-12-30T01:10:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。