論文の概要: ReActor: Reinforcement Learning for Physics-Aware Motion Retargeting
- arxiv url: http://arxiv.org/abs/2605.06593v1
- Date: Thu, 07 May 2026 17:20:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:12.030247
- Title: ReActor: Reinforcement Learning for Physics-Aware Motion Retargeting
- Title(参考訳): ReActor:物理対応モーションリターゲティングのための強化学習
- Authors: David Müller, Agon Serifi, Sammy Christen, Ruben Grandia, Espen Knoop, Moritz Bächer,
- Abstract要約: 本稿では,参照動作をロボットの形態に適応させる二段階最適化フレームワークを提案する。
物理シミュレーションと直接統合することにより、ロバストな模倣学習を容易にする物理的に妥当な運動を生成する。
- 参考スコア(独自算出の注目度): 8.302518310051232
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Retargeting human kinematic reference motion onto a robot's morphology remains a formidable challenge. Existing methods often produce physical inconsistencies, such as foot sliding, self-collisions, or dynamically infeasible motions, which hinder downstream imitation learning. We propose a bilevel optimization framework that jointly adapts reference motions to a robot's morphology while training a tracking policy using reinforcement learning. To make the optimization tractable, we derive an approximate gradient for the upper-level loss. Our framework requires only a sparse set of semantic rigid-body correspondences and eliminates the need for manual tuning by identifying optimal values for a parameterization expressive enough to preserve characteristic motion across different embodiments. Moreover, by integrating retargeting directly with physics simulation, we produce physically plausible motions that facilitate robust imitation learning. We validate our method in simulation and on hardware, demonstrating challenging motions for morphologies that differ significantly from a human, including retargeting onto a quadruped.
- Abstract(参考訳): 人間のキネマティック・レファレンス・モーションをロボットのモルフォロジーに再ターゲティングすることは、まだまだ難しい課題だ。
既存の手法では、足の滑りや自己衝突、ダイナミックな不可能な動きといった物理的な矛盾が生じ、下流での模倣学習を妨げている。
本稿では,強化学習を用いたトラッキングポリシを訓練しながら,参照動作をロボットの形状に共同で適応する二段階最適化フレームワークを提案する。
最適化をトラクタブルにするために、上層損失の近似勾配を導出する。
本フレームワークでは, セマンティックな剛体対応のスパースセットしか必要とせず, 異なる実施形態をまたいだ特性運動を維持するのに十分なパラメータ化表現の最適値を特定することで手動のチューニングを不要にしている。
さらに,リターゲティングと物理シミュレーションを直接統合することにより,ロバストな模倣学習を容易にする物理的に妥当な運動を生成する。
我々は,本手法をシミュレーションおよびハードウェア上で検証し,四重組への再ターゲティングを含む人間とは大きく異なる形態の挑戦的な動きを示す。
関連論文リスト
- MeshMimic: Geometry-Aware Humanoid Motion Learning through 3D Scene Reconstruction [54.36564144414704]
MeshMimicは、3Dシーンの再構築とインテリジェンスを組み込んだ革新的なフレームワークで、ヒューマノイドロボットがビデオから直接「モーション・テライン」インタラクションを学習できるようにする。
現状の3次元視覚モデルを活用することで、我々のフレームワークは、人間の軌跡と基礎となる地形や物体の3次元幾何学の両方を正確にセグメント化し再構築する。
論文 参考訳(メタデータ) (2026-02-17T17:09:45Z) - AdaMorph: Unified Motion Retargeting via Embodiment-Aware Adaptive Transformers [49.796014934503184]
本研究では、単一モデルで多様なロボット形態に人間の動きを適応させることができる統一型ニューラルネットワークフレームワークを提案する。
12個の異なるヒューマノイドロボットの実験結果から、AdaMorphが異種トポロジにわたって効果的に制御できることが示されている。
論文 参考訳(メタデータ) (2026-01-12T07:39:38Z) - Towards Adaptable Humanoid Control via Adaptive Motion Tracking [40.862885805966464]
単一の参照動作から適応的な制御を可能にする新しいモーショントラッキングであるAdaMimicを紹介する。
シミュレーションと実世界のUnitree G1ヒューマノイドロボットにおけるアプローチにおけるこれらの重要な改善の有効性を検証する。
論文 参考訳(メタデータ) (2025-10-16T08:54:53Z) - KungfuBot: Physics-Based Humanoid Whole-Body Control for Learning Highly-Dynamic Skills [58.73043119128804]
そこで本研究では,Kungfuやダンスなどの人体動作を高度に制御することを目的とした,物理学に基づくヒューマノイド制御フレームワークを提案する。
動作処理では,運動の抽出,フィルタリング,修正,再ターゲティングを行うパイプラインを設計し,物理的制約の遵守を確実にする。
動作模倣では、二段階最適化問題を定式化し、追従精度の許容度を動的に調整する。
実験では,高ダイナミックな動作のセットを模倣するために全身制御ポリシーを訓練する。
論文 参考訳(メタデータ) (2025-06-15T13:58:53Z) - Phoenix: A Motion-based Self-Reflection Framework for Fine-grained Robotic Action Correction [10.38090975412416]
ロボットが障害から回復するためには、一般化可能な自己補正システムの構築が不可欠である。
我々は,高レベルな意味的反射と低レベルなロボット動作補正を接続するブリッジとして動作指示を利用するPhoenixフレームワークを構築した。
RoboMimicシミュレーションと実世界のシナリオの両方で実施された実験は、我々のフレームワークのより優れた一般化とロバスト性を証明する。
論文 参考訳(メタデータ) (2025-04-20T12:30:43Z) - Spatial-Temporal Graph Diffusion Policy with Kinematic Modeling for Bimanual Robotic Manipulation [88.83749146867665]
既存のアプローチは、遠く離れた次のベストなエンドエフェクタのポーズを予測するポリシーを学びます。
すると、運動に対する対応する関節回転角を逆運動学を用いて計算する。
本稿では,Kinematics 拡張空間テンポアル gRaph diffuser を提案する。
論文 参考訳(メタデータ) (2025-03-13T17:48:35Z) - A Plug-and-Play Physical Motion Restoration Approach for In-the-Wild High-Difficulty Motions [56.709280823844374]
動作コンテキストとビデオマスクを利用して、欠陥のある動作を修復するマスクベースの動作補正モジュール(MCM)を導入する。
また,運動模倣のための事前訓練および適応手法を用いた物理ベースの運動伝達モジュール (PTM) を提案する。
本手法は,高速な移動を含む映像モーションキャプチャ結果を物理的に洗練するためのプラグイン・アンド・プレイモジュールとして設計されている。
論文 参考訳(メタデータ) (2024-12-23T08:26:00Z) - I-CTRL: Imitation to Control Humanoid Robots Through Constrained Reinforcement Learning [8.97654258232601]
有界残留強化学習(I-CTRL)によるヒューマノイドロボットの制御フレームワークの開発
I-CTRLは5つのロボットにまたがるシンプルでユニークな報酬で、動きの模倣に優れています。
本フレームワークでは,大規模動作データセットを管理するための自動優先度スケジューラを導入している。
論文 参考訳(メタデータ) (2024-05-14T16:12:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。