論文の概要: Dynamic Full-body Motion Agent with Object Interaction via Blending Pre-trained Modular Controllers
- arxiv url: http://arxiv.org/abs/2605.11369v1
- Date: Tue, 12 May 2026 00:43:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.49874
- Title: Dynamic Full-body Motion Agent with Object Interaction via Blending Pre-trained Modular Controllers
- Title(参考訳): 曲げ事前学習型モジュール制御器による物体間相互作用を考慮した動的フルボディモーションエージェント
- Authors: Sanghyeok Nam, Byoungjun Kim, Daehyung Park, Tae-Kyun Kim,
- Abstract要約: 本稿では,テーブルを握りながら実行するなど,動的かつ長期にわたるインタラクション動作を実現するフレームワークを提案する。
計画段階では、事前訓練されたヒトの運動拡散モデルからオブジェクトの軌跡生成に先立って、HOIデータセットを動的に拡張する。
実行段階では、作曲家ネットワークは、動的な人間の動きや静的なHOIの動きに対して、事前訓練された模倣エージェントの動作をブレンドする。
- 参考スコア(独自算出の注目度): 15.38608426576124
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generating physically plausible dynamic motions of human-object interaction (HOI) remains challenging, mainly due to existing HOI datasets limited to static interactions, and pretrained agents capable of either dynamic full-body motions without objects or static HOI motions. Recent works such as InsActor and CLoSD generate HOI motions in planning and execution stages, are yet limited to either static or short-term contacts e.g. striking. In this work, we propose a framework that fulfills dynamic and long-term interaction motions such as running while holding a table, by combining pretrained motion priors and imitation agents in planning and execution stages. In the planning stage, we augment HOI datasets with dynamic priors from a pretrained human motion diffusion model, followed by object trajectory generation. This plans dynamic HOI sequences. In the execution stage, a composer network blends actions of pretrained imitation agents specialized either for dynamic human motions or static HOI motions, enabling spatio-temporal composition of their complementary skills. Our method over relevant prior-arts consistently improves success rates while maintaining interaction for dynamic HOI tasks. Furthermore, blending pretrained experts with our composer achieves competitive performance in significantly reduced training time. Ablation studies validate the effectiveness of our augmentation and composer blending.
- Abstract(参考訳): 人-物体相互作用(HOI)の物理的に可塑性な動的運動の生成は、主に静的相互作用に制限された既存のHOIデータセットと、物体のないフルボディ運動または静的HOI運動のいずれもが可能な事前訓練されたエージェントにより、依然として困難である。
InsActorやCLoSDといった最近の研究は計画や実行段階でHOIの動作を生成するが、それでも静的または短期的な接触(例えば、pitch)に限られている。
本研究では,計画・実行段階において,事前学習した動作前処理と模倣エージェントを組み合わせることで,テーブルの保持中に動作するなどの動的・長期的インタラクション動作を実現するフレームワークを提案する。
計画段階では、事前訓練されたヒトの運動拡散モデルからHOIデータセットを動的に拡張し、続いて物体軌道生成を行う。
これは動的HOIシーケンスを計画する。
実行段階において、作曲家ネットワークは、動的ヒトの動きまたは静的HOI動作に特化した事前訓練された模倣剤の作用をブレンドし、相補的スキルの時空間合成を可能にする。
本手法は,動的HOIタスクのインタラクションを維持しながら,成功率を常に向上させる。
さらに,事前訓練を受けた専門家と作曲家を混在させることで,トレーニング時間の大幅な短縮が達成される。
アブレーション研究は、我々の増補と作曲家のブレンディングの有効性を検証する。
関連論文リスト
- A Kung Fu Athlete Bot That Can Do It All Day: Highly Dynamic, Balance-Challenging Motion Dataset and Autonomous Fall-Resilient Tracking [5.968082051565195]
武道の特徴は、急激な中心シフト、複雑な調整、急激な姿勢転換である。
KungFuAthleteは、プロアスリートの日々のトレーニングビデオから派生した、ハイダイナミックな武道運動データセットである。
本研究では,高ダイナミックなモーショントラッキングとフォールリカバリを共同で学習できる新しいトレーニングパラダイムを提案する。
論文 参考訳(メタデータ) (2026-02-14T07:49:56Z) - HAIC: Humanoid Agile Object Interaction Control via Dynamics-Aware World Model [56.4392302336014]
本稿では,外部状態推定を伴わない多種多様なオブジェクトダイナミクス間のロバストな相互作用のためのフレームワークであるHAICを提案する。
我々の重要な貢献は、主観的歴史のみから高次対象状態(速度、加速度)を推定するダイナミクス予測器である。
ヒューマノイドロボットの実験では、HAICはアジャイルタスクで高い成功率を達成する。
論文 参考訳(メタデータ) (2026-02-12T09:34:35Z) - InterPrior: Scaling Generative Control for Physics-Based Human-Object Interactions [58.329946838699044]
人間は、明示的な全身運動のレベルで、物体と全身の相互作用を計画することは滅多にない。
このような事前のスケーリングは、ヒューマノイドがロコ操作スキルの構築と一般化を可能にする鍵となる。
我々は,強化学習による大規模模倣事前学習とポストトレーニングを通じて,統合生成コントローラを学習するフレームワークであるInterPriorを紹介する。
論文 参考訳(メタデータ) (2026-02-05T18:59:27Z) - Towards Immersive Human-X Interaction: A Real-Time Framework for Physically Plausible Motion Synthesis [51.95817740348585]
Human-Xは、様々な実体をまたいだ没入的で物理的に妥当なヒューマンインタラクションを可能にするために設計された、新しいフレームワークである。
本手法は, 自己回帰型反応拡散プランナを用いて, リアルタイムに反応と反応を同時予測する。
我々のフレームワークは、人間とロボットのインタラクションのための仮想現実インターフェースを含む、現実世界のアプリケーションで検証されている。
論文 参考訳(メタデータ) (2025-08-04T06:35:48Z) - Spatial-Temporal Graph Diffusion Policy with Kinematic Modeling for Bimanual Robotic Manipulation [88.83749146867665]
既存のアプローチは、遠く離れた次のベストなエンドエフェクタのポーズを予測するポリシーを学びます。
すると、運動に対する対応する関節回転角を逆運動学を用いて計算する。
本稿では,Kinematics 拡張空間テンポアル gRaph diffuser を提案する。
論文 参考訳(メタデータ) (2025-03-13T17:48:35Z) - Dynamic Compositional Graph Convolutional Network for Efficient
Composite Human Motion Prediction [16.554998410205055]
本稿では,複合動作予測タスクを提案する。
この課題に対処するために、まず、コンポジットアクション生成(CAG)モジュールを提示する。
次に、動的構成グラフ畳み込みネットワーク(DC-GCN)を提示することで、複合行動が需要に与える影響を緩和する。
論文 参考訳(メタデータ) (2023-11-23T02:49:46Z) - PPAD: Iterative Interactions of Prediction and Planning for End-to-end Autonomous Driving [57.89801036693292]
PPAD(Iterative Interaction of Prediction and Planning Autonomous Driving)は、予測と計画のより良い統合を目的とした、タイムステップワイドなインタラクションである。
我々は,階層的動的キーオブジェクトに着目したego-to-agent,ego-to-map,ego-to-BEVインタラクション機構を設計し,インタラクションをモデル化する。
論文 参考訳(メタデータ) (2023-11-14T11:53:24Z) - DROP: Dynamics Responses from Human Motion Prior and Projective Dynamics [21.00283279991885]
DROPは、生成的mOtionと射影力学を用いた人間のダイナミクス応答をモデリングするための新しいフレームワークである。
様々な動作タスクや様々な物理的摂動にまたがってモデルを広範囲に評価し、応答のスケーラビリティと多様性を実証する。
論文 参考訳(メタデータ) (2023-09-24T20:25:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。