論文の概要: Perceptive Behavior Foundation Model: Adapting Human Motion Priors to Robot-Centric Terrain
- arxiv url: http://arxiv.org/abs/2606.08059v1
- Date: Sat, 06 Jun 2026 08:46:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:05.701949
- Title: Perceptive Behavior Foundation Model: Adapting Human Motion Priors to Robot-Centric Terrain
- Title(参考訳): 知覚行動基礎モデル:ロボット中心地形に先立って人間の動きに適応する
- Authors: Zifan Wang, Yizhao Li, Teli Ma, Qiang Zhang, Yudong Fan, Hao Xu, Shuo Yang, Junwei Liang,
- Abstract要約: 我々は、ロボット中心の知覚において、人間の動きを前提とした地形認識型ヒューマノイド制御フレームワークを開発する。
我々は,視覚障害者の教師を訓練し,その地形・地形の振る舞いを生の学生に伝達する。
学生は、移動追跡を前もって保存し、必要なときにのみ局所的な補正を行うように訓練された、地形の特徴が残留経路を通り抜けるアイデンティティ付きトランスフォーマートラッカーである。
- 参考スコア(独自算出の注目度): 25.92545023668694
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Humanoid behavior foundation models aim to acquire reusable whole-body control policies from broad human motion priors, enabling a single controller to produce diverse and expressive behaviors. However, existing motion-centric foundation policies largely assume that the reference motion is already physically compatible with the robot's surroundings. This assumption breaks when the demonstrator, operator, and robot inhabit different environments: a human motion may specify the intended behavior, but not the footholds, clearance, body height, or contact timing required by the robot's local terrain. We introduce \emph{Perceptive Behavior Foundation Model} (Perceptive BFM), a terrain-aware humanoid control framework that grounds human motion priors in robot-centric perception. The model preserves raw kinematic motion references as the behavioral interface, while using local terrain observations to adapt contacts, posture, and timing. To provide scalable terrain supervision, we develop \emph{terrain-conformal reference synthesis} (TCRS), which converts locomotion-oriented human motion clips into terrain-consistent references through contact-aware foothold construction, foot-geometry-aware swing optimization, support-aware root reconstruction, collision repair, and multi-point inverse kinematics. We then train a blind adapted-reference teacher and transfer its terrain-conformal behavior to a deployed raw-reference student through target-frame action alignment. The student is an identity-gated Transformer tracker whose terrain features enter through residual pathways initialized to preserve the motion-tracking prior and trained to produce local corrections only when needed.
- Abstract(参考訳): ヒューマノイド行動基盤モデルは、幅広い人間の動きの先行から再利用可能な全身制御ポリシーを取得し、単一のコントローラが多様で表現力のある振る舞いを生成できるようにすることを目的としている。
しかし、既存の動き中心の基本的な方針は、参照動作がロボットの周囲と物理的に互換性があることを概ね想定している。
人間の動きは意図した振る舞いを指定できるが、足場、クリアランス、身の高さ、あるいはロボットの局所的な地形が必要とする接触タイミングは指定できない。
そこで我々は,ロボット中心の知覚において,人間の動作を前提とした地形認識型ヒューマノイド制御フレームワークである \emph{Perceptive Behavior Foundation Model (Perceptive BFM) を紹介した。
このモデルは、局地的な地形観測を用いて接触、姿勢、タイミングに適応しながら、行動インターフェースとして生の運動参照を保存する。
拡張性のある地形監視を行うため,移動方向の人動クリップを接点対応足場構築,足場対応スイング最適化,サポート対応ルート再構築,衝突修復,多点逆運動学を通じて地形対応参照に変換するTCRS (emph{terrain-conformal reference synthesis) を開発した。
次に,視覚的適応参照教師を訓練し,その地形と地形の整合性を,ターゲットフレームのアクションアライメントを通じて,デプロイされた生の参照学生に伝達する。
学生は、移動追跡を前もって保存するために初期化され、必要なときにのみ局所的な補正を行うために訓練された、地形の特徴が残留経路を通過するアイデンティティゲートトランスフォーマートラッカーである。
関連論文リスト
- GRAIL: Generating Humanoid Loco-Manipulation from 3D Assets and Video Priors [113.71148915419246]
GRAILは3Dアセット、シミュレーター対応シーン、およびビデオファンデーションモデル(VFM)の先行データで構成され、物理的環境を再構築したりロボットを遠隔操作したりすることなく対話を合成するデジタル生成パイプラインである。
GRAILは、オブジェクト形状、カメラパラメータ、メートル法スケール、環境深度、ロボットが提案する文字がビデオ生成の前に知られ、再構成中に再利用される、完全に定義された3D構成から始まる。
我々は、回復した動作をヒューマノイドロボットに再ターゲティングし、補完的なタスク・ジェネラル・モルフォロジー・トラッカーを訓練する。
GRAILは、ピックアップ、オブジェクト操作、着座にまたがる2万以上のシーケンスを生成する
論文 参考訳(メタデータ) (2026-06-03T17:57:45Z) - Learning Whole-Body Humanoid Locomotion via Motion Generation and Motion Tracking [22.8041193953823]
高次元制御、形態的不安定性、および車載認識を用いた様々な地形へのリアルタイム適応の必要性により、全身のヒューマノイド移動は困難である。
本研究では,参照動作から学んだスキルと地形認識適応を組み合わせた全身ヒューマノイド移動フレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-19T09:02:55Z) - PhyGile: Physics-Prefix Guided Motion Generation for Agile General Humanoid Motion Tracking [23.96905373874686]
本稿では,ロボットネイティブ動作生成と推論のループを閉じる統合フレームワークであるPhyGileを紹介する。
我々は,GMTコントローラをカリキュラムベースのMix-of-expertsスキームでトレーニングし,その後,大規模ロボット動作に対するロバスト性を改善するためにラベル付き動作データを用いた後学習を行った。
PhyGileはテキスト駆動型ヒューマノイドコントロールのフロンティアを拡張し、アジャイルの安定したトラッキングを可能にする。
論文 参考訳(メタデータ) (2026-03-13T06:43:44Z) - Learning to Assist: Physics-Grounded Human-Human Control via Multi-Agent Reinforcement Learning [29.898955971414154]
多エージェント強化学習問題として, 密接に相互作用し, 力量変化する人間の動作系列の模倣を定式化する。
AssistMimicは、確立されたベンチマーク上でのアシストインタラクション動作の追跡に成功できる最初の方法であることを示す。
論文 参考訳(メタデータ) (2026-03-11T22:25:44Z) - OmniTrack: General Motion Tracking via Physics-Consistent Reference [54.256312586493415]
OmniTrackは、一般的なモーショントラッキングから物理的実現可能性を明確に分離する一般的なトラッキングフレームワークである。
実験により、OmniTrackは追跡精度を向上し、目に見えない動きに対して強力な一般化を示すことが示された。
実世界のテストでは、OmniTrackは、フリップやカートホイールのような複雑なアクロバティックな動きを含む、1時間の長さ、一貫性、安定したトラッキングを実現している。
論文 参考訳(メタデータ) (2026-02-27T09:12:15Z) - MeshMimic: Geometry-Aware Humanoid Motion Learning through 3D Scene Reconstruction [54.36564144414704]
MeshMimicは、3Dシーンの再構築とインテリジェンスを組み込んだ革新的なフレームワークで、ヒューマノイドロボットがビデオから直接「モーション・テライン」インタラクションを学習できるようにする。
現状の3次元視覚モデルを活用することで、我々のフレームワークは、人間の軌跡と基礎となる地形や物体の3次元幾何学の両方を正確にセグメント化し再構築する。
論文 参考訳(メタデータ) (2026-02-17T17:09:45Z) - From Language to Locomotion: Retargeting-free Humanoid Control via Motion Latent Guidance [55.31807046722006]
既存の言語誘導型ヒューマノイドパイプラインは面倒で信頼できない。
本稿では,言語を基盤とした動作潜伏者に対してヒューマノイドポリシーを規定する言語フリーフレームワークであるRoboGhostを紹介する。
我々は,RoboGhostがデプロイメントの遅延を大幅に低減し,成功率と精度を向上し,スムーズでセマンティックに整合したヒューマノイドを生成することを示す。
論文 参考訳(メタデータ) (2025-10-16T17:57:47Z) - OmniRetarget: Interaction-Preserving Data Generation for Humanoid Whole-Body Loco-Manipulation and Scene Interaction [76.44108003274955]
ヒューマノイドロボットの複雑なスキルを教えるための主要なパラダイムは、強化学習ポリシーの運動学的参照として人間の動きを再ターゲットすることである。
インタラクションメッシュに基づくインタラクション保存データ生成エンジンであるOmniRetargetを紹介する。
人間のメッシュとロボットメッシュの間のラプラシアの変形を最小限にすることで、OmniRetargetは運動学的に実現可能な軌道を生成する。
論文 参考訳(メタデータ) (2025-09-30T17:59:02Z) - Learning Humanoid Standing-up Control across Diverse Postures [27.79222176982376]
立ち上がり制御はヒューマノイドロボットにとって不可欠であり、現在の移動と移動操作システムに統合される可能性がある。
本稿では,立ち上がり制御をゼロから学習する強化学習フレームワークであるHoST(Humanoid Standing-up Control)を提案する。
実験結果から, 各種実験室および屋外環境におけるスムーズ, 安定, 頑健な立位運動が得られた。
論文 参考訳(メタデータ) (2025-02-12T13:10:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。