論文の概要: VIGOR: Visual Goal-In-Context Inference for Unified Humanoid Fall Safety
- arxiv url: http://arxiv.org/abs/2602.16511v2
- Date: Tue, 03 Mar 2026 21:24:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.542895
- Title: VIGOR: Visual Goal-In-Context Inference for Unified Humanoid Fall Safety
- Title(参考訳): VIGOR: 統一型ヒューマノイドフォールセーフのための視覚目標-コンテキスト推論
- Authors: Osher Azulay, Zhengjie Xu, Andrew Scheffer, Stella X. Yu,
- Abstract要約: 転倒復旧のすべての段階にまたがる統合的転倒安全アプローチを提案する。
我々は、平坦な地形における疎らな人間のデモンストレーションと複雑な地形をシミュレートした特権教師を訓練する。
シミュレーションの結果と実際のUnitree G1ヒューマノイドでは、多様な非平坦な環境において、堅牢でゼロショットのフォールセーフが示される。
- 参考スコア(独自算出の注目度): 22.62399552569191
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reliable fall recovery is critical for humanoids operating in cluttered environments. Unlike quadrupeds or wheeled robots, humanoids experience high-energy impacts, complex whole-body contact, and large viewpoint changes during a fall, making recovery essential for continued operation. Existing methods fragment fall safety into separate problems such as fall avoidance, impact mitigation, and stand-up recovery, or rely on end-to-end policies trained without vision through reinforcement learning or imitation learning, often on flat terrain. At a deeper level, fall safety is treated as monolithic data complexity, coupling pose, dynamics, and terrain and requiring exhaustive coverage, limiting scalability and generalization. We present a unified fall safety approach that spans all phases of fall recovery. It builds on two insights: 1) Natural human fall and recovery poses are highly constrained and transferable from flat to complex terrain through alignment, and 2) Fast whole-body reactions require integrated perceptual-motor representations. We train a privileged teacher using sparse human demonstrations on flat terrain and simulated complex terrains, and distill it into a deployable student that relies only on egocentric depth and proprioception. The student learns how to react by matching the teacher's goal-in-context latent representation, which combines the next target pose with the local terrain, rather than separately encoding what it must perceive and how it must act. Results in simulation and on a real Unitree G1 humanoid demonstrate robust, zero-shot fall safety across diverse non-flat environments without real-world fine-tuning. The project page is available at https://vigor2026.github.io/
- Abstract(参考訳): 不安定な環境下でのヒューマノイドにとって、信頼性の高い転倒回復は重要である。
四足歩行ロボットや車輪付きロボットとは異なり、ヒューマノイドは転倒の間、高エネルギーの衝撃、複雑な全身接触、大きな視点の変化を経験し、継続的な手術に欠かせない回復を実現している。
既存の方法では、フォール回避、影響緩和、スタンドアップリカバリといった別の問題にフォールセーフを断片化するか、あるいは強化学習や模倣学習を通じて視覚なしで訓練されたエンドツーエンドのポリシーに頼っている。
より深いレベルでは、フォールセーフはモノリシックなデータ複雑さ、結合のポーズ、ダイナミックス、地形として扱われ、拡張性と一般化を制限し、徹底的なカバレッジを必要とします。
転倒復旧のすべての段階にまたがる統合的転倒安全アプローチを提案する。
それは2つの洞察の上に成り立っている。
1) 自然人の転倒と回復のポーズは、アライメントを通じて平坦な地形から複雑な地形へ高度に拘束され、移動可能である。
2)高速な全身反応は知覚運動量表現を必要とする。
我々は、平坦な地形上でのまばらな人間デモを用いて特権教師を訓練し、複雑な地形を模擬し、エゴセントリックな深さとプロプレセプションのみに依存する展開可能な学生に蒸留する。
生徒は教師のゴール・イン・コンテクストの潜在表現をマッチングすることで反応の仕方を学び、次のターゲットのポーズを局所的な地形と組み合わせる。
シミュレーションの結果と実際のUnitree G1ヒューマノイド上では、現実世界の微調整なしで様々な非平坦環境において、堅牢でゼロショットの落下安全性が示される。
プロジェクトページはhttps://vigor2026.github.io/で公開されている。
関連論文リスト
- Embedding Classical Balance Control Principles in Reinforcement Learning for Humanoid Recovery [1.0883174135300417]
人間は転倒や回復不能な障害状態に対して脆弱であり、非構造化環境での実用性を制限する。
古典的バランス指標を埋め込むことにより、この制限に対処する統一的なRLポリシーを提案する。
このポリシーは、ランダム化された初期ポーズと記述されていないフォール設定で93.4%のリカバリ率を達成する。
論文 参考訳(メタデータ) (2026-03-09T17:02:30Z) - Hiking in the Wild: A Scalable Perceptive Parkour Framework for Humanoids [30.976354277907664]
textitHiking in the Wildは、堅牢なヒューマノイドハイキング用に設計された、スケーラブルでエンドツーエンドのパーサー知覚フレームワークだ。
提案手法では, 外部状態推定に頼ることなく, 単段階強化学習手法, 生深度入力, プロプレセプションを直接協調動作にマッピングする。
論文 参考訳(メタデータ) (2026-01-12T16:50:50Z) - GentleHumanoid: Learning Upper-body Compliance for Contact-rich Human and Object Interaction [14.278503723930998]
GentleHumanoidは、インピーダンス制御を全身のモーショントラッキングポリシーに統合し、上半身のコンプライアンスを実現するフレームワークである。
我々は,Unitree G1ヒューマノイドとシミュレーションの両方において,異なるレベルのコンプライアンスを必要とするタスクに対するアプローチを評価した。
論文 参考訳(メタデータ) (2025-11-06T18:59:33Z) - PhysHSI: Towards a Real-World Generalizable and Natural Humanoid-Scene Interaction System [67.2851799763138]
PhysHSIはシミュレーショントレーニングパイプラインと現実世界のデプロイメントシステムで構成される。
シミュレーションでは,自然のヒューマノイドとシーンの相互作用データを模倣するために,逆運動に基づくポリシー学習を採用する。
実世界の展開には、LiDARとカメラ入力を組み合わせた粗粒度オブジェクトローカライズモジュールを導入する。
論文 参考訳(メタデータ) (2025-10-13T07:11:37Z) - PhysHMR: Learning Humanoid Control Policies from Vision for Physically Plausible Human Motion Reconstruction [52.44375492811009]
物理学に基づくシミュレーターにおいて,ヒューマノイド制御のための視覚行動ポリシーを学習する統合フレームワークであるPhysHMRを提案する。
我々のアプローチの重要な要素はピクセル・アズ・レイ戦略であり、2次元のキーポイントを3次元空間に上げ、それらを大域空間に変換する。
PhysHMRは多種多様なシナリオにまたがって高忠実で物理的に妥当な動きを生じさせ、視覚的精度と身体的リアリズムの両方において以前のアプローチより優れている。
論文 参考訳(メタデータ) (2025-10-02T21:01:11Z) - HOSIG: Full-Body Human-Object-Scene Interaction Generation with Hierarchical Scene Perception [57.37135310143126]
HO SIGは階層的なシーン認識を通じて全体インタラクションを合成するための新しいフレームワークである。
我々のフレームワークは、自己回帰生成による運動長の無制限化をサポートし、手動による介入を最小限に抑える。
この研究は、シーン認識ナビゲーションとデクスタラスオブジェクト操作の間に重要なギャップを埋める。
論文 参考訳(メタデータ) (2025-06-02T12:08:08Z) - Learning Humanoid Locomotion with World Model Reconstruction [8.27902320260747]
視覚障害者のためのエンド・ツー・エンドの学習手法であるワールド・モデル・コンストラクション(WMR)を導入する。
我々は、世界国家を明示的に再構築し、それを利用して移動政策を強化するよう、推定器を訓練する。
ロボットは人間の助けなしに3.2kmのハイキングを成功させた。
論文 参考訳(メタデータ) (2025-02-22T13:57:56Z) - GraMMaR: Ground-aware Motion Model for 3D Human Motion Reconstruction [61.833152949826946]
本研究では,GraMMaRという3次元人体動作再構成のための新しいグラウンド・アウェア・モーション・モデルを提案する。
GraMMaRは、動きシーケンスの各時間ステップにおいて、ポーズにおける遷移の分布と、各関節面と接地面の間の相互作用を学習する。
運動と地面への距離変化との整合性を明確に促進するように訓練されている。
論文 参考訳(メタデータ) (2023-06-29T07:22:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。