論文の概要: PTDL:Multi-Terrain Fall Recovery via Phase-Terrain Decoupled Learning
- arxiv url: http://arxiv.org/abs/2606.08922v1
- Date: Mon, 08 Jun 2026 02:01:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.567367
- Title: PTDL:Multi-Terrain Fall Recovery via Phase-Terrain Decoupled Learning
- Title(参考訳): PTDL:相領域分離学習によるマルチテランのフォールリカバリ
- Authors: Xiaoyu Xu, Zhiming Chen, Yuenan Zhao, Ran Song, Wei Zhang,
- Abstract要約: 人型ロボットは、非構造環境の斜面、砂利、不均一な地面に落下することがある。
本稿では、位相軸と地形軸に沿って訓練の監督を分離する位相領域分離学習(PTDL)を提案する。
平地,砂利,斜面をまたいだ29-DoFユニツリーG1上のPTDLをシミュレーションおよびハードウェア上で最大20度検証する。
- 参考スコア(独自算出の注目度): 13.93626645001
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Humanoid robots can fall on slopes, gravel, and uneven ground in unstructured environments. We target integrated fall recovery and locomotion: rebuilding balance from a fallen state using proprioception alone and resuming velocity-commanded walking at the fall site. Prior methods often stop at quasi-static rise, neglect the post-fall ground-contact phase, or, when trained on mixed terrains without separating recovery and locomotion phases or per-surface constraints, collapse to a single compromise get-up across surfaces. We propose Phase--Terrain Decoupled Learning (PTDL), which decouples training supervision along phase and terrain axes while deploying one proprioceptive policy. On the phase axis, projected-gravity-gated dual motion-prior discriminators and a probe-to-walk transition link post-fall recovery to commanded walking. On the terrain axis, terrain-stratified recovery shaping assigns surface-specific training supervision on flat ground, gravel, and slopes; terrain labels are training-only and withheld from policy observations, enabling implicit post-fall strategy selection at deployment. We validate PTDL on a 29-DoF Unitree G1 across flat ground, gravel, and slopes up to 20 degrees in simulation and on hardware, achieving stable cross-terrain recovery, smooth recovery-to-locomotion transitions, and differentiated post-fall rise behaviors under one deployed policy.
- Abstract(参考訳): 人型ロボットは、非構造環境の斜面、砂利、不均一な地面に落下することができる。
我々は,統合的転倒回復と移動を目標とし,プロピロセプション単独で転倒状態からバランスを再構築し,転倒地点での速度制御歩行を再開する。
従来の手法では、準定常的な上昇で停止したり、落下後の接地・接触フェーズを無視したり、あるいは、回復期と移動期を分離せずに混合地形で訓練されたり、表面あたりの制約で崩壊することがある。
本稿では,位相と地形の軸に沿って学習の指導を分離し,一方の受容的政策を展開させるPTDL(Phase-Terrain Decoupled Learning)を提案する。
位相軸上には、投射重力印加二動優先判別器と、投射歩行に対するサーベイ・ツー・ウォーク・トランジション・リンク・リカバリを行う。
地形軸では、地形階層化された地形回復は、平坦な地面、砂利、斜面に地表固有の訓練監督を割り当て、地形ラベルは訓練のみであり、政策観測から守られ、配置時に暗黙の降水戦略選択を可能にする。
我々は, 平地, 砂利, 斜面の29-DoFユニツリーG1上のPTDLをシミュレーションおよびハードウェア上で最大20度評価し, 安定なクロステランの回復, 円滑な回復-移動遷移を実現し, 着地後立ち上がり挙動を区別した。
関連論文リスト
- CoRe-MoE: Contrastive Reweighted Mixture of Experts for Multi-Terrain Humanoid Locomotion with Gait Adaptation [18.803751724563448]
地形適応から歩行生成を分離する2段階強化学習フレームワークであるCoRe-MoEを提案する。
最初の段階では、安定な移動ポリシーが学習され、スムーズな遷移を伴う自然な歩行行動と走行行動が生み出される。
第2段階では、地形を意識したMoE分岐を導入し、ゲーティングネットワークを形成するための対照的な目的で訓練する。
論文 参考訳(メタデータ) (2026-06-03T10:51:46Z) - High-Dimensional Latents Should Be Diagnosed Through Phase Structure [56.362776482614976]
スピングラス理論のレンズによるオートエンコーダと変分オートエンコーダの潜在空間について検討した。
固定復号器用の潜時空間スピングラス辞書を定式化する。
トポロジカルな自明化機構のエッジ・オブ・ステイティに向けて潜伏系を駆動することは、下流に具体的な結果をもたらすことを示す。
論文 参考訳(メタデータ) (2026-05-23T06:17:23Z) - Embedding Classical Balance Control Principles in Reinforcement Learning for Humanoid Recovery [1.0883174135300417]
人間は転倒や回復不能な障害状態に対して脆弱であり、非構造化環境での実用性を制限する。
古典的バランス指標を埋め込むことにより、この制限に対処する統一的なRLポリシーを提案する。
このポリシーは、ランダム化された初期ポーズと記述されていないフォール設定で93.4%のリカバリ率を達成する。
論文 参考訳(メタデータ) (2026-03-09T17:02:30Z) - VIGOR: Visual Goal-In-Context Inference for Unified Humanoid Fall Safety [22.62399552569191]
転倒復旧のすべての段階にまたがる統合的転倒安全アプローチを提案する。
我々は、平坦な地形における疎らな人間のデモンストレーションと複雑な地形をシミュレートした特権教師を訓練する。
シミュレーションの結果と実際のUnitree G1ヒューマノイドでは、多様な非平坦な環境において、堅牢でゼロショットのフォールセーフが示される。
論文 参考訳(メタデータ) (2026-02-18T14:57:33Z) - Gait-Adaptive Perceptive Humanoid Locomotion with Real-Time Under-Base Terrain Reconstruction [86.53248703859718]
本研究では,地形認識,歩行制御,全身制御を一つの強化学習ポリシーにマージする知覚的移動フレームワークを提案する。
31-DoF、1.65mのヒューマノイドロボットによる実験は、シミュレーションと実世界の両方で堅牢な移動を実証している。
論文 参考訳(メタデータ) (2025-12-08T11:42:41Z) - PGTT: Phase-Guided Terrain Traversal for Perceptive Legged Locomotion [41.99844472131922]
PGTT ( Phase-Guided Terrain Traversal) は、報酬形成を通じて歩行構造を純粋に強制する認識型ディープRLアプローチである。
MuJoCo(MJX)で、カリキュラムやドメインランダム化を伴う手続き的に生成された階段のような地形で訓練されたPGTTは、プッシュ障害の下で最も成功している。
論文 参考訳(メタデータ) (2025-10-21T07:00:18Z) - Automated Hybrid Grounding Using Structural and Data-Driven Heuristics [68.08622864330296]
ハイブリットグラウンドリングは、標準ボトムアップグラウンドリングの強度と、グラウンドニング中にルールボディを分離する手法を組み合わせたものである。
ハイブリッド接地が身体分離接地をいつ使うか、標準ボトムアップ接地をいつ使うかは未定である。
我々は,データ構造に基づく分割アルゴリズムを導入し,身体分離接地と標準接地がいつ有用かを検出する。
論文 参考訳(メタデータ) (2025-07-23T13:19:02Z) - VAE-Loco: Versatile Quadruped Locomotion by Learning a Disentangled Gait
Representation [78.92147339883137]
本研究では,特定の歩行を構成する主要姿勢位相を捕捉する潜在空間を学習することにより,制御器のロバスト性を高めることが重要であることを示す。
本研究では,ドライブ信号マップの特定の特性が,歩幅,歩幅,立位などの歩行パラメータに直接関係していることを示す。
生成モデルを使用することで、障害の検出と緩和が容易になり、汎用的で堅牢な計画フレームワークを提供する。
論文 参考訳(メタデータ) (2022-05-02T19:49:53Z) - Next Steps: Learning a Disentangled Gait Representation for Versatile
Quadruped Locomotion [69.87112582900363]
現在のプランナーは、ロボットが動いている間、キー歩行パラメータを連続的に変更することはできない。
本研究では、特定の歩行を構成する重要な姿勢位相を捉える潜在空間を学習することにより、この制限に対処する。
本研究では, 歩幅, 歩幅, 立位など, 歩行パラメータに直接対応した駆動信号マップの具体的特性を示す。
論文 参考訳(メタデータ) (2021-12-09T10:02:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。