論文の概要: Mind Your Steps: A General Learning Framework for Accurate Humanoid Foothold Tracking
- arxiv url: http://arxiv.org/abs/2606.08253v1
- Date: Sat, 06 Jun 2026 16:44:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:05.997532
- Title: Mind Your Steps: A General Learning Framework for Accurate Humanoid Foothold Tracking
- Title(参考訳): Mind Your Steps: 正確なヒューマノイド足跡追跡のための一般的な学習フレームワーク
- Authors: Alessandro Montenegro, Shihao Li, Puze Liu, Alberto Maria Metelli, Jan Peters,
- Abstract要約: 本稿では,汎用3D足場追跡ポリシーをトレーニングするための新しいフレームワークを提案する。
本手法は, 目標検層による足場支援を動的に行うことにより, 学習方針を特定の地形に依存しないものにする。
我々の新しいターゲット表現は、雑音や不正確なポーズ推定や足の接触推定といった現実の課題を効果的に緩和する。
- 参考スコア(独自算出の注目度): 78.30338456206984
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Enabling humanoid robots to operate in complex, dynamic environments remains a critical challenge, fundamentally limited by the ability to navigate robustly, safely, and accurately. While reinforcement learning with velocity-commanded policies has achieved remarkable robustness in humanoid locomotion, this approach lacks explicit control of the foothold placement, leading to unsafe behavior, such as stepping onto human feet, or imprecise navigation, hindering the following manipulation task. Conversely, explicit foothold-tracking policies offer a promising alternative by directly being commanded with target foot poses. However, existing approaches are often limited by unrealistic state assumptions, compromising real-world deployment, or they are part of staged pipelines, making them tied to specific downstream tasks. In this work, we introduce a novel, lightweight framework for training general-purpose 3D foothold-tracking policies. By dynamically providing footstep support through a goal sampler, this method enables the learned policy to be agnostic to specific terrains. Our new target representation effectively mitigates challenges arising in the real world, such as noisy and inaccurate pose estimation and foot contact estimation. Designed for direct real-world transfer, our policy acts as a standalone low-level controller that can be seamlessly paired with various high-level foothold generators. We demonstrate the effectiveness of our framework through extensive experiments in simulation and in the real world. By coupling our policy with different upstream planners, we achieve natural and accurate locomotion in challenging settings, paving the way for loco-manipulation tasks in complex environments.
- Abstract(参考訳): 複雑でダイナミックな環境で動くヒューマノイドロボットは、基本的には頑丈で安全に正確に移動できる能力によって制限されている。
速度制御されたポリシーによる強化学習は、人体運動において顕著な堅牢性を実現しているが、このアプローチは足場の位置の明確な制御が欠如しており、人間の足に足を踏み入れたり、不正確なナビゲーションをしたり、次の操作を妨げたりするといった安全でない行動につながる。
逆に、明示的な足場追跡ポリシーは、ターゲットの足のポーズで直接指揮することで、有望な代替手段を提供する。
しかし、既存のアプローチは多くの場合、非現実的な状態仮定によって制限され、実際のデプロイメントを妥協するか、あるいはステージ化されたパイプラインの一部であり、特定の下流タスクに結びついている。
本研究では,汎用3D足場追跡ポリシーをトレーニングするための,新しい軽量なフレームワークを提案する。
本手法は, 目標検層による足場支援を動的に行うことにより, 学習方針を特定の地形に依存しないものにする。
我々の新しいターゲット表現は、雑音や不正確なポーズ推定や足の接触推定など、現実世界で発生する課題を効果的に緩和する。
実世界の直接転送用に設計され、当社のポリシーは、様々な高水準のフットホールドジェネレータとシームレスにペアリングできるスタンドアロンの低レベルコントローラとして機能する。
シミュレーションおよび実世界における広範囲な実験を通じて,本フレームワークの有効性を実証する。
異なる上流プランナーとポリシを結合することにより、複雑な環境下でのロコ操作タスクへの道を切り開くという課題において、自然かつ正確なロコモーションを実現します。
関連論文リスト
- Learning Terrain-Aware Whole-Body Control for Perceptive Legged Loco-Manipulation [2.915167691607446]
我々は,足のマニピュレータのための地形対応全体制御フレームワークTA-WBCを紹介する。
我々は、地形の特徴を抽出するためにハイブリッド・エクセプション・エンコーダを用いており、ロボットが姿勢や足場を積極的に適応するための重要な基盤となっている。
安定なクロステランのロコ操作を容易にするため,フット接触面に基づく新しいエンドエフェクタサンプリング法を提案する。
論文 参考訳(メタデータ) (2026-05-29T14:22:10Z) - ULTRA: Unified Multimodal Control for Autonomous Humanoid Whole-Body Loco-Manipulation [55.467742403416175]
本稿では,大規模モーションキャプチャをヒューマノイドに変換する物理駆動型ニューラルネットワークを提案する。
我々は高密度参照とスパースタスク仕様の両方をサポートする統合マルチモーダルコントローラを学習する。
その結果,ULTRAは自我中心の知覚から,自律的,目標条件付き全体ロコ操作に一般化することが示された。
論文 参考訳(メタデータ) (2026-03-03T18:59:29Z) - Flow Policy Gradients for Robot Control [67.61978635211048]
フローマッチングポリシ勾配は、より表現力のあるポリシのトレーニングと微調整に有効である。
我々は、スクラッチからトレーニングを行う際に、フロー表現をどのように活用するかを示し、ベースラインよりもきめ細やかな堅牢性を改善する。
論文 参考訳(メタデータ) (2026-02-02T18:56:49Z) - START: Traversing Sparse Footholds with Terrain Reconstruction [11.632418196552324]
我々は,高度にスパースな足場でアジャイルで安定した移動を可能にする,単段階学習フレームワークSTARTを提案する。
STARTは、ローコストのオンボードビジョンとプロプレセプションのみを活用して、局所的な地形の高度マップを正確に再構築する。
実験結果から,STARTは実世界の様々なシナリオにまたがるゼロショット転送を実現することが示された。
論文 参考訳(メタデータ) (2025-12-15T10:02:41Z) - Dexplore: Scalable Neural Control for Dexterous Manipulation from Reference-Scoped Exploration [58.4036440289082]
ハンドオブジェクトモーションキャプチャ(MoCap)は、大規模でコンタクトに富んだデモと、器用なロボットスコープの約束を提供する。
Dexploreは、リポジトリとトラッキングを実行し、MoCapから直接ロボット制御ポリシーを学習する、統一された単一ループ最適化である。
論文 参考訳(メタデータ) (2025-09-11T17:59:07Z) - SATA: Safe and Adaptive Torque-Based Locomotion Policies Inspired by Animal Learning [10.138425472807368]
SATAは、動物の移動で観察される重要な生体力学的原理と適応学習機構を模倣する生体に触発されたフレームワークである。
本手法は,早期探索を著しく改善し,トルクベースの政策を学習する上での課題を効果的に解決する。
実験結果から,SATAは,挑戦的環境においても,顕著なコンプライアンスと安全性を示すことが明らかとなった。
論文 参考訳(メタデータ) (2025-02-18T09:25:37Z) - CAIMAN: Causal Action Influence Detection for Sample-efficient Loco-manipulation [17.94272840532448]
我々は,ロボットが環境内の他のエンティティを制御できるようにする強化学習フレームワークであるCAIMANを提案する。
シミュレーションにおけるCAIMANの優れたサンプル効率と多様なシナリオへの適応性を実証的に実証した。
論文 参考訳(メタデータ) (2025-02-02T16:16:53Z) - RT-Trajectory: Robotic Task Generalization via Hindsight Trajectory
Sketches [74.300116260004]
一般化は、ロバストなロボット学習システムにとって最も重要なデシダータの1つである。
粗い軌道スケッチを用いたポリシー条件付け手法を提案する。
RT-Trajectoryは言語条件や目標条件よりも幅広いタスクを実行できることを示す。
論文 参考訳(メタデータ) (2023-11-03T15:31:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。