論文の概要: VOFA: Visual Object Goal Pushing with Force-Adaptive Control for Humanoids
- arxiv url: http://arxiv.org/abs/2605.01518v1
- Date: Sat, 02 May 2026 16:16:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.816042
- Title: VOFA: Visual Object Goal Pushing with Force-Adaptive Control for Humanoids
- Title(参考訳): VOFA:ヒューマノイドの力適応制御によるビジュアルオブジェクトゴールプッシュ
- Authors: Zichao Hu, Zifan Xu, Dongsik Chang, He Yin, Linh Tran, Roberto Martín-Martín, Peter Stone, Jingyu Qiao, Joydeep Biswas,
- Abstract要約: VOFAは視覚目標条件付きヒューマノイドロコ操作システムである。
未知の物理的特性を持つオブジェクトを任意の目標位置にプッシュすることができる。
VOFAは、ブースターT1ヒューマノイドロボットのシミュレーションと実世界の実験で広く評価されている。
- 参考スコア(独自算出の注目度): 35.671376073584305
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The ability to push large objects in a goal-directed manner using onboard egocentric perception is an essential skill for humanoid robots to perform complex tasks such as material handling in warehouses. To robustly manipulate heavy objects to arbitrary goal configurations, the robot must cope with unknown object mass and ground friction, noisy onboard perception, and actuation errors; all in a real-time feedback loop. Existing solutions either rely on privileged object-state information without onboard perception or lack robustness to variations in goal configurations and object physical properties. In this work, we present VOFA, a visual goal-conditioned humanoid loco-manipulation system capable of pushing objects with unknown physical properties to arbitrary goal positions. VOFA consists of a two-level hierarchical architecture with a high-level visuomotor policy and a low-level force-adaptive whole-body controller. The high-level policy processes noisy onboard observations and generates goal-conditioned commands to operate in closed loop across diverse object-goal configurations, while the low-level whole-body controller provides robustness to variations in object physical properties. VOFA is extensively evaluated in both simulation and real-world experiments on the Booster T1 humanoid robot. Our results demonstrate strong performance, achieving over 90% success in simulation and over 80% success in real-world trials. Moreover, VOFA successfully pushes objects weighing up to 17kg, exceeding half of the Booster T1's body weight.
- Abstract(参考訳): 人型ロボットが倉庫で材料処理などの複雑な作業を行うためには,大きな物体を車載自我中心の知覚で目標指向で押し上げる能力が不可欠である。
重い物体を任意の目標設定に頑健に操作するには、ロボットは未知の物体の質量と地面の摩擦、ノイズの多いオンボード認識、アクティベーションエラーに対処する必要がある。
既存のソリューションは、オンボードで知覚されることなく、特権化されたオブジェクト状態情報に依存するか、目標設定やオブジェクトの物理的特性の変動に頑健さを欠くかのいずれかである。
本研究では,視覚目標条件付きヒューマノイドロコ操作システムVOFAについて述べる。
VOFAは、高レベルのビジュモータポリシーと低レベルの力適応型全身コントローラを備えた2層階層アーキテクチャで構成されている。
高レベルのポリシプロセスは、オンボードでノイズを発生させ、さまざまなオブジェクトゴール構成をまたいだクローズドループで操作するための目標条件付きコマンドを生成し、低レベルの全体ボディコントローラは、オブジェクト物理特性の変動に対して堅牢性を提供する。
VOFAは、ブースターT1ヒューマノイドロボットのシミュレーションと実世界の実験で広く評価されている。
その結果,シミュレーションで90%以上の成功,実世界の試験で80%以上の成功を収めた。
さらに、VOFAはブースターT1の体重の半分を超える重量の物体を17kgまで押し上げることに成功した。
関連論文リスト
- ULTRA: Unified Multimodal Control for Autonomous Humanoid Whole-Body Loco-Manipulation [55.467742403416175]
本稿では,大規模モーションキャプチャをヒューマノイドに変換する物理駆動型ニューラルネットワークを提案する。
我々は高密度参照とスパースタスク仕様の両方をサポートする統合マルチモーダルコントローラを学習する。
その結果,ULTRAは自我中心の知覚から,自律的,目標条件付き全体ロコ操作に一般化することが示された。
論文 参考訳(メタデータ) (2026-03-03T18:59:29Z) - HAIC: Humanoid Agile Object Interaction Control via Dynamics-Aware World Model [56.4392302336014]
本稿では,外部状態推定を伴わない多種多様なオブジェクトダイナミクス間のロバストな相互作用のためのフレームワークであるHAICを提案する。
我々の重要な貢献は、主観的歴史のみから高次対象状態(速度、加速度)を推定するダイナミクス予測器である。
ヒューマノイドロボットの実験では、HAICはアジャイルタスクで高い成功率を達成する。
論文 参考訳(メタデータ) (2026-02-12T09:34:35Z) - ResMimic: From General Motion Tracking to Humanoid Whole-body Loco-Manipulation via Residual Learning [59.64325421657381]
ヒューマノイド全体のロコ操作は、日々のサービスや倉庫のタスクにトランスフォーメーション機能を約束する。
ResMimicは、人間の動作データから正確に表現力のあるヒューマノイド制御のための2段階の残差学習フレームワークである。
結果は、強いベースラインよりもタスク成功、トレーニング効率、堅牢性が大幅に向上したことを示している。
論文 参考訳(メタデータ) (2025-10-06T17:47:02Z) - MaskedManipulator: Versatile Whole-Body Manipulation [38.02818493367002]
本研究では,大規模な人体モーションキャプチャーデータに基づいて学習したトラッキングコントローラから生成制御ポリシーであるMaskedManipulatorを紹介する。
この2段階の学習プロセスにより、システムは複雑なインタラクション動作を実行でき、キャラクタとオブジェクトの両方の動作を直感的に制御できる。
論文 参考訳(メタデータ) (2025-05-25T10:46:14Z) - Dynamic object goal pushing with mobile manipulators through model-free constrained reinforcement learning [8.424504118941453]
我々は,未知の物体を所望の位置に移動させ,一連のプッシュ動作によって方向を判断する,移動マニピュレータのための学習型コントローラを開発した。
ロボットアームと移動体ベースモーションのコントローラは,制約付き強化学習(RL)の定式化を用いて訓練される。
学習されたポリシーは、シミュレーションで91.35%、挑戦的なシナリオでハードウェアで80%の成功率を達成する。
論文 参考訳(メタデータ) (2025-02-03T17:28:35Z) - Physically Grounded Vision-Language Models for Robotic Manipulation [59.143640049407104]
39.6Kのクラウドソースと417Kの自動物理概念アノテーションからなるオブジェクト中心のデータセットであるPhysObjectsを提案する。
本稿では,PhysObjects上での視覚言語モデルの微調整により,物理オブジェクト概念の理解が向上することを示す。
我々は、この物理的基盤を持つVLMを、大規模言語モデルに基づくロボットプランナーと対話的なフレームワークに組み込む。
論文 参考訳(メタデータ) (2023-09-05T20:21:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。