論文の概要: Sumo: Dynamic and Generalizable Whole-Body Loco-Manipulation
- arxiv url: http://arxiv.org/abs/2604.08508v2
- Date: Sun, 12 Apr 2026 20:12:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 14:47:45.802329
- Title: Sumo: Dynamic and Generalizable Whole-Body Loco-Manipulation
- Title(参考訳): Sumo: 動的で一般化可能な全体ロコ操作
- Authors: John Z. Zhang, Maks Sorokin, Jan Brüdigam, Brandon Hung, Stephen Phillips, Dmitry Yershov, Farzad Niroui, Tong Zhao, Leonor Fermoselle, Xinghao Zhu, Chao Cao, Duy Ta, Tao Pang, Jiuguang Wang, Preston Culbertson, Zachary Manchester, Simon Le Cléac'h,
- Abstract要約: 本論文は,足のロボットが全身のデキスタリティで大型で重い物体を操作できるようにする,シム・トゥ・リアルなアプローチを提案する。
我々の手法は、追加のチューニングやトレーニングを伴わずに、さまざまなオブジェクトやタスクに一般化されている。
ドアの開閉やテーブルの押圧など,ヒューマノイドのロコ操作タスクにも,同様のアプローチが適用可能であることを示す。
- 参考スコア(独自算出の注目度): 18.96552416168015
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a sim-to-real approach that enables legged robots to dynamically manipulate large and heavy objects with whole-body dexterity. Our key insight is that by performing test-time steering of a pre-trained whole-body control policy with a sample-based planner, we can enable these robots to solve a variety of dynamic loco-manipulation tasks. Interestingly, we find our method generalizes to a diverse set of objects and tasks with no additional tuning or training, and can be further enhanced by flexibly adjusting the cost function at test time. We demonstrate the capabilities of our approach through a variety of challenging loco-manipulation tasks on a Spot quadruped robot in the real world, including uprighting a tire heavier than the robot's nominal lifting capacity and dragging a crowd-control barrier larger and taller than the robot itself. Additionally, we show that the same approach can be generalized to humanoid loco-manipulation tasks, such as opening a door and pushing a table, in simulation. Project code and videos are available at https://sumo.rai-inst.com/.
- Abstract(参考訳): そこで本論文では,足のロボットが全身のデキスタリティで大きな物体や重い物体を動的に操作できるシム・トゥ・リアルなアプローチを提案する。
私たちのキーとなる洞察は、トレーニング済みの全身制御ポリシーをサンプルベースプランナーで実行することで、これらのロボットが様々な動的ロコ操作タスクを解決できるということです。
興味深いことに,本手法は多種多様なオブジェクトやタスクに対して,追加のチューニングやトレーニングを伴わずに一般化し,テスト時のコスト関数を柔軟に調整することで,さらに拡張することができる。
本研究では,実世界におけるSpot四足歩行ロボットのロコ操作に挑戦するさまざまなタスクを通じて,我々のアプローチの能力を実証する。ロボットの名目上リフト能力よりも重いタイヤを直立させ,ロボット自身よりも大きくて高い群集制御障壁を引き付けることなどである。
さらに, シミュレーションにおいて, ドアの開閉やテーブルの押圧など, ヒューマノイドのロコ操作タスクに対して, 同じ手法を一般化できることが示される。
プロジェクトコードとビデオはhttps://sumo.rai-inst.com/.comで公開されている。
関連論文リスト
- $π_0$: A Vision-Language-Action Flow Model for General Robot Control [77.32743739202543]
本稿では,インターネット規模のセマンティック知識を継承するために,事前学習された視覚言語モデル(VLM)上に構築された新しいフローマッチングアーキテクチャを提案する。
我々は,事前訓練後のタスクをゼロショットで実行し,人からの言語指導に追従し,微調整で新たなスキルを習得する能力の観点から,我々のモデルを評価した。
論文 参考訳(メタデータ) (2024-10-31T17:22:30Z) - Grounding Language Models in Autonomous Loco-manipulation Tasks [3.8363685417355557]
異なるシナリオにおけるタスクに基づいて行動を学び、選択し、計画する新しいフレームワークを提案する。
我々は,大規模言語モデル(LLM)の計画と推論機能を活用し,階層的なタスクグラフを構築する。
CENTAUROロボットを用いたシミュレーションおよび実世界の実験により、言語モデルに基づくプランナーが、新しいロコ操作タスクに効率的に適応できることが示されている。
論文 参考訳(メタデータ) (2024-09-02T15:27:48Z) - Track2Act: Predicting Point Tracks from Internet Videos enables Generalizable Robot Manipulation [65.46610405509338]
我々は、ゼロショットロボット操作を可能にする汎用的な目標条件ポリシーを学習することを目指している。
私たちのフレームワークであるTrack2Actは、ゴールに基づいて将来のタイムステップで画像内のポイントがどのように動くかを予測する。
学習したトラック予測を残留ポリシーと組み合わせることで,多種多様な汎用ロボット操作が可能となることを示す。
論文 参考訳(メタデータ) (2024-05-02T17:56:55Z) - Visual Whole-Body Control for Legged Loco-Manipulation [22.50054654508986]
そこで本研究では,ロボットアームを用いた移動操作の問題点について検討する。
視覚的観察により全身制御を自律的に行うことのできる枠組みを提案する。
論文 参考訳(メタデータ) (2024-03-25T17:26:08Z) - Nonprehensile Planar Manipulation through Reinforcement Learning with
Multimodal Categorical Exploration [8.343657309038285]
強化学習はそのようなロボットコントローラを開発するための強力なフレームワークである。
分類分布を用いたマルチモーダル探索手法を提案する。
学習したポリシは外部の障害や観測ノイズに対して堅牢であり、複数のプッシュ器でタスクにスケールできることが示される。
論文 参考訳(メタデータ) (2023-08-04T16:55:00Z) - Learning a Universal Human Prior for Dexterous Manipulation from Human
Preference [35.54663426598218]
本稿では,ビデオ上での人間の嗜好を直接フィードバックすることで,人類の普遍性を学習するフレームワークを提案する。
多様な警察を反復的に生成し、軌道上の人間の嗜好を収集することにより、タスクに依存しない報酬モデルを訓練する。
提案手法は,ロボットの手の動作を,目に見えないタスクを含む多様なタスクで実証的に示す。
論文 参考訳(メタデータ) (2023-04-10T14:17:33Z) - Lifelong Robotic Reinforcement Learning by Retaining Experiences [61.79346922421323]
多くのマルチタスク強化学習は、ロボットが常にすべてのタスクからデータを収集できると仮定している。
本研究では,物理ロボットシステムの実用的制約を動機として,現実的なマルチタスクRL問題について検討する。
我々は、ロボットのスキルセットを累積的に成長させるために、過去のタスクで学んだデータとポリシーを効果的に活用するアプローチを導出する。
論文 参考訳(メタデータ) (2021-09-19T18:00:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。