論文の概要: GRoQ-Loco: Generalist and Robot-agnostic Quadruped Locomotion Control using Offline Datasets
- arxiv url: http://arxiv.org/abs/2505.10973v2
- Date: Tue, 20 May 2025 09:59:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-21 12:33:37.389192
- Title: GRoQ-Loco: Generalist and Robot-agnostic Quadruped Locomotion Control using Offline Datasets
- Title(参考訳): GRoQ-Loco:オフラインデータセットを用いた汎用的でロボットに依存しない四足歩行制御
- Authors: Narayanan PP, Sarvesh Prasanth Venkatesan, Srinivas Kantha Reddy, Shishir Kolathaya,
- Abstract要約: GRoQ-Locoはスケーラブルで注目度の高いフレームワークで、複数の四足歩行ロボットと地形をまたいだ1つの汎用的なロコモーションポリシーを学習する。
本フレームワークは,ロボット固有のエンコーディングを組み込まずに,すべてのロボットからの固有受容データを直接操作する。
我々の実験は、高度に多様な四足歩行ロボットと地形を横断する強力なゼロショット移動を実証した。
- 参考スコア(独自算出の注目度): 0.8678250057211367
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advancements in large-scale offline training have demonstrated the potential of generalist policy learning for complex robotic tasks. However, applying these principles to legged locomotion remains a challenge due to continuous dynamics and the need for real-time adaptation across diverse terrains and robot morphologies. In this work, we propose GRoQ-Loco, a scalable, attention-based framework that learns a single generalist locomotion policy across multiple quadruped robots and terrains, relying solely on offline datasets. Our approach leverages expert demonstrations from two distinct locomotion behaviors - stair traversal (non-periodic gaits) and flat terrain traversal (periodic gaits) - collected across multiple quadruped robots, to train a generalist model that enables behavior fusion for both behaviors. Crucially, our framework operates directly on proprioceptive data from all robots without incorporating any robot-specific encodings. The policy is directly deployable on an Intel i7 nuc, producing low-latency control outputs without any test-time optimization. Our extensive experiments demonstrate strong zero-shot transfer across highly diverse quadruped robots and terrains, including hardware deployment on the Unitree Go1, a commercially available 12kg robot. Notably, we evaluate challenging cross-robot training setups where different locomotion skills are unevenly distributed across robots, yet observe successful transfer of both flat walking and stair traversal behaviors to all robots at test time. We also show preliminary walking on Stoch 5, a 70kg quadruped, on flat and outdoor terrains without requiring any fine tuning. These results highlight the potential for robust generalist locomotion across diverse robots and terrains.
- Abstract(参考訳): 大規模オフライントレーニングの最近の進歩は、複雑なロボットタスクに対する一般政策学習の可能性を示している。
しかし、これらの原理を足の移動に適用することは、連続力学と多様な地形やロボット形態にまたがるリアルタイム適応の必要性のため、依然として課題である。
本研究で提案するGRoQ-Locoは,複数の四足歩行ロボットと地形にまたがる1つの汎用的なロコモーションポリシを学習し,オフラインデータセットのみに依存する,スケーラブルでアテンションベースのフレームワークである。
提案手法は,複数の四足歩行ロボットにまたがる階段走行(非周期歩行)と平坦地形走行(周期歩行)という,2つの異なる移動行動の専門的なデモンストレーションを活用し,両動作の挙動融合を可能にするジェネリストモデルを訓練する。
重要なことは、我々のフレームワークは、ロボット固有のエンコーディングを組み込まずに、すべてのロボットからの固有受容データを直接操作する。
このポリシーはIntel i7 nucに直接デプロイ可能で、テストタイムの最適化なしに低遅延制御出力を生成する。
われわれの大規模な実験では、高度に多様な四足歩行ロボットと地形をまたいだ強力なゼロショット転送が実証されており、商業的に利用可能な12kgのロボットであるUnitree Go1のハードウェア展開も行われた。
特に,ロボット間で異なる移動スキルを均等に分散させる難易度の高いクロスロボットトレーニングシステムの評価を行った。
また、70kg四足歩行のStoch 5では、微調整を必要とせず、平地と屋外の地形で予備歩行を行ないました。
これらの結果は、多様なロボットや地形にまたがる堅牢なジェネラリストの移動の可能性を強調している。
関連論文リスト
- Scaling Cross-Embodied Learning: One Policy for Manipulation, Navigation, Locomotion and Aviation [49.03165169369552]
さまざまな種類のロボットにまたがって単一のポリシーを訓練することによって、ロボット学習はより広範囲で多様なデータセットを活用することができる。
そこで我々はCrossFormerを提案する。CrossFormerはスケーラブルでフレキシブルなトランスフォーマーベースのポリシーで、どんな実施形態からでもデータを消費できる。
我々は、同じネットワークウェイトがシングルアームとデュアルアームの操作システム、車輪付きロボット、クワッドコプター、四足歩行など、非常に異なるロボットを制御できることを実証した。
論文 参考訳(メタデータ) (2024-08-21T17:57:51Z) - Learning Visual Quadrupedal Loco-Manipulation from Demonstrations [36.1894630015056]
我々は四足歩行ロボットに、足だけを使って現実世界の操作タスクを実行させることを目標としている。
我々はロコ操作プロセスを低レベル強化学習(RL)ベースのコントローラと高レベル行動クローン(BC)ベースのプランナに分解する。
提案手法はシミュレーションや実世界の実験を通じて検証され,移動性や高精度なタスクをロボットが実行できることが実証された。
論文 参考訳(メタデータ) (2024-03-29T17:59:05Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Barkour: Benchmarking Animal-level Agility with Quadruped Robots [70.97471756305463]
脚付きロボットのアジリティを定量化するための障害物コースであるBarkourベンチマークを導入する。
犬の機敏性の競争に触発され、様々な障害と時間に基づくスコアリング機構から構成される。
ベンチマークに対処する2つの方法を提案する。
論文 参考訳(メタデータ) (2023-05-24T02:49:43Z) - Learning Bipedal Walking for Humanoids with Current Feedback [5.429166905724048]
アクチュエータレベルでの不正確なトルクトラッキングから生じるヒューマノイドロボットのシム2リアルギャップ問題を克服するためのアプローチを提案する。
提案手法は、実際のHRP-5Pヒューマノイドロボットに展開して二足歩行を実現するシミュレーションにおいて、一貫したエンドツーエンドのポリシーをトレーニングする。
論文 参考訳(メタデータ) (2023-03-07T08:16:46Z) - GenLoco: Generalized Locomotion Controllers for Quadrupedal Robots [87.32145104894754]
四足歩行ロボットのための汎用ロコモーション(GenLoco)コントローラを訓練するためのフレームワークを提案する。
本フレームワークは,多種多様な四足歩行ロボットに展開可能な汎用ロコモーションコントローラを合成する。
我々のモデルは、より一般的な制御戦略を取得し、新しいシミュレーションロボットや実世界のロボットに直接移行できることを示す。
論文 参考訳(メタデータ) (2022-09-12T15:14:32Z) - Learning Quadrupedal Locomotion over Challenging Terrain [68.51539602703662]
足の移動はロボティクスの操作領域を劇的に拡張することができる。
足の移動のための従来のコントローラーは、運動プリミティブと反射の実行を明示的にトリガーする精巧な状態マシンに基づいている。
ここでは、自然環境に挑戦する際の足の移動に対して、徹底的に頑健な制御器を提案する。
論文 参考訳(メタデータ) (2020-10-21T19:11:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。