論文の概要: Co-jump: Cooperative Jumping with Quadrupedal Robots via Multi-Agent Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2602.10514v1
- Date: Wed, 11 Feb 2026 04:28:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-12 21:44:01.465633
- Title: Co-jump: Cooperative Jumping with Quadrupedal Robots via Multi-Agent Reinforcement Learning
- Title(参考訳): マルチエージェント強化学習による四足歩行ロボットの協調ジャンプ
- Authors: Shihao Dong, Yeke Chen, Zeren Luo, Jiahui Zhang, Bowen Xu, Jinghan Lin, Yimin Han, Ji Ma, Zhiyou Yu, Yudong Zhao, Peng Lu,
- Abstract要約: コジャンプ(co-jump)は、2つの四足歩行ロボットが単独でジャンプを行うという協調作業である。
我々は,このタスクの高インパルス接触ダイナミクスを,明示的なコミュニケーションや事前定義された動作プリミティブを伴わずに同期する分散環境下で取り組んだ。
ロボットの1つが1.1mの高さを達成しており、スタンドアローンの四足歩行ロボットの0.45mのジャンプ高よりも144%向上している。
- 参考スコア(独自算出の注目度): 20.562583114049747
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While single-agent legged locomotion has witnessed remarkable progress, individual robots remain fundamentally constrained by physical actuation limits. To transcend these boundaries, we introduce Co-jump, a cooperative task where two quadrupedal robots synchronize to execute jumps far beyond their solo capabilities. We tackle the high-impulse contact dynamics of this task under a decentralized setting, achieving synchronization without explicit communication or pre-specified motion primitives. Our framework leverages Multi-Agent Proximal Policy Optimization (MAPPO) enhanced by a progressive curriculum strategy, which effectively overcomes the sparse-reward exploration challenges inherent in mechanically coupled systems. We demonstrate robust performance in simulation and successful transfer to physical hardware, executing multi-directional jumps onto platforms up to 1.5 m in height. Specifically, one of the robots achieves a foot-end elevation of 1.1 m, which represents a 144% improvement over the 0.45 m jump height of a standalone quadrupedal robot, demonstrating superior vertical performance. Notably, this precise coordination is achieved solely through proprioceptive feedback, establishing a foundation for communication-free collaborative locomotion in constrained environments.
- Abstract(参考訳): 片足歩行は目覚ましい進歩をみせているが、個々のロボットは運動制限によって基本的に拘束されている。
これらの境界を超越するために,2つの四足歩行ロボットが単独でジャンプを行うという協調作業であるCo-jumpを導入する。
我々は,このタスクの高インパルス接触ダイナミクスを,明示的なコミュニケーションや事前定義された動作プリミティブを伴わずに同期する分散環境下で取り組んだ。
本フレームワークは,機械的結合システムに係わるスパース・リワード探索を効果的に克服する,プログレッシブカリキュラム戦略によって強化されたマルチエージェント・プロキシ・ポリシー・オプティマイズ(MAPPO)を活用する。
シミュレーションにおける堅牢な性能と物理ハードウェアへの移行を実証し,最大1.5mのプラットフォームへの多方向ジャンプを実行した。
具体的には、立方体四脚ロボットの跳躍高さ0.45mに対して144%向上した1.1mの高さを実現し、より優れた垂直性能を示す。
特に、この正確な調整は、プロプリセプティブなフィードバックによってのみ達成され、制約された環境でのコミュニケーションのない協調的な移動の基礎を確立する。
関連論文リスト
- RobotDancing: Residual-Action Reinforcement Learning Enables Robust Long-Horizon Humanoid Motion Tracking [50.200035833530876]
RobotDancingはシンプルでスケーラブルなフレームワークで、残留する関節の目標を予測して、ダイナミックスの不一致を明示的に修正する。
複数分間の高エネルギー動作(ジャンプ、スピン、カートホイール)をトラッキングし、高いモーショントラッキング品質のハードウェアにゼロショットをデプロイする。
論文 参考訳(メタデータ) (2025-09-25T03:30:34Z) - GRoQ-LoCO: Generalist and Robot-agnostic Quadruped Locomotion Control using Offline Datasets [0.8678250057211367]
GRoQ-LoCOはスケーラブルで注目度の高いフレームワークで、複数の四足歩行ロボットと地形をまたいだ1つの汎用的なロコモーションポリシーを学習する。
我々のフレームワークは、ロボット固有のエンコーディングを組み込まずに、すべてのロボットからの保護的データのみを運用する。
その結果、オフラインでデータ駆動学習により、様々な4つの形態や行動にまたがる移動を一般化する可能性が示された。
論文 参考訳(メタデータ) (2025-05-16T08:17:01Z) - Humanoid Whole-Body Locomotion on Narrow Terrain via Dynamic Balance and Reinforcement Learning [54.26816599309778]
動的バランスと強化学習(RL)に基づく新しい全身移動アルゴリズムを提案する。
具体的には,ZMP(Zero-Moment Point)駆動の報酬とタスク駆動の報酬を,全身のアクター批判的枠組みで拡張した尺度を活用することで,動的バランス機構を導入する。
フルサイズのUnitree H1-2ロボットによる実験により、非常に狭い地形でのバランスを維持するための手法の有効性が検証された。
論文 参考訳(メタデータ) (2025-02-24T14:53:45Z) - Impedance Matching: Enabling an RL-Based Running Jump in a Quadruped Robot [7.516046071926082]
シミュレーションロボットと現実ロボットのギャップを軽減するための新しい枠組みを提案する。
本フレームワークはパラメータ選択のための構造化ガイドラインとシミュレーションにおける動的ランダム化の範囲を提供する。
結果は、我々の知る限り、実四足歩行ロボットにおいて、RLベースの制御ポリシーによって実証された最も高く、最も長いジャンプの1つです。
論文 参考訳(メタデータ) (2024-04-23T14:52:09Z) - Barkour: Benchmarking Animal-level Agility with Quadruped Robots [70.97471756305463]
脚付きロボットのアジリティを定量化するための障害物コースであるBarkourベンチマークを導入する。
犬の機敏性の競争に触発され、様々な障害と時間に基づくスコアリング機構から構成される。
ベンチマークに対処する2つの方法を提案する。
論文 参考訳(メタデータ) (2023-05-24T02:49:43Z) - Robust and Versatile Bipedal Jumping Control through Reinforcement
Learning [141.56016556936865]
この研究は、トルク制御された二足歩行ロボットが実世界で頑丈で多目的なダイナミックジャンプを行えるようにすることで、二足歩行ロボットの機敏さの限界を推し進めることを目的としている。
本稿では,ロボットが様々な場所や方向へジャンプするなど,さまざまなジャンプタスクを達成するための強化学習フレームワークを提案する。
我々は,ロボットの長期入出力(I/O)履歴を符号化し,短期I/O履歴への直接アクセスを可能にする新しいポリシー構造を開発する。
論文 参考訳(メタデータ) (2023-02-19T01:06:09Z) - Robust Quadruped Jumping via Deep Reinforcement Learning [10.095966161524043]
本稿では,騒音環境下での四足歩行ロボットのジャンプ距離と高さについて考察する。
本研究では,4重跳躍のための非線形軌道最適化の複雑な解を活用・拡張するディープ強化学習を用いたフレームワークを提案する。
体長2倍の体長をジャンプしながら、高さ最大6cmの足の障害の頑丈さ、あるいはロボットの名目立位の高さの33%を実証した。
論文 参考訳(メタデータ) (2020-11-13T19:04:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。