論文の概要: Asymmetric physics enables efficient learning in quadrupedal robot swarms
- arxiv url: http://arxiv.org/abs/2606.23153v1
- Date: Mon, 22 Jun 2026 10:58:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 23:47:57.32795
- Title: Asymmetric physics enables efficient learning in quadrupedal robot swarms
- Title(参考訳): 非対称物理学は四足歩行ロボット群における効率的な学習を可能にする
- Authors: Yuang Zhang, Yunlong Song, Zhihao He, Zelin Ni, Kangyu Wang, Tianchi Liu, Yu Hu, Feng Yu, Danping Zou, Weiyao Lin,
- Abstract要約: 四足歩行ロボットの大群において、非対称物理学は視覚に基づく分散制御を効果的にエンド・ツー・エンドで学習できることを示す。
訓練中、四足歩行は共有環境で相互作用し、シミュレーターはリアルな動きと接触ダイナミクスを生成する。
この分離により、最大512人の四足歩行者が障害物の多い環境で調整されたナビゲーションポリシーを学ぶことができる。
- 参考スコア(独自算出の注目度): 26.125719459588876
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Animal collectives navigate cluttered environments through local coordination, yet robot swarms still struggle to reproduce this capability in the physical world. End-to-end learning offers a route to such coordination, but scaling it to embodied swarms remains difficult: standard sampling-based reinforcement learning becomes inefficient when visual perception, dense robot-robot interaction, and contact-rich locomotion must be learned together. Here we show that asymmetric physics enables efficient end-to-end learning of vision-based, decentralized control in large swarms of quadrupedal robots. During training, quadrupeds interact in shared environments, where a high-fidelity, non-differentiable simulator generates realistic motion and contact dynamics, and differentiable surrogate models provide gradients for navigation and locomotion policies. This separation enables up to 512 quadrupeds to learn coordinated navigation policies in obstacle-rich environments. At deployment, each robot acts from a single forward-facing depth camera, without explicit communication, centralized planning, or global maps. The policies generalize across forests, bridges, enclosures, narrow passages, and mazes, and zero-shot transfer to six physical quadrupeds across five real-world scenarios. The resulting swarms exhibit predictive avoidance, right-side yielding, pausing before bottlenecks, and wall following, showing that asymmetric physics enables efficient training of scalable decentralized control policies for quadrupedal robot swarms.
- Abstract(参考訳): 動物集団は、局所的な調整を通じて散らばった環境をナビゲートするが、ロボット群は物理的な世界でこの能力を再現するのに依然として苦労している。
標準的なサンプリングベースの強化学習は、視覚的知覚、密集したロボットとロボットの相互作用、そして接触に富んだ移動を一緒に学ばなければならないときに非効率になる。
ここでは、非対称物理学は、四足歩行ロボットの大群における視覚に基づく分散制御の効率的なエンドツーエンド学習を可能にすることを示す。
訓練中、四重極は共有環境で相互作用し、高忠実で非微分可能シミュレータは現実的な動きと接触ダイナミクスを発生させ、微分可能サロゲートモデルはナビゲーションと移動ポリシーの勾配を提供する。
この分離により、最大512人の四足歩行者が障害物の多い環境で調整されたナビゲーションポリシーを学ぶことができる。
展開時に各ロボットは、明示的なコミュニケーション、集中型計画、グローバルマップなしで、単一の前方の奥行きカメラから行動する。
この方針は、森林、橋、囲い、狭い通路、迷路にまたがって一般化され、5つの現実世界のシナリオで6つの物理的四足歩行にゼロショット転送される。
得られたSwarmは、予測回避、右利得、ボトルネック前舗装、壁面追従を示し、非対称物理学は四足歩行ロボットSwarmのスケーラブルな分散制御ポリシーの効率的なトレーニングを可能にすることを示した。
関連論文リスト
- Learning Whole-Body Control for a Salamander Robot [1.321203201549798]
サラマンダーに触発された両生類脚ロボットは、複雑な水陸両生環境における応用を約束している。
多くのサンショウウオロボットは、中心パターンジェネレータ(CPG)をベースとし、ロコモーション制御のためのモデルベースコーディネート戦略に頼っていた。
強化学習(Reinforcement Learning)を用いて、主観的観察をマッピングし、共同レベルの行動に速度を指示することで、協調した運動行動が出現する。
論文 参考訳(メタデータ) (2026-03-17T15:43:15Z) - Role-Adaptive Collaborative Formation Planning for Team of Quadruped Robots in Cluttered Environments [15.679419362625845]
本稿では,四足歩行ロボットのための役割適応型リーダ・フォロワー型構成計画・制御フレームワークを提案する。
固定的なリーダーや堅固な構成の役割を持つ従来の手法とは異なり、提案手法は動的役割割り当てと部分的な目標計画を統合している。
その結果、複雑で非構造的な環境での円滑な調整、適応的な役割の切り替え、ロバストな構成維持が示された。
論文 参考訳(メタデータ) (2026-02-20T14:44:16Z) - EgoHumanoid: Unlocking In-the-Wild Loco-Manipulation with Robot-Free Egocentric Demonstration [67.13034606664333]
EgoHumanoidは、エゴセントリックな人間のデモを使って視覚言語アクションポリシーを共同訓練する最初のフレームワークである。
スケーラブルな人的データ収集のためのポータブルシステムを開発した。
論文 参考訳(メタデータ) (2026-02-10T18:59:03Z) - Gait-Adaptive Perceptive Humanoid Locomotion with Real-Time Under-Base Terrain Reconstruction [86.53248703859718]
本研究では,地形認識,歩行制御,全身制御を一つの強化学習ポリシーにマージする知覚的移動フレームワークを提案する。
31-DoF、1.65mのヒューマノイドロボットによる実験は、シミュレーションと実世界の両方で堅牢な移動を実証している。
論文 参考訳(メタデータ) (2025-12-08T11:42:41Z) - Towards Immersive Human-X Interaction: A Real-Time Framework for Physically Plausible Motion Synthesis [51.95817740348585]
Human-Xは、様々な実体をまたいだ没入的で物理的に妥当なヒューマンインタラクションを可能にするために設計された、新しいフレームワークである。
本手法は, 自己回帰型反応拡散プランナを用いて, リアルタイムに反応と反応を同時予測する。
我々のフレームワークは、人間とロボットのインタラクションのための仮想現実インターフェースを含む、現実世界のアプリケーションで検証されている。
論文 参考訳(メタデータ) (2025-08-04T06:35:48Z) - GRoQ-LoCO: Generalist and Robot-agnostic Quadruped Locomotion Control using Offline Datasets [0.8678250057211367]
GRoQ-LoCOはスケーラブルで注目度の高いフレームワークで、複数の四足歩行ロボットと地形をまたいだ1つの汎用的なロコモーションポリシーを学習する。
我々のフレームワークは、ロボット固有のエンコーディングを組み込まずに、すべてのロボットからの保護的データのみを運用する。
その結果、オフラインでデータ駆動学習により、様々な4つの形態や行動にまたがる移動を一般化する可能性が示された。
論文 参考訳(メタデータ) (2025-05-16T08:17:01Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Learning Quadrupedal Locomotion over Challenging Terrain [68.51539602703662]
足の移動はロボティクスの操作領域を劇的に拡張することができる。
足の移動のための従来のコントローラーは、運動プリミティブと反射の実行を明示的にトリガーする精巧な状態マシンに基づいている。
ここでは、自然環境に挑戦する際の足の移動に対して、徹底的に頑健な制御器を提案する。
論文 参考訳(メタデータ) (2020-10-21T19:11:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。