論文の概要: MuJoCo-Drones-Gym: A GPU-Accelerated Multi-Drone Simulator for Control and Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2606.08039v1
- Date: Sat, 06 Jun 2026 07:59:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:05.685229
- Title: MuJoCo-Drones-Gym: A GPU-Accelerated Multi-Drone Simulator for Control and Reinforcement Learning
- Title(参考訳): MuJoCo-Drones-Gym: 制御と強化学習のためのGPU加速マルチDroneシミュレータ
- Authors: Manan Tayal,
- Abstract要約: MuJoCo-Drones-Gymは、MuJoCo物理エンジン上に構築されたオープンソースのGymnasium互換のマルチドローン環境である。
環境設計、基礎となる物理、クワッドコプターの力学について述べ、制御と学習の例を通してその使い方を説明する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Robotic simulators are a cornerstone of modern research in aerial robotics, serving both as a vehicle for the development of new control algorithms and as the data source for training reinforcement learning (RL) policies. Yet, existing quadcopter learning environments often face a trade-off between physical fidelity, multi-agent support, and the throughput required by modern deep RL pipelines. In this paper, we present MuJoCo-Drones-Gym, an open-source Gymnasium-compatible multi-drone environment built on top of the MuJoCo physics engine. MuJoCo-Drones-Gym supports an arbitrary number of Bitcraze Crazyflie 2.x nano-quadcopters and exposes a modular API for selecting (i)~the physics model (rigid-body MuJoCo, explicit Python dynamics, or any subset of ground effect, blade drag, and inter-drone downwash), (ii)~the action interface (per-motor RPMs, collective normalized thrust, velocity setpoints, or PID waypoint commands), and (iii)~the observation space (kinematic state vectors, RGB / depth / segmentation cameras, or neighbourhood adjacency information). A PettingZoo ParallelEnv wrapper enables drop-in multi-agent reinforcement learning, while a suite of seven task environments, hover, velocity tracking, multi-drone hover, waypoint navigation, formation flight, gate racing, and a generic multi-agent template, demonstrates the breadth of the interface. We describe the environment design, the underlying physics and quadcopter dynamics, and illustrate its use through control and learning examples that mirror those of the closely related gym-pybullet-drones project, while taking advantage of MuJoCo's improved contact handling, rendering, and parallelizability.
- Abstract(参考訳): ロボットシミュレータは、新しい制御アルゴリズムを開発するための手段としても、強化学習(RL)ポリシーをトレーニングするためのデータソースとしても機能する。
しかし、既存のクアッドコプター学習環境は、物理的忠実さ、マルチエージェントサポート、そして現代の深層RLパイプラインに必要なスループットのトレードオフに直面していることが多い。
本稿では,MuJoCo物理エンジン上に構築されたオープンソースのGymnasium互換マルチドローン環境であるMuJoCo-Drones-Gymを紹介する。
MuJoCo-Drones-Gymは任意の数のBitcraze Crazyflie 2.xナノクアッドコプターをサポートし、選択のためのモジュールAPIを公開する。
(i)~物理モデル(剛体 MuJoCo、明示的なPythonダイナミックス、あるいは地面効果のサブセット、ブレードドラッグ、およびドローン間ダウンウォッシュ)
(ii)~アクションインターフェース(運動量当たりのRPM、集合正規化推力、速度設定点、PIDウェイポイントコマンド)、
(iii)~観測空間(運動状態ベクトル、RGB/深度/セグメンテーションカメラ、周辺隣接情報)
PettingZoo ParallelEnvラッパーは、マルチエージェント強化学習を可能にする一方で、ホバー、ベロシティトラッキング、マルチドローンホバー、ウェイポイントナビゲーション、フォーメーションフライト、ゲートレース、ジェネリックマルチエージェントテンプレートといった7つのタスク環境からなるスイートは、インターフェースの幅を実証している。
環境設計,基礎となる物理,クアッドコプターのダイナミクスを解説し,MuJoCoのコンタクトハンドリング,レンダリング,並列化性の向上を活用しながら,近縁なジム-ピブルル-ドロンプロジェクトの状況を反映した制御と学習の例を解説する。
関連論文リスト
- VAIC: Vision-Guided Humanoid Agile Object Interaction Control via Decoupled Commands [56.029505206531155]
Vision Guided Agile Interaction Control (VAIC)は、現在のコントローラとヒューマノイドロボットのギャップを埋める統合フレームワークである。
まず、特権教師政策は、正確な物体運動学と正確な環境状態を用いて多様な相互作用スキルを習得する。
第二に、デプロイ可能な学生ポリシーは、全体追跡を複数の軸にまたがる速度目標に置き換えることで、これらの能力を蒸留する。
論文 参考訳(メタデータ) (2026-06-08T09:52:55Z) - How to Model Your Crazyflie Brushless [50.54424040768484]
2025年初め、クラジフリー・ブラシレスが登場し、ブラシレスモーターで推力は約50%向上した。
この研究はクレイジーフリー・ブラシレスの力学モデルを示し、その重要なパラメータを同定する。
ニューラルネットワーク位置制御器を訓練し、バックフリップ制御器を学習することにより、強化学習アプリケーションに適していることを示す。
論文 参考訳(メタデータ) (2026-03-06T06:21:39Z) - Seeing Beyond Views: Multi-View Driving Scene Video Generation with Holistic Attention [61.3281618482513]
高品質なマルチビュー駆動ビデオの合成を目的とした,新しいネットワークであるCogDrivingについて紹介する。
CogDriving は Diffusion Transformer アーキテクチャと holistic-4D attention module を活用し、次元間の同時結合を可能にする。
CogDrivingは、nuScenesバリデーションセットで強力なパフォーマンスを示し、FVDスコア37.8を達成し、リアルなドライビングビデオを生成する能力を強調している。
論文 参考訳(メタデータ) (2024-12-04T18:02:49Z) - Learning to Fly in Seconds [7.259696592534715]
カリキュラム学習と高度に最適化されたシミュレータが,サンプルの複雑さを増し,学習時間の短縮につながることを示す。
我々のフレームワークは、コンシューマ級ラップトップで18秒のトレーニングをした後、直接制御するためのSimulation-to-Real(Sim2Real)転送を可能にする。
論文 参考訳(メタデータ) (2023-11-22T01:06:45Z) - Learning a Single Near-hover Position Controller for Vastly Different
Quadcopters [56.37274861303324]
本稿では,クワッドコプターのための適応型ニアホバー位置制御器を提案する。
これは、非常に異なる質量、大きさ、運動定数を持つクワッドコプターに展開することができる。
また、実行中に未知の障害に迅速に適応する。
論文 参考訳(メタデータ) (2022-09-19T17:55:05Z) - Learning to Fly -- a Gym Environment with PyBullet Physics for
Reinforcement Learning of Multi-agent Quadcopter Control [0.0]
本稿では,Bullet物理エンジンに基づく複数クワッドコプターのオープンソース環境を提案する。
マルチエージェントおよびビジョンベースの強化学習インターフェース、および現実的な衝突と空力効果のサポートは、私たちの知識の最高に、その種の最初のものにします。
論文 参考訳(メタデータ) (2021-03-03T02:47:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。