論文の概要: One Net to Rule Them All: Domain Randomization in Quadcopter Racing Across Different Platforms
- arxiv url: http://arxiv.org/abs/2504.21586v1
- Date: Wed, 30 Apr 2025 12:44:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-09 18:52:42.413344
- Title: One Net to Rule Them All: Domain Randomization in Quadcopter Racing Across Different Platforms
- Title(参考訳): クアッドコプターレースにおけるドメインランダム化
- Authors: Robin Ferede, Till Blaha, Erin Lucassen, Christophe De Wagter, Guido C. H. E. de Croon,
- Abstract要約: この研究は、物理的に異なるクワッドコプターをまたいで一般化する、ドローンレースのための最初のニューラルネットワークコントローラを提示する。
ドメインランダム化で訓練された1つのネットワークが、様々なクワッドコプターを堅牢に制御できることを実証する。
- 参考スコア(独自算出の注目度): 14.819512554748165
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In high-speed quadcopter racing, finding a single controller that works well across different platforms remains challenging. This work presents the first neural network controller for drone racing that generalizes across physically distinct quadcopters. We demonstrate that a single network, trained with domain randomization, can robustly control various types of quadcopters. The network relies solely on the current state to directly compute motor commands. The effectiveness of this generalized controller is validated through real-world tests on two substantially different crafts (3-inch and 5-inch race quadcopters). We further compare the performance of this generalized controller with controllers specifically trained for the 3-inch and 5-inch drone, using their identified model parameters with varying levels of domain randomization (0%, 10%, 20%, 30%). While the generalized controller shows slightly slower speeds compared to the fine-tuned models, it excels in adaptability across different platforms. Our results show that no randomization fails sim-to-real transfer while increasing randomization improves robustness but reduces speed. Despite this trade-off, our findings highlight the potential of domain randomization for generalizing controllers, paving the way for universal AI controllers that can adapt to any platform.
- Abstract(参考訳): 高速クアッドコプターレースでは、異なるプラットフォームでうまく機能する単一のコントローラーを見つけることは依然として難しい。
この研究は、物理的に異なるクワッドコプターをまたいで一般化する、ドローンレースのための最初のニューラルネットワークコントローラを提示する。
ドメインランダム化で訓練された1つのネットワークが、様々なクワッドコプターを堅牢に制御できることを実証する。
ネットワークは、モーターコマンドを直接計算するために、現在の状態にのみ依存する。
この一般化されたコントローラーの有効性は、2つの実質的に異なる3インチおよび5インチのレースクアッドコプターの実際のテストによって検証される。
さらに,この汎用コントローラの性能を,ドメインランダム化のレベルが異なるモデルパラメータ(0%,10%,20%,30%)を用いて,3インチおよび5インチドローン用に特別に訓練されたコントローラと比較した。
一般化されたコントローラは、微調整されたモデルに比べてわずかに遅い速度を示すが、異なるプラットフォーム間の適応性が優れている。
ランダム化の増加はロバスト性を向上させるが,速度を低下させる。
このトレードオフにもかかわらず、我々の発見は、汎用コントローラのためのドメインランダム化の可能性を強調し、任意のプラットフォームに適応可能なユニバーサルAIコントローラへの道を開いた。
関連論文リスト
- MULE: Multi-terrain and Unknown Load Adaptation for Effective Quadrupedal Locomotion [1.479858319622657]
四足歩行ロボットは、様々な地形にまたがる荷積み作業にますます利用されている。
本研究では,四足歩行ロボットが様々なペイロードと多様な地形に適応できる適応強化学習フレームワークを提案する。
提案手法はIsaac Gymの大規模シミュレーション実験と,Unitree Go1の4倍体上での実際のハードウェア展開により検証する。
論文 参考訳(メタデータ) (2025-05-01T12:41:35Z) - Autonomous Vehicle Controllers From End-to-End Differentiable Simulation [60.05963742334746]
そこで我々は,AVコントローラのトレーニングにAPG(analytic Policy gradients)アプローチを適用可能なシミュレータを提案し,その設計を行う。
提案するフレームワークは, エージェントがより根底的なポリシーを学ぶのを助けるために, 環境力学の勾配を役立てる, エンド・ツー・エンドの訓練ループに, 微分可能シミュレータを組み込む。
ダイナミクスにおけるパフォーマンスとノイズに対する堅牢性の大幅な改善と、全体としてより直感的なヒューマンライクな処理が見られます。
論文 参考訳(メタデータ) (2024-09-12T11:50:06Z) - BiRoDiff: Diffusion policies for bipedal robot locomotion on unseen terrains [0.9480364746270075]
未知の地形での移動は、二足歩行ロボットが新しい現実世界の課題に対処するために不可欠である。
複数の地形を移動させる単一の歩行制御系を学習する軽量なフレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-07T16:03:33Z) - Learning a Stable, Safe, Distributed Feedback Controller for a Heterogeneous Platoon of Autonomous Vehicles [5.289123253466164]
異種小隊のための安定で安全な分散制御系を学習するためのアルゴリズムを提案する。
シミュレーションで自律小隊を訓練し、4台のF110車両からなる小隊によるハードウェアの性能評価を行う。
論文 参考訳(メタデータ) (2024-04-18T19:11:34Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Learning a Single Near-hover Position Controller for Vastly Different
Quadcopters [56.37274861303324]
本稿では,クワッドコプターのための適応型ニアホバー位置制御器を提案する。
これは、非常に異なる質量、大きさ、運動定数を持つクワッドコプターに展開することができる。
また、実行中に未知の障害に迅速に適応する。
論文 参考訳(メタデータ) (2022-09-19T17:55:05Z) - GenLoco: Generalized Locomotion Controllers for Quadrupedal Robots [87.32145104894754]
四足歩行ロボットのための汎用ロコモーション(GenLoco)コントローラを訓練するためのフレームワークを提案する。
本フレームワークは,多種多様な四足歩行ロボットに展開可能な汎用ロコモーションコントローラを合成する。
我々のモデルは、より一般的な制御戦略を取得し、新しいシミュレーションロボットや実世界のロボットに直接移行できることを示す。
論文 参考訳(メタデータ) (2022-09-12T15:14:32Z) - Adapting Rapid Motor Adaptation for Bipedal Robots [73.5914982741483]
移動制御の急速な適応の最近の進歩を活用し、二足歩行ロボットで作業できるように拡張する。
A-RMAはモデルフリーRLを用いて微調整することで不完全外部推定器の基本方針を適応する。
シミュレーションにおいて,A-RMAはRLベースのベースラインコントローラやモデルベースコントローラよりも優れていることを示す。
論文 参考訳(メタデータ) (2022-05-30T17:59:09Z) - Learning multiple gaits of quadruped robot using hierarchical
reinforcement learning [9.60618440185329]
本研究では,速度コマンドを追従しながら複数の歩行を生成できる四足歩行ロボットの階層型制御器を提案する。
実験の結果,1) 特定の速度範囲に対する最適歩行の存在,2) 一つのポリシーからなる制御器と比較して階層的な制御器の効率性が示された。
論文 参考訳(メタデータ) (2021-12-09T07:45:25Z) - Optimizing Mixed Autonomy Traffic Flow With Decentralized Autonomous
Vehicles and Multi-Agent RL [63.52264764099532]
本研究では、完全分散制御方式を用いて、混合自律環境でのボトルネックのスループットを向上させる自動運転車の能力について検討する。
この問題にマルチエージェント強化アルゴリズムを適用し、5%の浸透速度で20%から40%の浸透速度で33%までのボトルネックスループットの大幅な改善が達成できることを実証した。
論文 参考訳(メタデータ) (2020-10-30T22:06:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。