論文の概要: Learning Generalizable Policy for Obstacle-Aware Autonomous Drone Racing
- arxiv url: http://arxiv.org/abs/2411.04246v1
- Date: Wed, 06 Nov 2024 20:25:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-08 19:37:49.570968
- Title: Learning Generalizable Policy for Obstacle-Aware Autonomous Drone Racing
- Title(参考訳): 障害物を意識した自律型ドローンレースのための一般化可能な政策の学習
- Authors: Yueqian Liu,
- Abstract要約: 本研究は、一般化可能な障害物対応ドローンレースポリシーを開発することの課題に対処する。
本稿では,各ロールアウト前にレーストラックと障害物構成にドメインランダム化を適用することを提案する。
提案したランダム化戦略は、ドローンが最大70km/hの速度に達するシミュレーション実験によって有効であることが示されている。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Autonomous drone racing has gained attention for its potential to push the boundaries of drone navigation technologies. While much of the existing research focuses on racing in obstacle-free environments, few studies have addressed the complexities of obstacle-aware racing, and approaches presented in these studies often suffer from overfitting, with learned policies generalizing poorly to new environments. This work addresses the challenge of developing a generalizable obstacle-aware drone racing policy using deep reinforcement learning. We propose applying domain randomization on racing tracks and obstacle configurations before every rollout, combined with parallel experience collection in randomized environments to achieve the goal. The proposed randomization strategy is shown to be effective through simulated experiments where drones reach speeds of up to 70 km/h, racing in unseen cluttered environments. This study serves as a stepping stone toward learning robust policies for obstacle-aware drone racing and general-purpose drone navigation in cluttered environments. Code is available at https://github.com/ErcBunny/IsaacGymEnvs.
- Abstract(参考訳): 自律型ドローンレースは、ドローンナビゲーション技術の限界を推し進める可能性に注目を集めている。
既存の研究の多くは障害物のない環境でのレースに焦点を当てているが、障害物を意識したレースの複雑さに対処する研究はほとんどない。
この研究は、深層強化学習を用いた一般化可能な障害物対応ドローンレースポリシーを開発するという課題に対処する。
本稿では,各ロールアウト前のレーストラックと障害物構成にドメインランダム化を適用し,ランダム化環境における並列体験収集と組み合わせて目標を達成することを提案する。
提案したランダム化戦略は、ドローンが最大70km/hの速度に達し、目に見えない散らばった環境で走行するシミュレーション実験によって有効であることが示されている。
この研究は、障害物対応ドローンレースと、散らかった環境での汎用ドローンナビゲーションのための堅牢なポリシーを学ぶための足掛かりとなる。
コードはhttps://github.com/ErcBunny/IsaacGymEnvs.comで入手できる。
関連論文リスト
- RACER: Epistemic Risk-Sensitive RL Enables Fast Driving with Fewer Crashes [57.319845580050924]
本稿では,リスク感応制御と適応行動空間のカリキュラムを組み合わせた強化学習フレームワークを提案する。
提案アルゴリズムは,現実世界のオフロード運転タスクに対して,高速なポリシーを学習可能であることを示す。
論文 参考訳(メタデータ) (2024-05-07T23:32:36Z) - Continual Learning for Robust Gate Detection under Dynamic Lighting in Autonomous Drone Racing [27.18598697503772]
本研究は,照明変動下でドローンレースゲートを検出するための認識手法を提案する。
提案手法は,連続学習機能を備えた軽量ニューラルネットワークバックボーンに頼っている。
論文 参考訳(メタデータ) (2024-05-02T07:21:12Z) - WROOM: An Autonomous Driving Approach for Off-Road Navigation [17.74237088460657]
オフロード環境における自動運転車のためのエンドツーエンド強化学習システム(RL)を設計する。
ルールベースのコントローラを模倣してエージェントを温め、PPO(Proximal Policy Optimization)を利用してポリシーを改善する。
オフロード走行シナリオを再現する新しいシミュレーション環境を提案し,本提案手法を実車に展開する。
論文 参考訳(メタデータ) (2024-04-12T23:55:59Z) - A Dual Curriculum Learning Framework for Multi-UAV Pursuit-Evasion in Diverse Environments [15.959963737956848]
本稿では,無人機群が障害物のある制限された環境で高速離着陸機を捕獲するために協力するマルチUAV追跡回避について述べる。
追従回避問題を単純化する既存のアルゴリズムは、しばしば表現力のある協調戦略を欠き、極端なシナリオで回避者を捕まえるのに苦労する。
多様な環境下でのマルチUAV追従回避に対処し,未知のシナリオに対するゼロショット転送能力を実証するデュアルカリキュラム学習フレームワークDualCLを導入する。
論文 参考訳(メタデータ) (2023-12-19T15:39:09Z) - Learning Deep Sensorimotor Policies for Vision-based Autonomous Drone
Racing [52.50284630866713]
既存のシステムは、状態推定、計画、制御のために手作業によるコンポーネントを必要とすることが多い。
本稿では、深層感触者ポリシーを学習することで、視覚に基づく自律ドローンレース問題に取り組む。
論文 参考訳(メタデータ) (2022-10-26T19:03:17Z) - A Walk in the Park: Learning to Walk in 20 Minutes With Model-Free
Reinforcement Learning [86.06110576808824]
深層強化学習は、制御されていない環境での学習ポリシーに対する有望なアプローチである。
機械学習アルゴリズムとライブラリの最近の進歩と、慎重に調整されたロボットコントローラを組み合わせることで、現実世界では4分で学習できる。
論文 参考訳(メタデータ) (2022-08-16T17:37:36Z) - Learning High-Speed Flight in the Wild [101.33104268902208]
複雑な自然環境や人工環境を高速で自律的に飛行するエンド・ツー・エンドのアプローチを提案する。
鍵となる原理は、雑音の知覚観測を直接、後退水平方向に無衝突軌道にマッピングすることである。
現実的なセンサノイズをシミュレートすることにより,シミュレーションから現実環境へのゼロショット転送を実現する。
論文 参考訳(メタデータ) (2021-10-11T09:43:11Z) - Vision-Based Mobile Robotics Obstacle Avoidance With Deep Reinforcement
Learning [49.04274612323564]
障害物回避は、移動ロボットの自律ナビゲーションのための根本的かつ困難な問題です。
本稿では,ロボットが単一眼カメラにのみ依存しなければならない単純な3D環境における障害物回避の問題を検討する。
データ駆動型エンドツーエンドディープラーニングアプローチとして,障害回避問題に取り組む。
論文 参考訳(メタデータ) (2021-03-08T13:05:46Z) - AirSim Drone Racing Lab [56.68291351736057]
AirSim Drone Racing Labは、この領域で機械学習研究を可能にするシミュレーションフレームワークである。
本フレームワークは,複数の写真リアル環境下でのレーストラック生成を可能にする。
当社のフレームワークを使用して,NeurIPS 2019で,シミュレーションベースのドローンレースコンペティションを開催しました。
論文 参考訳(メタデータ) (2020-03-12T08:06:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。