論文の概要: Long-Term Planning with Deep Reinforcement Learning on Autonomous Drones
- arxiv url: http://arxiv.org/abs/2007.05694v1
- Date: Sat, 11 Jul 2020 06:16:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-11 12:59:43.217700
- Title: Long-Term Planning with Deep Reinforcement Learning on Autonomous Drones
- Title(参考訳): 自律ドローンの深部強化学習による長期計画
- Authors: Ugurkan Ates
- Abstract要約: 本研究では,実生活におけるドローンレース競技をベースとした長期計画シナリオについて検討する。
この実験は、NeurIPS 2019で"Game of Drones: Drone Racing Competition"のために作成されたフレームワーク上で実施された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we study a long-term planning scenario that is based on drone
racing competitions held in real life. We conducted this experiment on a
framework created for "Game of Drones: Drone Racing Competition" at NeurIPS
2019. The racing environment was created using Microsoft's AirSim Drone Racing
Lab. A reinforcement learning agent, a simulated quadrotor in our case, has
trained with the Policy Proximal Optimization(PPO) algorithm was able to
successfully compete against another simulated quadrotor that was running a
classical path planning algorithm. Agent observations consist of data from IMU
sensors, GPS coordinates of drone obtained through simulation and opponent
drone GPS information. Using opponent drone GPS information during training
helps dealing with complex state spaces, serving as expert guidance allows for
efficient and stable training process. All experiments performed in this paper
can be found and reproduced with code at our GitHub repository
- Abstract(参考訳): 本稿では,実生活で開催されているドローンレース競技に基づく長期計画シナリオについて検討する。
この実験は、NeurIPS 2019で"Game of Drones: Drone Racing Competition"のために作成されたフレームワーク上で実施された。
レース環境はmicrosoftのairsim drone racing labを使って作られた。
強化学習エージェントであるシミュレート・クアドロターは、ppo(policy proximal optimization)アルゴリズムを用いて、古典的な経路計画アルゴリズムを実行していた別のシミュレート・クアドロターとうまく競合することができた。
エージェント観測は、IMUセンサー、シミュレーションによって得られたドローンのGPS座標、反対のドローンGPS情報から成り立っている。
訓練中に反対のドローンGPS情報を使用することで、複雑な状態空間を扱うことができる。
この論文で実施されたすべての実験は、GitHubリポジトリでコードの発見と再現が可能です。
関連論文リスト
- ORBSLAM3-Enhanced Autonomous Toy Drones: Pioneering Indoor Exploration [30.334482597992455]
おもちゃのドローンをGPSのない屋内空間を航行することは、大きな困難を伴っている。
本研究では,単眼式EmphRGBカメラを搭載したドローンに適したリアルタイム屋内探査システムを提案する。
我々のシステムは、最先端のビジョン機能ベースのSLAMであるEmphORB-SLAM3を使用して、おもちゃドローンのローカライゼーションと、マッピングされていない屋内地形のマッピングの両方を処理します。
論文 参考訳(メタデータ) (2023-12-20T19:20:26Z) - Chasing the Intruder: A Reinforcement Learning Approach for Tracking
Intruder Drones [0.08192907805418582]
本研究では、チェッカードローンを用いて侵入者ドローンを識別・追跡するための強化学習に基づくアプローチを提案する。
提案手法は、強化学習の政策学習フレームワークにインターリーブされたコンピュータビジョン技術を用いている。
その結果、強化学習に基づくポリシーは、侵入者ドローンを識別・追跡するために収束していることがわかった。
論文 参考訳(メタデータ) (2023-09-10T16:31:40Z) - Rethinking Closed-loop Training for Autonomous Driving [82.61418945804544]
本研究は,学習エージェントの成功に対する異なるトレーニングベンチマーク設計の影響を分析した最初の実証的研究である。
複数ステップのルックアヘッドで計画を行うRLベースの駆動エージェントであるtrajectory value learning (TRAVL)を提案する。
実験の結果,TRAVLはすべてのベースラインと比較してより速く学習でき,安全な操作が可能であることがわかった。
論文 参考訳(メタデータ) (2023-06-27T17:58:39Z) - Learning Deep Sensorimotor Policies for Vision-based Autonomous Drone
Racing [52.50284630866713]
既存のシステムは、状態推定、計画、制御のために手作業によるコンポーネントを必要とすることが多い。
本稿では、深層感触者ポリシーを学習することで、視覚に基づく自律ドローンレース問題に取り組む。
論文 参考訳(メタデータ) (2022-10-26T19:03:17Z) - TransVisDrone: Spatio-Temporal Transformer for Vision-based
Drone-to-Drone Detection in Aerial Videos [57.92385818430939]
視覚的フィードを用いたドローンからドローンへの検知は、ドローンの衝突の検出、ドローンの攻撃の検出、他のドローンとの飛行の調整など、重要な応用がある。
既存の手法は計算コストがかかり、非エンドツーエンドの最適化に追随し、複雑なマルチステージパイプラインを持つため、エッジデバイス上でのリアルタイムデプロイメントには適さない。
計算効率を向上したエンドツーエンドのソリューションを提供する,シンプルで効果的なフレームワークであるitTransVisDroneを提案する。
論文 参考訳(メタデータ) (2022-10-16T03:05:13Z) - A Deep Reinforcement Learning Strategy for UAV Autonomous Landing on a
Platform [0.0]
物理シミュレーションプラットフォーム(ROS-RL)の一種であるGazeboに基づく強化学習フレームワークを提案する。
我々は,自律着陸問題に対処するために,3つの連続行動空間強化学習アルゴリズムをフレームワークに使用した。
論文 参考訳(メタデータ) (2022-09-07T06:33:57Z) - Dogfight: Detecting Drones from Drones Videos [58.158988162743825]
本稿では,他の飛行ドローンからドローンを検知する問題に対処する。
ソースとターゲットドローンのエロティックな動き、小型、任意の形状、大きな強度、および閉塞は、この問題を非常に困難にします。
これに対処するため,地域提案に基づく手法ではなく,2段階のセグメンテーションに基づく手法を提案する。
論文 参考訳(メタデータ) (2021-03-31T17:43:31Z) - AlphaPilot: Autonomous Drone Racing [47.205375478625776]
このシステムは、2019年のAlphaPilot Challengeという、初の無人ドローンレース世界選手権で成功している。
提案システムは,最大8m/sの速度に達するタイトなレースコースを通じて,ドローンを誘導することに成功した。
論文 参考訳(メタデータ) (2020-05-26T15:45:05Z) - AirSim Drone Racing Lab [56.68291351736057]
AirSim Drone Racing Labは、この領域で機械学習研究を可能にするシミュレーションフレームワークである。
本フレームワークは,複数の写真リアル環境下でのレーストラック生成を可能にする。
当社のフレームワークを使用して,NeurIPS 2019で,シミュレーションベースのドローンレースコンペティションを開催しました。
論文 参考訳(メタデータ) (2020-03-12T08:06:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。