論文の概要: Autonomous UAV Navigation: A DDPG-based Deep Reinforcement Learning
Approach
- arxiv url: http://arxiv.org/abs/2003.10923v1
- Date: Sat, 21 Mar 2020 19:33:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-21 12:40:13.038451
- Title: Autonomous UAV Navigation: A DDPG-based Deep Reinforcement Learning
Approach
- Title(参考訳): 自律型uavナビゲーション: ddpgに基づく深層強化学習アプローチ
- Authors: Omar Bouhamed, Hakim Ghazzai, Hichem Besbes and Yehia Massoud
- Abstract要約: 深層強化学習を用いた自律型UAV経路計画フレームワークを提案する。
目的は、自力で訓練されたUAVを空飛ぶ移動体ユニットとして使用し、空間的に分散した移動または静的な目標に到達することである。
- 参考スコア(独自算出の注目度): 1.552282932199974
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose an autonomous UAV path planning framework using
deep reinforcement learning approach. The objective is to employ a self-trained
UAV as a flying mobile unit to reach spatially distributed moving or static
targets in a given three dimensional urban area. In this approach, a Deep
Deterministic Policy Gradient (DDPG) with continuous action space is designed
to train the UAV to navigate through or over the obstacles to reach its
assigned target. A customized reward function is developed to minimize the
distance separating the UAV and its destination while penalizing collisions.
Numerical simulations investigate the behavior of the UAV in learning the
environment and autonomously determining trajectories for different selected
scenarios.
- Abstract(参考訳): 本稿では,深部強化学習を用いた自律型UAV経路計画フレームワークを提案する。
本研究の目的は,空飛ぶ移動体として自力で訓練されたUAVを用いて,所定の3次元都市部において空間分布の移動や静的な目標に到達することである。
このアプローチでは、連続的な行動空間を持つDeep Deterministic Policy Gradient (DDPG) が、UAVに障害物を通り抜けるか、あるいは越えて、割り当てられた目標に到達するよう訓練するように設計されている。
衝突をペナルティ化しながら、UAVと目的地を分離する距離を最小限に抑えるために、カスタマイズされた報酬関数が開発された。
数値シミュレーションは、環境学習におけるUAVの挙動と、選択したシナリオに対する自律的に軌道を決定する。
関連論文リスト
- Autonomous Decision Making for UAV Cooperative Pursuit-Evasion Game with Reinforcement Learning [50.33447711072726]
本稿では,マルチロールUAV協調追従ゲームにおける意思決定のための深層強化学習モデルを提案する。
提案手法は,追従回避ゲームシナリオにおけるUAVの自律的意思決定を可能にする。
論文 参考訳(メタデータ) (2024-11-05T10:45:30Z) - Anti-Jamming Path Planning Using GCN for Multi-UAV [0.0]
UAVスワーミングの有効性は、ジャミング技術によって著しく損なわれる可能性がある。
UAV群集が集団知能を利用してジャム領域を予測する手法が提案されている。
マルチエージェント制御アルゴリズムを使用して、UAVスワムを分散し、ジャミングを回避し、ターゲットに到達すると再グループ化する。
論文 参考訳(メタデータ) (2024-03-13T07:28:05Z) - UAV Obstacle Avoidance by Human-in-the-Loop Reinforcement in Arbitrary
3D Environment [17.531224704021273]
本稿では, 深部強化学習に基づく無人航空機(UAV)の連続制御に着目した。
本稿では,UAVが飛行中の障害物を自動的に回避できる深層強化学習(DRL)法を提案する。
論文 参考訳(メタデータ) (2023-04-07T01:44:05Z) - A deep reinforcement learning approach to assess the low-altitude
airspace capacity for urban air mobility [0.0]
都市空力は、低高度空域を利用して高速で安全な旅行手段を提供することを目的としている。
当局は現在も、都市空輸に適用される新しい飛行規則の見直しに取り組んでいる。
深い強化学習アプローチと深い決定論的政策勾配アルゴリズムを用いて,自律型UAV経路計画フレームワークを提案する。
論文 参考訳(メタデータ) (2023-01-23T23:38:05Z) - Trajectory Design for UAV-Based Internet-of-Things Data Collection: A
Deep Reinforcement Learning Approach [93.67588414950656]
本稿では,無人航空機(UAV)による3D環境におけるIoT(Internet-of-Things)システムについて検討する。
本稿では,TD3-TDCTMアルゴリズムの完成時間最小化のためのトラジェクトリ設計を提案する。
シミュレーションの結果,従来の3つの非学習ベースライン法よりもTD3-TDCTMアルゴリズムの方が優れていることが示された。
論文 参考訳(メタデータ) (2021-07-23T03:33:29Z) - A Multi-UAV System for Exploration and Target Finding in Cluttered and
GPS-Denied Environments [68.31522961125589]
複雑なGPSを用いた複雑な環境において,UAVのチームが協調して目標を探索し,発見するための枠組みを提案する。
UAVのチームは自律的にナビゲートし、探索し、検出し、既知の地図で散らばった環境でターゲットを見つける。
その結果, 提案方式は, 時間的コスト, 調査対象地域の割合, 捜索・救助ミッションの成功率などの面で改善されていることがわかった。
論文 参考訳(メタデータ) (2021-07-19T12:54:04Z) - 3D UAV Trajectory and Data Collection Optimisation via Deep
Reinforcement Learning [75.78929539923749]
無人航空機(UAV)は現在、無線通信におけるネットワーク性能とカバレッジを高めるために配備され始めている。
UAV支援モノのインターネット(IoT)のための最適な資源配分方式を得ることは困難である
本稿では,UAVの最も短い飛行経路に依存しつつ,IoTデバイスから収集したデータ量を最大化しながら,新しいUAV支援IoTシステムを設計する。
論文 参考訳(メタデータ) (2021-06-06T14:08:41Z) - Efficient UAV Trajectory-Planning using Economic Reinforcement Learning [65.91405908268662]
UAV間でタスクを分散するための経済取引に触発された新しい強化学習アルゴリズムであるREPlannerを紹介します。
エージェントが協力し、リソースを競うことができるマルチエージェント経済ゲームとして、パス計画問題を策定します。
UAV協力によるタスク分布の計算を行うため、Swarmサイズの変化に対して非常に耐性が高い。
論文 参考訳(メタデータ) (2021-03-03T20:54:19Z) - Motion Planning by Reinforcement Learning for an Unmanned Aerial Vehicle
in Virtual Open Space with Static Obstacles [3.5356468463540214]
静的障害物のあるオープンスペースにおける無人航空機(UAV)の動作計画に強化学習を適用した。
強化学習が進むにつれて,モデルの平均報酬と目標率が向上した。
論文 参考訳(メタデータ) (2020-09-24T16:42:56Z) - Multi-Agent Deep Reinforcement Learning Based Trajectory Planning for
Multi-UAV Assisted Mobile Edge Computing [99.27205900403578]
無人航空機(UAV)支援移動エッジコンピューティング(MEC)フレームワークを提案する。
我々は,全ユーザ機器(UE)の地理的公正性と,各UAVのUE負荷の公平性を共同で最適化することを目的としている。
提案手法は他の従来のアルゴリズムよりもかなり性能が高いことを示す。
論文 参考訳(メタデータ) (2020-09-23T17:44:07Z) - Reinforcement Learning for UAV Autonomous Navigation, Mapping and Target
Detection [36.79380276028116]
本研究では,無人航空機(UAV)に低高度レーダーを装備し,未知の環境下での飛行における共同検出・マッピング・ナビゲーション問題について検討する。
目的は、マッピング精度を最大化する目的で軌道を最適化することであり、目標検出の観点からは、測定が不十分な領域を避けることである。
論文 参考訳(メタデータ) (2020-05-05T20:39:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。