論文の概要: UAV Obstacle Avoidance by Human-in-the-Loop Reinforcement in Arbitrary
3D Environment
- arxiv url: http://arxiv.org/abs/2304.05959v1
- Date: Fri, 7 Apr 2023 01:44:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-16 22:17:18.610287
- Title: UAV Obstacle Avoidance by Human-in-the-Loop Reinforcement in Arbitrary
3D Environment
- Title(参考訳): 任意3次元環境における対人強化によるUAV障害物回避
- Authors: Xuyang Li, Jianwu Fang, Kai Du, Kuizhi Mei, and Jianru Xue
- Abstract要約: 本稿では, 深部強化学習に基づく無人航空機(UAV)の連続制御に着目した。
本稿では,UAVが飛行中の障害物を自動的に回避できる深層強化学習(DRL)法を提案する。
- 参考スコア(独自算出の注目度): 17.531224704021273
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper focuses on the continuous control of the unmanned aerial vehicle
(UAV) based on a deep reinforcement learning method for a large-scale 3D
complex environment. The purpose is to make the UAV reach any target point from
a certain starting point, and the flying height and speed are variable during
navigation. In this work, we propose a deep reinforcement learning (DRL)-based
method combined with human-in-the-loop, which allows the UAV to avoid obstacles
automatically during flying. We design multiple reward functions based on the
relevant domain knowledge to guide UAV navigation. The role of
human-in-the-loop is to dynamically change the reward function of the UAV in
different situations to suit the obstacle avoidance of the UAV better. We
verify the success rate and average step size on urban, rural, and forest
scenarios, and the experimental results show that the proposed method can
reduce the training convergence time and improve the efficiency and accuracy of
navigation tasks. The code is available on the website
https://github.com/Monnalo/UAV_navigation.
- Abstract(参考訳): 本稿では,大規模3次元複合環境のための深部強化学習法に基づく無人航空機(UAV)の継続的な制御に焦点を当てた。
目的は、UAVを特定の出発点から任意の目標地点に到達させることであり、航行中は飛行高度と速度が変動する。
本研究では,UAVが飛行中の障害物を自動的に回避する,深層強化学習(DRL)とループを用いた手法を提案する。
UAVナビゲーションを誘導するために、関連するドメイン知識に基づいて複数の報酬関数を設計する。
ヒューマン・イン・ザ・ループの役割は、異なる状況下でUAVの報酬関数を動的に変更し、UAVの障害物回避に適合させることである。
都市, 農村, 森林シナリオにおける成功率と平均ステップサイズを検証し, 実験結果から, 提案手法は訓練収束時間を短縮し, ナビゲーション作業の効率と精度を向上させることができることが示された。
コードはhttps://github.com/monnalo/uav_navigationで入手できる。
関連論文リスト
- Autonomous Decision Making for UAV Cooperative Pursuit-Evasion Game with Reinforcement Learning [50.33447711072726]
本稿では,マルチロールUAV協調追従ゲームにおける意思決定のための深層強化学習モデルを提案する。
提案手法は,追従回避ゲームシナリオにおけるUAVの自律的意思決定を可能にする。
論文 参考訳(メタデータ) (2024-11-05T10:45:30Z) - Reinforcement learning reward function in unmanned aerial vehicle
control tasks [0.0]
報酬関数は、目標に対する簡易な軌道の時間の構成と推定に基づいている。
新たに開発された仮想環境において,報酬関数の有効性を検証した。
論文 参考訳(メタデータ) (2022-03-20T10:32:44Z) - Advanced Algorithms of Collision Free Navigation and Flocking for
Autonomous UAVs [0.0]
本報告は,マルチUAVシステムの自律走行及び運動調整のためのUAV制御の最先端化に寄与する。
本報告の前半は単UAVシステムを扱うもので, 未知・動的環境における3次元(3次元)衝突フリーナビゲーションの複雑な問題に対処する。
本報告では, マルチUAVシステムの安全ナビゲーションについて述べるとともに, フラッキングと3次元領域カバレッジのための多UAVシステムの分散動作調整手法を開発した。
論文 参考訳(メタデータ) (2021-10-30T03:51:40Z) - Trajectory Design for UAV-Based Internet-of-Things Data Collection: A
Deep Reinforcement Learning Approach [93.67588414950656]
本稿では,無人航空機(UAV)による3D環境におけるIoT(Internet-of-Things)システムについて検討する。
本稿では,TD3-TDCTMアルゴリズムの完成時間最小化のためのトラジェクトリ設計を提案する。
シミュレーションの結果,従来の3つの非学習ベースライン法よりもTD3-TDCTMアルゴリズムの方が優れていることが示された。
論文 参考訳(メタデータ) (2021-07-23T03:33:29Z) - A Multi-UAV System for Exploration and Target Finding in Cluttered and
GPS-Denied Environments [68.31522961125589]
複雑なGPSを用いた複雑な環境において,UAVのチームが協調して目標を探索し,発見するための枠組みを提案する。
UAVのチームは自律的にナビゲートし、探索し、検出し、既知の地図で散らばった環境でターゲットを見つける。
その結果, 提案方式は, 時間的コスト, 調査対象地域の割合, 捜索・救助ミッションの成功率などの面で改善されていることがわかった。
論文 参考訳(メタデータ) (2021-07-19T12:54:04Z) - 3D UAV Trajectory and Data Collection Optimisation via Deep
Reinforcement Learning [75.78929539923749]
無人航空機(UAV)は現在、無線通信におけるネットワーク性能とカバレッジを高めるために配備され始めている。
UAV支援モノのインターネット(IoT)のための最適な資源配分方式を得ることは困難である
本稿では,UAVの最も短い飛行経路に依存しつつ,IoTデバイスから収集したデータ量を最大化しながら,新しいUAV支援IoTシステムを設計する。
論文 参考訳(メタデータ) (2021-06-06T14:08:41Z) - Anti-UAV: A Large Multi-Modal Benchmark for UAV Tracking [59.06167734555191]
Unmanned Aerial Vehicle (UAV)は、商業とレクリエーションの両方に多くの応用を提供している。
我々は、UAVを追跡し、位置や軌道などの豊富な情報を提供するという課題を考察する。
300以上のビデオペアが580k以上の手動で注釈付きバウンディングボックスを含むデータセット、Anti-UAVを提案します。
論文 参考訳(メタデータ) (2021-01-21T07:00:15Z) - Autonomous UAV Navigation: A DDPG-based Deep Reinforcement Learning
Approach [1.552282932199974]
深層強化学習を用いた自律型UAV経路計画フレームワークを提案する。
目的は、自力で訓練されたUAVを空飛ぶ移動体ユニットとして使用し、空間的に分散した移動または静的な目標に到達することである。
論文 参考訳(メタデータ) (2020-03-21T19:33:00Z) - Simultaneous Navigation and Radio Mapping for Cellular-Connected UAV
with Deep Reinforcement Learning [46.55077580093577]
空のUAVに対して、ユビキタスな3Dコミュニケーションを実現するには、新しい課題だ。
本稿では,UAVの制御可能な移動性を利用して航法・軌道を設計する新しい航法手法を提案する。
そこで我々は,UAVの信号計測を深部Qネットワークのトレーニングに用いるSNARM (Concurrent Navigation and Radio Mapping) という新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-17T08:16:14Z) - Learning in the Sky: An Efficient 3D Placement of UAVs [0.8399688944263842]
本稿では,地上のセルネットワークをダウンリンクで支援するUAVの3次元展開のための学習機構を提案する。
この問題は、満足度のあるUAV間での非協調ゲームとしてモデル化されている。
この問題を解決するために,不満足なUAVが学習アルゴリズムに基づいて位置情報を更新する,低複雑性アルゴリズムを用いる。
論文 参考訳(メタデータ) (2020-03-02T15:16:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。