論文の概要: Autonomous Unmanned Aerial Vehicle Navigation using Reinforcement
Learning: A Systematic Review
- arxiv url: http://arxiv.org/abs/2208.12328v1
- Date: Thu, 25 Aug 2022 20:04:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-29 13:17:23.844038
- Title: Autonomous Unmanned Aerial Vehicle Navigation using Reinforcement
Learning: A Systematic Review
- Title(参考訳): 強化学習を用いた無人航空機の自律走行:システムレビュー
- Authors: Fadi AlMahamid and Katarina Grolinger
- Abstract要約: 無人航空機(Unmanned Aerial Vehicle, UAV)は、荷物の配達、交通監視、捜索・救助活動、軍事戦闘など、様々な用途で使用されている。
これらのアプリケーションすべてにおいて、UAVは、ヒューマンインタラクションなしで環境を自律的にナビゲートし、特定のタスクを実行し、障害を避けるために使用される。
本研究は、まずUAVナビゲーションタスクを特定し、ナビゲーションフレームワークとシミュレーションソフトウェアについて議論する。
次に、異なるUAVナビゲーション問題における環境、アルゴリズムの特徴、能力、応用に基づいてRLアルゴリズムを分類、議論する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: There is an increasing demand for using Unmanned Aerial Vehicle (UAV), known
as drones, in different applications such as packages delivery, traffic
monitoring, search and rescue operations, and military combat engagements. In
all of these applications, the UAV is used to navigate the environment
autonomously - without human interaction, perform specific tasks and avoid
obstacles. Autonomous UAV navigation is commonly accomplished using
Reinforcement Learning (RL), where agents act as experts in a domain to
navigate the environment while avoiding obstacles. Understanding the navigation
environment and algorithmic limitations plays an essential role in choosing the
appropriate RL algorithm to solve the navigation problem effectively.
Consequently, this study first identifies the main UAV navigation tasks and
discusses navigation frameworks and simulation software. Next, RL algorithms
are classified and discussed based on the environment, algorithm
characteristics, abilities, and applications in different UAV navigation
problems, which will help the practitioners and researchers select the
appropriate RL algorithms for their UAV navigation use cases. Moreover,
identified gaps and opportunities will drive UAV navigation research.
- Abstract(参考訳): ドローンとして知られる無人航空機(uav)の使用は、荷物の配送、交通監視、捜索救助活動、軍事戦闘など様々な用途で需要が高まっている。
これらのアプリケーションすべてにおいて、UAVは、ヒューマンインタラクションなしで環境を自律的にナビゲートし、特定のタスクを実行し、障害を避けるために使用される。
自律型uavナビゲーションは通常、強化学習(rl)を使用して行われ、エージェントは障害物を避けながら環境をナビゲートするドメインの専門家として振る舞う。
ナビゲーション環境の理解とアルゴリズムの限界は、ナビゲーション問題を解決するのに適切なrlアルゴリズムを選択する上で重要な役割を果たす。
そこで本研究ではまずUAVナビゲーションタスクを特定し,ナビゲーションフレームワークとシミュレーションソフトウェアについて議論する。
次に、異なるuavナビゲーション問題における環境、アルゴリズム特性、能力、アプリケーションに基づいてrlアルゴリズムを分類し、議論し、実践者や研究者がそれらのuavナビゲーションユースケースに適したrlアルゴリズムを選択するのに役立つ。
さらに、識別されたギャップと機会がUAVナビゲーション研究を促進する。
関連論文リスト
- Convergence of Communications, Control, and Machine Learning for Secure
and Autonomous Vehicle Navigation [78.60496411542549]
接続された自動運転車(CAV)は、交通事故におけるヒューマンエラーを低減し、道路効率を向上し、様々なタスクを実行する。これらのメリットを享受するためには、CAVが目標とする目的地へ自律的にナビゲートする必要がある。
本稿では,通信理論,制御理論,機械学習の収束を利用して,効果的なCAVナビゲーションを実現する手法を提案する。
論文 参考訳(メタデータ) (2023-07-05T21:38:36Z) - Ada-NAV: Adaptive Trajectory-Based Sample Efficient Policy Learning for
Robotic Navigation [75.36145696421038]
Ada-NAVは、ロボットナビゲーションタスクにおける強化学習アルゴリズムのトレーニングサンプル効率を高めるために設計された新しい適応軌道長スキームである。
我々は、Ada-NAVが一定またはランダムにサンプリングされた軌道長を用いる従来の手法よりも優れているというシミュレーションと実世界のロボット実験を通して実証する。
論文 参考訳(メタデータ) (2023-06-09T18:45:15Z) - ETPNav: Evolving Topological Planning for Vision-Language Navigation in
Continuous Environments [56.194988818341976]
視覚言語ナビゲーションは、エージェントが環境中をナビゲートするための指示に従う必要があるタスクである。
本研究では,1)環境を抽象化し,長距離航法計画を生成する能力,2)連続環境における障害物回避制御能力の2つの重要なスキルに焦点を当てたETPNavを提案する。
ETPNavは、R2R-CEとRxR-CEデータセットの先行技術よりも10%以上、20%改善されている。
論文 参考訳(メタデータ) (2023-04-06T13:07:17Z) - Robot path planning using deep reinforcement learning [0.0]
強化学習法は、地図のないナビゲーションタスクに代わる手段を提供する。
障害物回避と目標指向ナビゲーションタスクの両方に深部強化学習エージェントを実装した。
報酬関数の変更によるエージェントの挙動と性能の変化を解析する。
論文 参考訳(メタデータ) (2023-02-17T20:08:59Z) - Advanced Algorithms of Collision Free Navigation and Flocking for
Autonomous UAVs [0.0]
本報告は,マルチUAVシステムの自律走行及び運動調整のためのUAV制御の最先端化に寄与する。
本報告の前半は単UAVシステムを扱うもので, 未知・動的環境における3次元(3次元)衝突フリーナビゲーションの複雑な問題に対処する。
本報告では, マルチUAVシステムの安全ナビゲーションについて述べるとともに, フラッキングと3次元領域カバレッジのための多UAVシステムの分散動作調整手法を開発した。
論文 参考訳(メタデータ) (2021-10-30T03:51:40Z) - Human-Aware Robot Navigation via Reinforcement Learning with Hindsight
Experience Replay and Curriculum Learning [28.045441768064215]
強化学習アプローチは、シーケンシャルな意思決定問題を解決する優れた能力を示している。
本研究では,実演データを使わずにRLエージェントを訓練する作業を検討する。
密集層における最適なナビゲーションポリシーを効率的に学習するために,後視体験リプレイ(HER)とカリキュラム学習(CL)技術をRLに組み込むことを提案する。
論文 参考訳(メタデータ) (2021-10-09T13:18:11Z) - A Multi-UAV System for Exploration and Target Finding in Cluttered and
GPS-Denied Environments [68.31522961125589]
複雑なGPSを用いた複雑な環境において,UAVのチームが協調して目標を探索し,発見するための枠組みを提案する。
UAVのチームは自律的にナビゲートし、探索し、検出し、既知の地図で散らばった環境でターゲットを見つける。
その結果, 提案方式は, 時間的コスト, 調査対象地域の割合, 捜索・救助ミッションの成功率などの面で改善されていることがわかった。
論文 参考訳(メタデータ) (2021-07-19T12:54:04Z) - Active Visual Information Gathering for Vision-Language Navigation [115.40768457718325]
視覚言語ナビゲーション(VLN)は、エージェントがフォトリアリスティックな環境の中でナビゲーションの指示を行うためのタスクである。
VLNの重要な課題の1つは、曖昧な指示による不確実性を緩和し、環境の観察を不十分にすることで、堅牢なナビゲーションを行う方法である。
この研究は、人間のナビゲーション行動からインスピレーションを得て、よりインテリジェントなVLNポリシーのためのアクティブな情報収集能力を持つエージェントを提供する。
論文 参考訳(メタデータ) (2020-07-15T23:54:20Z) - APPLD: Adaptive Planner Parameter Learning from Demonstration [48.63930323392909]
本稿では,既存のナビゲーションシステムを新しい複雑な環境に適用可能な,適応プランナー学習(Adaptive Planner Learning from Demonstration)のAPPLDを紹介する。
APPLDは異なる環境で異なるナビゲーションシステムを実行する2つのロボットで検証されている。
実験結果から,APPLDはナビゲーションシステムよりも,デフォルトパラメータや専門家パラメータ,さらには人間実証者自体よりも優れていることが示された。
論文 参考訳(メタデータ) (2020-03-31T21:15:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。