論文の概要: Deep Reinforcement Learning for Online Routing of Unmanned Aerial
Vehicles with Wireless Power Transfer
- arxiv url: http://arxiv.org/abs/2204.11477v1
- Date: Mon, 25 Apr 2022 07:43:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-26 15:55:28.230536
- Title: Deep Reinforcement Learning for Online Routing of Unmanned Aerial
Vehicles with Wireless Power Transfer
- Title(参考訳): 無線電力伝送による無人航空機のオンラインルーティングのための深部強化学習
- Authors: Kaiwen Li, Tao Zhang, Rui Wang, Ling Wang
- Abstract要約: 無人航空機(UAV)は、輸送、軍事任務、災害救助、通信など様々な用途において重要な役割を担っている。
本稿では,無線電力伝送によるUAVオンラインルーティング問題を解決するための深層強化学習手法を提案する。
- 参考スコア(独自算出の注目度): 9.296415450289706
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The unmanned aerial vehicle (UAV) plays an vital role in various applications
such as delivery, military mission, disaster rescue, communication, etc., due
to its flexibility and versatility. This paper proposes a deep reinforcement
learning method to solve the UAV online routing problem with wireless power
transfer, which can charge the UAV remotely without wires, thus extending the
capability of the battery-limited UAV. Our study considers the power
consumption of the UAV and the wireless charging process. Unlike the previous
works, we solve the problem by a designed deep neural network. The model is
trained using a deep reinforcement learning method offline, and is used to
optimize the UAV routing problem online. On small and large scale instances,
the proposed model runs from four times to 500 times faster than Google
OR-tools, the state-of-the-art combinatorial optimization solver, with
identical solution quality. It also outperforms different types of heuristic
and local search methods in terms of both run-time and optimality. In addition,
once the model is trained, it can scale to new generated problem instances with
arbitrary topology that are not seen during training. The proposed method is
practically applicable when the problem scale is large and the response time is
crucial.
- Abstract(参考訳): 無人航空機(UAV)は、その柔軟性と汎用性から、輸送、軍事任務、災害救助、通信など様々な用途において重要な役割を担っている。
本稿では,無線電力伝送によるUAVオンラインルーティング問題を解決するための深層強化学習手法を提案する。
本研究は、uavの消費電力とワイヤレス充電プロセスについて検討する。
従来の研究とは異なり、設計したディープニューラルネットワークによってこの問題を解決する。
このモデルは、オフラインで深層強化学習法を用いて訓練され、UAVルーティング問題を最適化するために使用される。
小規模インスタンスと大規模インスタンスでは、提案されたモデルは、同じソリューション品質の最先端のコンビネータ最適化ソリューションであるgoogle or-toolsの4倍から500倍速く動作する。
また、実行時間と最適性の両方の観点から、異なるタイプのヒューリスティックおよび局所探索メソッドを上回る。
さらに、モデルがトレーニングされると、トレーニング中に見られない任意のトポロジを持つ、新たに生成された問題インスタンスにスケールすることができる。
提案手法は,問題規模が大きく,応答時間が非常に重要な場合に適用可能である。
関連論文リスト
- Multi-UAV Multi-RIS QoS-Aware Aerial Communication Systems using DRL and PSO [34.951735976771765]
無人航空機(UAV)は、地上の利用者に無線サービスを提供する学術・産業の研究者の注目を集めている。
UAVの限られたリソースは、そのようなアプリケーションにUAVを採用する上での課題を引き起こす可能性がある。
システムモデルでは,地域をナビゲートするUAVスワムを考慮し,RISをサポートした地上ユーザへの無線通信により,UAVのカバレッジを向上させる。
論文 参考訳(メタデータ) (2024-06-16T17:53:56Z) - UAV-enabled Collaborative Beamforming via Multi-Agent Deep Reinforcement Learning [79.16150966434299]
本稿では,UAVを用いた協調ビームフォーミング多目的最適化問題 (UCBMOP) を定式化し,UAVの伝送速度を最大化し,全UAVのエネルギー消費を最小化する。
ヘテロジニアス・エージェント・信頼領域ポリシー最適化(HATRPO)を基本フレームワークとし,改良されたHATRPOアルゴリズム,すなわちHATRPO-UCBを提案する。
論文 参考訳(メタデータ) (2024-04-11T03:19:22Z) - Tiny Multi-Agent DRL for Twins Migration in UAV Metaverses: A Multi-Leader Multi-Follower Stackelberg Game Approach [57.15309977293297]
無人航空機(UAV)とメタバースの相乗効果は、UAVメタバースと呼ばれる新しいパラダイムを生み出している。
本稿では,UAVメタバースにおける効率的なUTマイグレーションのためのプルーニング技術に基づく,機械学習に基づく小さなゲームフレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-18T02:14:13Z) - Self-Inspection Method of Unmanned Aerial Vehicles in Power Plants Using
Deep Q-Network Reinforcement Learning [0.0]
本研究は,UAV自律ナビゲーションとDQN強化学習を取り入れた発電所検査システムを提案する。
訓練されたモデルは、UAVが困難な環境で単独で移動できるようにすることで、検査戦略が実際に適用される可能性が高い。
論文 参考訳(メタデータ) (2023-03-16T00:58:50Z) - DL-DRL: A double-level deep reinforcement learning approach for
large-scale task scheduling of multi-UAV [65.07776277630228]
分割・征服フレームワーク(DCF)に基づく二重レベル深層強化学習(DL-DRL)手法を提案する。
特に,上層部DRLモデルにおけるエンコーダ・デコーダ構成ポリシネットワークを設計し,タスクを異なるUAVに割り当てる。
また、低レベルDRLモデルにおける別の注意に基づくポリシーネットワークを利用して、各UAVの経路を構築し、実行されたタスク数を最大化する。
論文 参考訳(メタデータ) (2022-08-04T04:35:53Z) - 3D UAV Trajectory and Data Collection Optimisation via Deep
Reinforcement Learning [75.78929539923749]
無人航空機(UAV)は現在、無線通信におけるネットワーク性能とカバレッジを高めるために配備され始めている。
UAV支援モノのインターネット(IoT)のための最適な資源配分方式を得ることは困難である
本稿では,UAVの最も短い飛行経路に依存しつつ,IoTデバイスから収集したデータ量を最大化しながら,新しいUAV支援IoTシステムを設計する。
論文 参考訳(メタデータ) (2021-06-06T14:08:41Z) - Jamming-Resilient Path Planning for Multiple UAVs via Deep Reinforcement
Learning [1.2330326247154968]
無人航空機(UAV)は無線ネットワークの不可欠な部分であると期待されている。
本論文では,複数のセルコネクテッドUAVの衝突のない経路を探索する。
本稿では,オンライン信号対干渉+雑音比マッピングを用いたオフライン時間差学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-04-09T16:52:33Z) - Mobile Cellular-Connected UAVs: Reinforcement Learning for Sky Limits [71.28712804110974]
本稿では,UAVの切断時間,ハンドオーバ速度,エネルギー消費を低減するため,MAB(Multi-armed bandit)アルゴリズムを提案する。
それぞれの性能指標(PI)が、適切な学習パラメータの範囲を採用することにより、どのように改善されるかを示す。
論文 参考訳(メタデータ) (2020-09-21T12:35:23Z) - Data Freshness and Energy-Efficient UAV Navigation Optimization: A Deep
Reinforcement Learning Approach [88.45509934702913]
我々は、移動基地局(BS)が配備される複数の無人航空機(UAV)のナビゲーションポリシーを設計する。
我々は、地上BSにおけるデータの鮮度を確保するために、エネルギーや情報年齢(AoI)の制約などの異なる文脈情報を組み込んだ。
提案したトレーニングモデルを適用することで、UAV-BSに対する効果的なリアルタイム軌道ポリシーは、時間とともに観測可能なネットワーク状態をキャプチャする。
論文 参考訳(メタデータ) (2020-02-21T07:29:15Z) - Multi-Vehicle Routing Problems with Soft Time Windows: A Multi-Agent
Reinforcement Learning Approach [9.717648122961483]
ソフトタイムウインドウ(MVRPSTW)を用いたマルチ車両ルーティング問題は、都市ロジスティクスシステムにおいて不可欠である。
従来の手法は計算効率と解の質のジレンマを引き起こす。
そこで本研究では,ルーティング問題の解決に要する時間的オフライントレーニングのメリットを即時評価する,Multi-Agent Attention Modelと呼ばれる新しい強化学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-02-13T14:26:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。