論文の概要: Jamming-Resilient Path Planning for Multiple UAVs via Deep Reinforcement
Learning
- arxiv url: http://arxiv.org/abs/2104.04477v1
- Date: Fri, 9 Apr 2021 16:52:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-12 15:40:41.796215
- Title: Jamming-Resilient Path Planning for Multiple UAVs via Deep Reinforcement
Learning
- Title(参考訳): 深部強化学習による複数UAVのジャミング耐性経路計画
- Authors: Xueyuan Wang, M. Cenk Gursoy, Tugba Erpek and Yalin E. Sagduyu
- Abstract要約: 無人航空機(UAV)は無線ネットワークの不可欠な部分であると期待されている。
本論文では,複数のセルコネクテッドUAVの衝突のない経路を探索する。
本稿では,オンライン信号対干渉+雑音比マッピングを用いたオフライン時間差学習アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 1.2330326247154968
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Unmanned aerial vehicles (UAVs) are expected to be an integral part of
wireless networks. In this paper, we aim to find collision-free paths for
multiple cellular-connected UAVs, while satisfying requirements of connectivity
with ground base stations (GBSs) in the presence of a dynamic jammer. We first
formulate the problem as a sequential decision making problem in discrete
domain, with connectivity, collision avoidance, and kinematic constraints. We,
then, propose an offline temporal difference (TD) learning algorithm with
online signal-to-interference-plus-noise ratio (SINR) mapping to solve the
problem. More specifically, a value network is constructed and trained offline
by TD method to encode the interactions among the UAVs and between the UAVs and
the environment; and an online SINR mapping deep neural network (DNN) is
designed and trained by supervised learning, to encode the influence and
changes due to the jammer. Numerical results show that, without any information
on the jammer, the proposed algorithm can achieve performance levels close to
that of the ideal scenario with the perfect SINR-map. Real-time navigation for
multi-UAVs can be efficiently performed with high success rates, and collisions
are avoided.
- Abstract(参考訳): 無人航空機(UAV)は無線ネットワークの不可欠な部分であると期待されている。
本稿では,複数のセル接続型UAVに対して,動的ジャマの存在下での地上基地局(GBS)との接続要件を満たしつつ,衝突のない経路を見つけることを目的とする。
まず,接続性,衝突回避性,運動的制約を伴う離散領域における逐次的意思決定問題として問題を定式化する。
そこで本研究では,オンライン信号対干渉比(sinr)マッピングを用いたオフライン時間差(td)学習アルゴリズムを提案する。
より具体的には、UAV間の相互作用とUAVと環境の間の相互作用を符号化するTD法で、オフラインでバリューネットワークを構築し、トレーニングし、オンラインSINRマッピングディープニューラルネットワーク(DNN)を教師付き学習によって設計、訓練し、ジャマーによる影響と変化を符号化する。
数値計算の結果,提案アルゴリズムは,ジャマーに関する情報がなければ,理想的なSINRマップを用いて,理想的なシナリオに近い性能レベルを達成できることがわかった。
複数UAVのリアルタイムナビゲーションを高い成功率で効率的に行うことができ、衝突を避けることができる。
関連論文リスト
- Multi-Agent Reinforcement Learning for Offloading Cellular Communications with Cooperating UAVs [21.195346908715972]
無人航空機は、地上のBSからデータトラフィックをオフロードする代替手段を提供する。
本稿では,地上BSからデータオフロードを行うために,複数のUAVを効率的に利用するための新しい手法を提案する。
論文 参考訳(メタデータ) (2024-02-05T12:36:08Z) - Deep Reinforcement Learning for Interference Management in UAV-based 3D
Networks: Potentials and Challenges [137.47736805685457]
チャネル情報を知らなくても干渉を効果的に軽減できることを示す。
干渉を利用することにより、提案された解決策は民間UAVの継続的な成長を可能にする。
論文 参考訳(メタデータ) (2023-05-11T18:06:46Z) - Joint Optimization of Deployment and Trajectory in UAV and IRS-Assisted
IoT Data Collection System [25.32139119893323]
無人航空機(UAV)は多くのモノのインターネット(IoT)システムに適用できる。
UAV-IoT無線チャネルは、時には木や高層建築物によってブロックされることがある。
本稿では,UAVの展開と軌道を最適化することで,システムのエネルギー消費を最小化することを目的とする。
論文 参考訳(メタデータ) (2022-10-27T06:27:40Z) - Federated Deep Learning Meets Autonomous Vehicle Perception: Design and
Verification [168.67190934250868]
フェデレーテッド・ラーニング・パワード・コネクテッド・オートモービル(FLCAV)が提案されている。
FLCAVは通信とアノテーションのコストを削減しながらプライバシを保存する。
マルチステージトレーニングのためのネットワークリソースと道路センサのポーズを決定することは困難である。
論文 参考訳(メタデータ) (2022-06-03T23:55:45Z) - Adaptive Anomaly Detection for Internet of Things in Hierarchical Edge
Computing: A Contextual-Bandit Approach [81.5261621619557]
階層エッジコンピューティング(HEC)を用いた適応型異常検出手法を提案する。
まず,複雑性を増した複数のDNNモデルを構築し,それぞれを対応するHEC層に関連付ける。
そこで我々は、文脈帯域問題として定式化され、強化学習ポリシーネットワークを用いて解決される適応モデル選択スキームを設計する。
論文 参考訳(メタデータ) (2021-08-09T08:45:47Z) - Trajectory Design for UAV-Based Internet-of-Things Data Collection: A
Deep Reinforcement Learning Approach [93.67588414950656]
本稿では,無人航空機(UAV)による3D環境におけるIoT(Internet-of-Things)システムについて検討する。
本稿では,TD3-TDCTMアルゴリズムの完成時間最小化のためのトラジェクトリ設計を提案する。
シミュレーションの結果,従来の3つの非学習ベースライン法よりもTD3-TDCTMアルゴリズムの方が優れていることが示された。
論文 参考訳(メタデータ) (2021-07-23T03:33:29Z) - Efficient Real-Time Image Recognition Using Collaborative Swarm of UAVs
and Convolutional Networks [9.449650062296824]
本稿では,画像の分類を行うリソース制約付きUAV群に推論要求を分散する戦略を提案する。
画像の取得と最終的な決定の待ち時間を最小限に抑える最適化問題としてモデルを定式化する。
私たちは、利用可能なUAV間で最高のレイテンシを提供するレイヤ配置戦略を見つけるために、オンラインソリューション、すなわちDistInferenceを導入します。
論文 参考訳(メタデータ) (2021-07-09T19:47:02Z) - Learning-Based UAV Trajectory Optimization with Collision Avoidance and
Connectivity Constraints [0.0]
無人航空機(UAV)は無線ネットワークの不可欠な部分であると期待されている。
本稿では,衝突回避と無線接続制約による複数UAV軌道最適化問題を再構成する。
この問題を解決するために,分散型深層強化学習手法を提案する。
論文 参考訳(メタデータ) (2021-04-03T22:22:20Z) - Multi-Agent Reinforcement Learning in NOMA-aided UAV Networks for
Cellular Offloading [59.32570888309133]
複数の無人航空機(UAV)によるセルローディングのための新しい枠組みの提案
非直交多重アクセス(NOMA)技術は、無線ネットワークのスペクトル効率をさらに向上するために、各UAVに採用されている。
相互深いQ-network (MDQN) アルゴリズムは,UAVの最適3次元軌道と電力配分を共同で決定するために提案される。
論文 参考訳(メタデータ) (2020-10-18T20:22:05Z) - Risk-Averse MPC via Visual-Inertial Input and Recurrent Networks for
Online Collision Avoidance [95.86944752753564]
本稿では,モデル予測制御(MPC)の定式化を拡張したオンライン経路計画アーキテクチャを提案する。
我々のアルゴリズムは、状態推定の共分散を推論するリカレントニューラルネットワーク(RNN)とオブジェクト検出パイプラインを組み合わせる。
本手法のロバスト性は, 複雑な四足歩行ロボットの力学で検証され, ほとんどのロボットプラットフォームに適用可能である。
論文 参考訳(メタデータ) (2020-07-28T07:34:30Z) - UAV Path Planning for Wireless Data Harvesting: A Deep Reinforcement
Learning Approach [18.266087952180733]
本稿では,IoT(Internet of Things)デバイスからのUAV対応データ収集に対するエンドツーエンド強化学習手法を提案する。
自律ドローンは、限られた飛行時間と障害物回避を受ける分散センサーノードからデータを収集する。
提案するネットワークアーキテクチャにより,エージェントが様々なシナリオパラメータの移動決定を行うことができることを示す。
論文 参考訳(メタデータ) (2020-07-01T15:14:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。