論文の概要: Trajectory Design for UAV-Based Internet-of-Things Data Collection: A
Deep Reinforcement Learning Approach
- arxiv url: http://arxiv.org/abs/2107.11015v1
- Date: Fri, 23 Jul 2021 03:33:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-21 03:29:38.574119
- Title: Trajectory Design for UAV-Based Internet-of-Things Data Collection: A
Deep Reinforcement Learning Approach
- Title(参考訳): UAVを用いたインターネット・オブ・Thingsデータ収集のための軌道設計:深層強化学習アプローチ
- Authors: Yang Wang, Zhen Gao, Jun Zhang, Xianbin Cao, Dezhi Zheng, Yue Gao,
Derrick Wing Kwan Ng, Marco Di Renzo
- Abstract要約: 本稿では,無人航空機(UAV)による3D環境におけるIoT(Internet-of-Things)システムについて検討する。
本稿では,TD3-TDCTMアルゴリズムの完成時間最小化のためのトラジェクトリ設計を提案する。
シミュレーションの結果,従来の3つの非学習ベースライン法よりもTD3-TDCTMアルゴリズムの方が優れていることが示された。
- 参考スコア(独自算出の注目度): 93.67588414950656
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we investigate an unmanned aerial vehicle (UAV)-assisted
Internet-of-Things (IoT) system in a sophisticated three-dimensional (3D)
environment, where the UAV's trajectory is optimized to efficiently collect
data from multiple IoT ground nodes. Unlike existing approaches focusing only
on a simplified two-dimensional scenario and the availability of perfect
channel state information (CSI), this paper considers a practical 3D urban
environment with imperfect CSI, where the UAV's trajectory is designed to
minimize data collection completion time subject to practical throughput and
flight movement constraints. Specifically, inspired from the state-of-the-art
deep reinforcement learning approaches, we leverage the twin-delayed deep
deterministic policy gradient (TD3) to design the UAV's trajectory and present
a TD3-based trajectory design for completion time minimization (TD3-TDCTM)
algorithm. In particular, we set an additional information, i.e., the merged
pheromone, to represent the state information of UAV and environment as a
reference of reward which facilitates the algorithm design. By taking the
service statuses of IoT nodes, the UAV's position, and the merged pheromone as
input, the proposed algorithm can continuously and adaptively learn how to
adjust the UAV's movement strategy. By interacting with the external
environment in the corresponding Markov decision process, the proposed
algorithm can achieve a near-optimal navigation strategy. Our simulation
results show the superiority of the proposed TD3-TDCTM algorithm over three
conventional non-learning based baseline methods.
- Abstract(参考訳): 本論文では,UAVの軌道を最適化して複数のIoT地上ノードから効率的にデータを収集する高度3次元環境において,無人航空機(UAV)を利用したIoT(Internet-of-Things)システムについて検討する。
従来の2次元シナリオと完全チャネル状態情報(csi)の可用性にのみ焦点をあてたアプローチとは異なり,本論文では,実用的スループットと飛行動作制約によるデータ収集完了時間の最小化を目的とした,不完全csiを用いた実用的な3次元都市環境を考察する。
具体的には、最先端の深部強化学習アプローチから着想を得て、ツイン遅延の深部決定性ポリシー勾配(TD3)を利用してUAVの軌道を設計し、TD3に基づくTD3-TDCTMアルゴリズムを提案する。
特に,統合フェロモンという付加情報を,UAVと環境の状態情報を表すために,アルゴリズム設計を容易にする報酬の参照として設定した。
IoTノードのサービスステータス、UAVの位置、およびマージされたフェロモンを入力として、提案アルゴリズムは、UAVの動作戦略の調整方法を継続的に適応的に学習することができる。
マルコフ決定過程における外部環境との相互作用により,提案アルゴリズムは準最適ナビゲーション戦略を実現することができる。
提案するtd3-tdctmアルゴリズムは,従来の3つの非学習ベースライン法よりも優れていることを示す。
関連論文リスト
- ALOcc: Adaptive Lifting-based 3D Semantic Occupancy and Cost Volume-based Flow Prediction [89.89610257714006]
既存の手法は、これらのタスクの要求に応えるために高い精度を優先する。
本稿では,3次元セマンティック占有率予測とフロー推定のための一連の改善点を紹介する。
私たちの純粋な時間的アーキテクチャフレームワークであるALOccは、速度と精度の最適なトレードオフを実現しています。
論文 参考訳(メタデータ) (2024-11-12T11:32:56Z) - 3D UAV Trajectory Planning for IoT Data Collection via Matrix-Based Evolutionary Computation [10.91369146380236]
連続時間空間領域上の3次元UAV軌道の計画は、計算集約的な問題である。
非効率な制約最適化問題に対処するために,制約付き行列ベース微分進化法(MDECH)を提案する。
論文 参考訳(メタデータ) (2024-10-08T07:33:48Z) - Meta Reinforcement Learning for Strategic IoT Deployments Coverage in
Disaster-Response UAV Swarms [5.57865728456594]
無人航空機(UAV)は、重要な緊急用途に使用される可能性があるとして、学術や産業の研究者の注目を集めている。
これらのアプリケーションには、地上のユーザーに無線サービスを提供し、災害の影響を受けた地域からデータを収集する機能が含まれる。
UAVの限られた資源、エネルギー予算、厳格なミッション完了時間は、これらの用途にUAVを採用する際の課題を提起している。
論文 参考訳(メタデータ) (2024-01-20T05:05:39Z) - UAV Trajectory Planning for AoI-Minimal Data Collection in UAV-Aided IoT
Networks by Transformer [8.203870302926614]
IoT(Internet-of-Things)ネットワークにおけるデータ収集の鮮度維持が注目されている。
クラスター型IoTネットワークを支援する無人航空機(UAV)の軌道計画問題について検討する。
地上IoTネットワークからのUAVによる収集データの総AoIを最小化するために最適化問題を定式化する。
論文 参考訳(メタデータ) (2023-11-08T17:13:19Z) - Joint Optimization of Deployment and Trajectory in UAV and IRS-Assisted
IoT Data Collection System [25.32139119893323]
無人航空機(UAV)は多くのモノのインターネット(IoT)システムに適用できる。
UAV-IoT無線チャネルは、時には木や高層建築物によってブロックされることがある。
本稿では,UAVの展開と軌道を最適化することで,システムのエネルギー消費を最小化することを目的とする。
論文 参考訳(メタデータ) (2022-10-27T06:27:40Z) - 3D UAV Trajectory and Data Collection Optimisation via Deep
Reinforcement Learning [75.78929539923749]
無人航空機(UAV)は現在、無線通信におけるネットワーク性能とカバレッジを高めるために配備され始めている。
UAV支援モノのインターネット(IoT)のための最適な資源配分方式を得ることは困難である
本稿では,UAVの最も短い飛行経路に依存しつつ,IoTデバイスから収集したデータ量を最大化しながら,新しいUAV支援IoTシステムを設計する。
論文 参考訳(メタデータ) (2021-06-06T14:08:41Z) - Multi-Agent Reinforcement Learning in NOMA-aided UAV Networks for
Cellular Offloading [59.32570888309133]
複数の無人航空機(UAV)によるセルローディングのための新しい枠組みの提案
非直交多重アクセス(NOMA)技術は、無線ネットワークのスペクトル効率をさらに向上するために、各UAVに採用されている。
相互深いQ-network (MDQN) アルゴリズムは,UAVの最適3次元軌道と電力配分を共同で決定するために提案される。
論文 参考訳(メタデータ) (2020-10-18T20:22:05Z) - NOMA in UAV-aided cellular offloading: A machine learning approach [59.32570888309133]
複数の無人航空機(UAV)によるセルローディングのための新しい枠組みの提案
非直交多重アクセス(NOMA)技術は、無線ネットワークのスペクトル効率をさらに向上するために、各UAVに採用されている。
相互深いQ-network (MDQN) アルゴリズムは,UAVの最適3次元軌道と電力配分を共同で決定するために提案される。
論文 参考訳(メタデータ) (2020-10-18T17:38:48Z) - Data Freshness and Energy-Efficient UAV Navigation Optimization: A Deep
Reinforcement Learning Approach [88.45509934702913]
我々は、移動基地局(BS)が配備される複数の無人航空機(UAV)のナビゲーションポリシーを設計する。
我々は、地上BSにおけるデータの鮮度を確保するために、エネルギーや情報年齢(AoI)の制約などの異なる文脈情報を組み込んだ。
提案したトレーニングモデルを適用することで、UAV-BSに対する効果的なリアルタイム軌道ポリシーは、時間とともに観測可能なネットワーク状態をキャプチャする。
論文 参考訳(メタデータ) (2020-02-21T07:29:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。