論文の概要: SREC: Proactive Self-Remedy of Energy-Constrained UAV-Based Networks via
Deep Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2009.08528v1
- Date: Thu, 17 Sep 2020 20:51:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-17 12:24:06.910265
- Title: SREC: Proactive Self-Remedy of Energy-Constrained UAV-Based Networks via
Deep Reinforcement Learning
- Title(参考訳): SREC: 深層強化学習によるエネルギー制約型UAVネットワークの積極的な自己修復
- Authors: Ran Zhang, Miao Wang, and Lin X. Cai
- Abstract要約: 複数の無人航空機(UAV)のエネルギーを意識した制御は、UAVベースのネットワークにおける主要な研究の1つである。
1つ以上のUAVがエネルギー不足であり、充電を中止しようとしている場合、エネルギー制約されたUAVネットワークの積極的な自己修復について検討する。
我々は,UAVがネットワークを離脱しようとしている場合に,UAVを積極的に移動させる,エネルギーを意識した最適なUAV制御ポリシーを提案する。
- 参考スコア(独自算出の注目度): 11.065500588538997
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Energy-aware control for multiple unmanned aerial vehicles (UAVs) is one of
the major research interests in UAV based networking. Yet few existing works
have focused on how the network should react around the timing when the UAV
lineup is changed. In this work, we study proactive self-remedy of
energy-constrained UAV networks when one or more UAVs are short of energy and
about to quit for charging. We target at an energy-aware optimal UAV control
policy which proactively relocates the UAVs when any UAV is about to quit the
network, rather than passively dispatches the remaining UAVs after the quit.
Specifically, a deep reinforcement learning (DRL)-based self remedy approach,
named SREC-DRL, is proposed to maximize the accumulated user satisfaction
scores for a certain period within which at least one UAV will quit the
network. To handle the continuous state and action space in the problem, the
state-of-the-art algorithm of the actor-critic DRL, i.e., deep deterministic
policy gradient (DDPG), is applied with better convergence stability. Numerical
results demonstrate that compared with the passive reaction method, the
proposed SREC-DRL approach shows a $12.12\%$ gain in accumulative user
satisfaction score during the remedy period.
- Abstract(参考訳): 複数の無人航空機(UAV)のエネルギーを意識した制御は、UAVベースのネットワークにおける主要な研究の1つである。
しかし、uavラインアップが変更されたタイミングでネットワークがどのように反応すべきかに焦点を絞った既存の作業はほとんどない。
本研究では、1つ以上のUAVがエネルギー不足であり、充電を中止しようとしている場合に、エネルギー制約されたUAVネットワークの積極的な自己修復について検討する。
我々は,UAVがネットワークを離脱しようとしているときに,UAVを積極的に移動させる,エネルギーを意識した最適なUAV制御政策を目標としている。
具体的には,少なくとも1つのUAVがネットワークを終了する一定期間のユーザ満足度を最大化するために,深層強化学習(DRL)に基づく自己修復手法SREC-DRLを提案する。
問題の連続状態と動作空間を扱うために,アクター-批判的drl(deep deterministic policy gradient, ddpg)の最先端アルゴリズムを適用することにより,収束安定性が向上した。
数値計算の結果,SREC-DRL法は受動的反応法と比較すると,治療期間中の累積ユーザ満足度スコアが12.12\%以上向上していることがわかった。
関連論文リスト
- Movable Antenna-Equipped UAV for Data Collection in Backscatter Sensor Networks: A Deep Reinforcement Learning-based Approach [10.115361454176773]
無人航空機(UAV)は遠隔後方散乱装置(BD)からの柔軟なデータ収集を可能にする
指向性と柔軟性の高い指向性移動アンテナ(MA)をUAVに搭載することを検討する。
我々は,UAVと各BD間の方位角と距離を用いた深部強化学習(DRL)に基づく戦略を開発し,エージェントの観測空間を簡素化する。
論文 参考訳(メタデータ) (2024-11-21T09:34:48Z) - Collaborative Reinforcement Learning Based Unmanned Aerial Vehicle (UAV)
Trajectory Design for 3D UAV Tracking [21.520344500526516]
無人航空機(UAV)1機と4機の受動UAVを用いて3DターゲットUAVをリアルタイムにローカライズする問題について検討した。
この問題を解決するために,Z関数分解に基づく強化学習法(ZD-RL)を提案する。
論文 参考訳(メタデータ) (2024-01-22T16:21:19Z) - UAV Swarm-enabled Collaborative Secure Relay Communications with
Time-domain Colluding Eavesdropper [115.56455278813756]
航空中継機としての無人航空機(UAV)は、インターネットモノ(IoT)ネットワークの補助として事実上魅力的である。
本研究では,UAV基地局と端末端末装置間のセキュアな通信を支援するために,UAVを活用することを目的とする。
論文 参考訳(メタデータ) (2023-10-03T11:47:01Z) - Evidential Detection and Tracking Collaboration: New Problem, Benchmark
and Algorithm for Robust Anti-UAV System [56.51247807483176]
無人航空機(UAV)は輸送、監視、軍事など多くの地域で広く使われている。
従来は、UAVの先行情報が常に提供されていた追跡問題として、このようなアンチUAVタスクを単純化していた。
本稿では,従来のUAV情報を含まない複雑な場面において,UAVの認識を特徴とする新しい実用的対UAV問題を初めて定式化する。
論文 参考訳(メタデータ) (2023-06-27T19:30:23Z) - Optimization for Master-UAV-powered Auxiliary-Aerial-IRS-assisted IoT
Networks: An Option-based Multi-agent Hierarchical Deep Reinforcement
Learning Approach [56.84948632954274]
本稿では,無人航空機(MUAV)搭載のIoT(Internet of Things)ネットワークについて検討する。
本稿では、インテリジェント反射面(IRS)を備えた充電可能な補助UAV(AUAV)を用いて、MUAVからの通信信号を強化することを提案する。
提案モデルでは,IoTネットワークの蓄積スループットを最大化するために,これらのエネルギー制限されたUAVの最適協調戦略について検討する。
論文 参考訳(メタデータ) (2021-12-20T15:45:28Z) - Responsive Regulation of Dynamic UAV Communication Networks Based on
Deep Reinforcement Learning [16.78151396672782]
我々は、UAVラインアップの今後の変更を識別し、変更に先立ってUAVを移動できる最適なUAV制御ポリシーを開発する。
具体的には、時間軸の蓄積されたユーザ満足度(US)スコアを最大化するために、DRLに基づくUAV制御フレームワークを開発する。
さらに、連続状態と行動空間を扱うために、アクター批判に基づくDRLであるDeep Deterministic Policy gradient (DDPG)アルゴリズムを利用する。
論文 参考訳(メタデータ) (2021-08-25T02:04:13Z) - 3D UAV Trajectory and Data Collection Optimisation via Deep
Reinforcement Learning [75.78929539923749]
無人航空機(UAV)は現在、無線通信におけるネットワーク性能とカバレッジを高めるために配備され始めている。
UAV支援モノのインターネット(IoT)のための最適な資源配分方式を得ることは困難である
本稿では,UAVの最も短い飛行経路に依存しつつ,IoTデバイスから収集したデータ量を最大化しながら,新しいUAV支援IoTシステムを設計する。
論文 参考訳(メタデータ) (2021-06-06T14:08:41Z) - Efficient UAV Trajectory-Planning using Economic Reinforcement Learning [65.91405908268662]
UAV間でタスクを分散するための経済取引に触発された新しい強化学習アルゴリズムであるREPlannerを紹介します。
エージェントが協力し、リソースを競うことができるマルチエージェント経済ゲームとして、パス計画問題を策定します。
UAV協力によるタスク分布の計算を行うため、Swarmサイズの変化に対して非常に耐性が高い。
論文 参考訳(メタデータ) (2021-03-03T20:54:19Z) - Anti-UAV: A Large Multi-Modal Benchmark for UAV Tracking [59.06167734555191]
Unmanned Aerial Vehicle (UAV)は、商業とレクリエーションの両方に多くの応用を提供している。
我々は、UAVを追跡し、位置や軌道などの豊富な情報を提供するという課題を考察する。
300以上のビデオペアが580k以上の手動で注釈付きバウンディングボックスを含むデータセット、Anti-UAVを提案します。
論文 参考訳(メタデータ) (2021-01-21T07:00:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。