論文の概要: Energy Minimization in UAV-Aided Networks: Actor-Critic Learning for
Constrained Scheduling Optimization
- arxiv url: http://arxiv.org/abs/2006.13610v2
- Date: Mon, 29 Jun 2020 09:17:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-17 13:35:37.384110
- Title: Energy Minimization in UAV-Aided Networks: Actor-Critic Learning for
Constrained Scheduling Optimization
- Title(参考訳): UAV支援ネットワークにおけるエネルギー最小化:制約付きスケジューリング最適化のためのアクタクリティカルラーニング
- Authors: Yaxiong Yuan, Lei Lei, Thang Xuan Vu, Symeon Chatzinotas, Sumei Sun
and Bjorn Ottersten
- Abstract要約: 無人航空機 (UAV) の応用においては、UAVの限られたエネルギー供給と貯蔵がインテリジェントなエネルギー保存ソリューションの開発を引き起こしている。
本稿では,データ転送スケジューリングホバリング時間を最適化するエネルギーDSOSソリューションについて検討する。
- 参考スコア(独自算出の注目度): 30.742052801257998
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In unmanned aerial vehicle (UAV) applications, the UAV's limited energy
supply and storage have triggered the development of intelligent
energy-conserving scheduling solutions. In this paper, we investigate energy
minimization for UAV-aided communication networks by jointly optimizing
data-transmission scheduling and UAV hovering time. The formulated problem is
combinatorial and non-convex with bilinear constraints. To tackle the problem,
firstly, we provide an optimal relax-and-approximate solution and develop a
near-optimal algorithm. Both the proposed solutions are served as offline
performance benchmarks but might not be suitable for online operation. To this
end, we develop a solution from a deep reinforcement learning (DRL) aspect. The
conventional RL/DRL, e.g., deep Q-learning, however, is limited in dealing with
two main issues in constrained combinatorial optimization, i.e., exponentially
increasing action space and infeasible actions. The novelty of solution
development lies in handling these two issues. To address the former, we
propose an actor-critic-based deep stochastic online scheduling (AC-DSOS)
algorithm and develop a set of approaches to confine the action space. For the
latter, we design a tailored reward function to guarantee the solution
feasibility. Numerical results show that, by consuming equal magnitude of time,
AC-DSOS is able to provide feasible solutions and saves 29.94% energy compared
with a conventional deep actor-critic method. Compared to the developed
near-optimal algorithm, AC-DSOS consumes around 10% higher energy but reduces
the computational time from minute-level to millisecond-level.
- Abstract(参考訳): 無人航空機(UAV)の応用では、UAVの限られたエネルギー供給と貯蔵が、インテリジェントなエネルギー保存スケジューリングソリューションの開発を引き起こしている。
本稿では,データ送信スケジューリングとUAVホバリング時間の共同最適化により,UAV支援通信ネットワークのエネルギー最小化について検討する。
定式化された問題は、双線型制約を伴う組合せと非凸である。
この問題に対処するため、まず、最適緩和近似解を提供し、準最適アルゴリズムを開発する。
提案されたソリューションはいずれもオフラインのパフォーマンスベンチマークとして提供されるが、オンライン操作には適さないかもしれない。
この目的のために、我々は深層強化学習(DRL)の観点からソリューションを開発する。
しかし、従来のRL/DRL、例えば深層Q-ラーニングは、制約付き組合せ最適化における2つの主要な問題、すなわち指数関数的に増加するアクション空間と実現不可能なアクションを扱う場合に限られている。
ソリューション開発のノベルティは、これら2つの問題に対処することである。
前者に対応するために,アクタ批判に基づく深層確率オンラインスケジューリング(AC-DSOS)アルゴリズムを提案し,アクション空間を閉じ込めるための一連のアプローチを開発する。
後者の場合、ソリューション実現可能性を保証するために、カスタマイズされた報酬関数を設計する。
数値的な結果から、AC-DSOSは同等の時間を消費することで実現可能なソリューションを提供し、従来のディープアクター・クリティカル法と比較して29.94%のエネルギーを節約できることが示されている。
開発された近似アルゴリズムと比較して、AC-DSOSは10%高いエネルギーを消費するが、計算時間を分単位からミリ秒単位に短縮する。
関連論文リスト
- Multiobjective Vehicle Routing Optimization with Time Windows: A Hybrid Approach Using Deep Reinforcement Learning and NSGA-II [52.083337333478674]
本稿では、時間窓を用いた多目的車両ルーティング問題(MOVRPTW)に対処するために、ウェイト・アウェア・ディープ・強化学習(WADRL)手法を提案する。
WADRLの結果を最適化するために非支配的ソート遺伝的アルゴリズム-II (NSGA-II) 法を用いる。
論文 参考訳(メタデータ) (2024-07-18T02:46:06Z) - DNN Partitioning, Task Offloading, and Resource Allocation in Dynamic Vehicular Networks: A Lyapunov-Guided Diffusion-Based Reinforcement Learning Approach [49.56404236394601]
本稿では,Vehicular Edge Computingにおける共同DNNパーティショニング,タスクオフロード,リソース割り当ての問題を定式化する。
我々の目標は、時間とともにシステムの安定性を保証しながら、DNNベースのタスク完了時間を最小化することである。
拡散モデルの革新的利用を取り入れたマルチエージェント拡散に基づく深層強化学習(MAD2RL)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-11T06:31:03Z) - Energy-Efficient Power Control for Multiple-Task Split Inference in
UAVs: A Tiny Learning-Based Approach [27.48920259431965]
無人航空機(UAV)における分割推論におけるエネルギー最小化のための2段階のアプローチを提案する。
送信電力の最適化を送信時間に置き換えて,計算複雑性を低減する。
シミュレーションの結果,提案アルゴリズムは低消費電力でタスク完了確率が高いことを示す。
論文 参考訳(メタデータ) (2023-12-31T10:16:59Z) - Joint User Association, Interference Cancellation and Power Control for
Multi-IRS Assisted UAV Communications [80.35959154762381]
インテリジェント反射面(IRS)支援無人航空機(UAV)通信は、地上基地局の負荷を低コストで軽減することが期待されている。
既存の研究は主に、複数のIRSではなく単一のIRSの配置とリソース割り当てに焦点を当てている。
我々は,共同IRSユーザアソシエーションのための新しい最適化アルゴリズム,UAVの軌道最適化,逐次干渉キャンセル(SIC)復号命令スケジューリング,電力割り当てを提案する。
論文 参考訳(メタデータ) (2023-12-08T01:57:10Z) - Multi-Objective Optimization for UAV Swarm-Assisted IoT with Virtual
Antenna Arrays [55.736718475856726]
無人航空機(UAV)ネットワークはIoT(Internet-of-Things)を支援するための有望な技術である
既存のUAV支援データ収集および普及スキームでは、UAVはIoTとアクセスポイントの間を頻繁に飛行する必要がある。
協調ビームフォーミングをIoTとUAVに同時に導入し、エネルギーと時間効率のデータ収集と普及を実現した。
論文 参考訳(メタデータ) (2023-08-03T02:49:50Z) - Lower Bounds and Optimal Algorithms for Smooth and Strongly Convex
Decentralized Optimization Over Time-Varying Networks [79.16773494166644]
通信ネットワークのノード間を分散的に保存するスムーズで強い凸関数の和を最小化するタスクについて検討する。
我々は、これらの下位境界を達成するための2つの最適アルゴリズムを設計する。
我々は,既存の最先端手法と実験的な比較を行うことにより,これらのアルゴリズムの理論的効率を裏付ける。
論文 参考訳(メタデータ) (2021-06-08T15:54:44Z) - Energy Efficient Edge Computing: When Lyapunov Meets Distributed
Reinforcement Learning [12.845204986571053]
本研究では,エッジコンピューティングによるエネルギー効率のよいオフロード問題について検討する。
考慮されたシナリオでは、複数のユーザが同時に無線およびエッジコンピューティングリソースを競う。
提案されたソリューションは、ベンチマークアプローチと比較してネットワークのエネルギー効率を高めることもできます。
論文 参考訳(メタデータ) (2021-03-31T11:02:29Z) - Sum-Rate Maximization for UAV-assisted Visible Light Communications
using NOMA: Swarm Intelligence meets Machine Learning [15.385078410753986]
非直交多重アクセスネットワークを用いたUAV支援可視光通信(VLC)を検討する。
サービス利用者とUAVの位置の合計を最大化するために、電力配分とUAV配置の問題を策定します。
ハリスホークス最適化(HHO)を用いて定式化課題の解法と効率的な解法を提案する。
論文 参考訳(メタデータ) (2021-01-10T08:21:49Z) - Deep Reinforcement Learning for Delay-Oriented IoT Task Scheduling in
Space-Air-Ground Integrated Network [24.022108191145527]
宇宙空間統合ネットワーク(SAGIN)における遅延指向モノのインターネット(IoT)サービスにおけるタスクスケジューリング問題について検討する。
検討されたシナリオでは、無人航空機(UAV)がIoTデバイスからコンピューティングタスクを収集し、オンラインのオフロード決定を行う。
我々の目的は、UAVエネルギー容量の制約により、タスクのオフロードと計算遅延を最小限に抑えるタスクスケジューリングポリシーを設計することである。
論文 参考訳(メタデータ) (2020-10-04T02:58:03Z) - Combining Deep Learning and Optimization for Security-Constrained
Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。
SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。
本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-14T12:38:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。