論文の概要: Evolutionary Multi-Objective Reinforcement Learning Based Trajectory
Control and Task Offloading in UAV-Assisted Mobile Edge Computing
- arxiv url: http://arxiv.org/abs/2202.12028v1
- Date: Thu, 24 Feb 2022 11:17:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-25 18:10:13.564638
- Title: Evolutionary Multi-Objective Reinforcement Learning Based Trajectory
Control and Task Offloading in UAV-Assisted Mobile Edge Computing
- Title(参考訳): UAV支援モバイルエッジコンピューティングにおける進化的多目的強化学習に基づく軌道制御とタスクオフロード
- Authors: Fuhong Song, Huanlai Xing, Xinhan Wang, Shouxi Luo, Penglin Dai,
Zhiwen Xiao, Bowen Zhao
- Abstract要約: 本稿では,無人航空機(UAV)を用いた移動体エッジコンピューティングシステムにおける軌道制御とタスクオフロード(TCTO)問題について検討する。
進化的多目的RL(EMORL)、多目的RLをTCTO問題に適用する。
- 参考スコア(独自算出の注目度): 8.168647937560504
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper studies the trajectory control and task offloading (TCTO) problem
in an unmanned aerial vehicle (UAV)-assisted mobile edge computing system,
where a UAV flies along a planned trajectory to collect computation tasks from
smart devices (SDs). We consider a scenario that SDs are not directly connected
by the base station (BS) and the UAV has two roles to play: MEC server or
wireless relay. The UAV makes task offloading decisions online, in which the
collected tasks can be executed locally on the UAV or offloaded to the BS for
remote processing. The TCTO problem involves multi-objective optimization as
its objectives are to minimize the task delay and the UAV's energy consumption,
and maximize the number of tasks collected by the UAV, simultaneously. This
problem is challenging because the three objectives conflict with each other.
The existing reinforcement learning (RL) algorithms, either single-objective
RLs or single-policy multi-objective RLs, cannot well address the problem since
they cannot output multiple policies for various preferences (i.e. weights)
across objectives in a single run. This paper adapts the evolutionary
multi-objective RL (EMORL), a multi-policy multi-objective RL, to the TCTO
problem. This algorithm can output multiple optimal policies in just one run,
each optimizing a certain preference. The simulation results demonstrate that
the proposed algorithm can obtain more excellent nondominated policies by
striking a balance between the three objectives regarding policy quality,
compared with two evolutionary and two multi-policy RL algorithms.
- Abstract(参考訳): 本稿では,無人航空機(UAV)支援移動体エッジコンピューティングシステムにおけるトラジェクトリ制御とタスクオフロード(TCTO)問題について検討し,UAVが計画された軌道に沿って飛行し,スマートデバイス(SD)から計算タスクを収集する。
基地局(BS)とUAVが直接接続しないシナリオとして,MECサーバと無線中継という2つの役割がある。
UAVはタスクオフロード決定をオンラインで行い、収集したタスクをUAV上でローカルに実行したり、リモート処理のためにBSにオフロードしたりすることができる。
TCTOの問題は、タスク遅延とUAVのエネルギー消費を最小化し、UAVが収集したタスク数を同時に最大化することを目的として、多目的最適化を行う。
この問題は3つの目的が互いに衝突するため難しい。
既存の強化学習アルゴリズム(single-objective rlsまたはsingle-policy multi-objective rls)は、様々な好み(すなわち重み)に対して単一の実行で複数のポリシーを出力できないため、この問題にうまく対処できない。
本稿では,マルチポリシーなマルチ目的rlである進化的多目的rl(emorl)をtcto問題に適用する。
このアルゴリズムは、1つの実行で複数の最適なポリシーを出力でき、それぞれが特定の好みを最適化する。
シミュレーションの結果,提案手法は2つの進化型rlアルゴリズムと2つのマルチポリシーrlアルゴリズムと比較して,政策品質に関する3つの目標のバランスを取ることにより,より優れた非支配型ポリシーが得られることがわかった。
関連論文リスト
- Multi-Objective Reinforcement Learning for Power Grid Topology Control [0.20971479389679337]
置換によるトポロジー制御は、混雑を減少させるが、そのポテンシャルは操作中に過度に露出している。
本稿では,多目的強化学習(MORL)を用いた電力グリッドトポロジ制御のための複数の競合対象の統合について検討する。
論文 参考訳(メタデータ) (2025-01-27T12:23:03Z) - Task Delay and Energy Consumption Minimization for Low-altitude MEC via Evolutionary Multi-objective Deep Reinforcement Learning [52.64813150003228]
無人航空機や他の航空機による低高度経済(LAE)は、輸送、農業、環境監視といった分野に革命をもたらした。
今後の6世代(6G)時代において、UAV支援移動エッジコンピューティング(MEC)は特に山岳や災害に遭った地域のような困難な環境において重要である。
タスクオフロード問題は、主にタスク遅延の最小化とUAVのエネルギー消費のトレードオフに対処するUAV支援MECの重要な問題の一つである。
論文 参考訳(メタデータ) (2025-01-11T02:32:42Z) - DNN Task Assignment in UAV Networks: A Generative AI Enhanced Multi-Agent Reinforcement Learning Approach [16.139481340656552]
本稿では,マルチエージェント強化学習(MARL)と生成拡散モデル(GDM)を組み合わせた共同手法を提案する。
第2段階では,GDMのリバース・デノナイズ・プロセスを利用して,マルチエージェント・ディープ・Deep Deterministic Policy gradient(MADDPG)におけるアクタネットワークを置き換える新しいDNNタスク割当アルゴリズム(GDM-MADDPG)を導入する。
シミュレーションの結果,提案アルゴリズムは,経路計画,情報化時代(AoI),エネルギー消費,タスク負荷分散の観点から,ベンチマークに比較して良好な性能を示した。
論文 参考訳(メタデータ) (2024-11-13T02:41:02Z) - UAV-enabled Collaborative Beamforming via Multi-Agent Deep Reinforcement Learning [79.16150966434299]
本稿では,UAVを用いた協調ビームフォーミング多目的最適化問題 (UCBMOP) を定式化し,UAVの伝送速度を最大化し,全UAVのエネルギー消費を最小化する。
ヘテロジニアス・エージェント・信頼領域ポリシー最適化(HATRPO)を基本フレームワークとし,改良されたHATRPOアルゴリズム,すなわちHATRPO-UCBを提案する。
論文 参考訳(メタデータ) (2024-04-11T03:19:22Z) - DL-DRL: A double-level deep reinforcement learning approach for
large-scale task scheduling of multi-UAV [65.07776277630228]
分割・征服フレームワーク(DCF)に基づく二重レベル深層強化学習(DL-DRL)手法を提案する。
特に,上層部DRLモデルにおけるエンコーダ・デコーダ構成ポリシネットワークを設計し,タスクを異なるUAVに割り当てる。
また、低レベルDRLモデルにおける別の注意に基づくポリシーネットワークを利用して、各UAVの経路を構築し、実行されたタスク数を最大化する。
論文 参考訳(メタデータ) (2022-08-04T04:35:53Z) - Controllable Dynamic Multi-Task Architectures [92.74372912009127]
本稿では,そのアーキテクチャと重みを動的に調整し,所望のタスク選択とリソース制約に適合させる制御可能なマルチタスクネットワークを提案する。
本稿では,タスク親和性と分岐正規化損失を利用した2つのハイパーネットの非交互トレーニングを提案し,入力の嗜好を取り入れ,適応重み付き木構造モデルを予測する。
論文 参考訳(メタデータ) (2022-03-28T17:56:40Z) - Optimization for Master-UAV-powered Auxiliary-Aerial-IRS-assisted IoT
Networks: An Option-based Multi-agent Hierarchical Deep Reinforcement
Learning Approach [56.84948632954274]
本稿では,無人航空機(MUAV)搭載のIoT(Internet of Things)ネットワークについて検討する。
本稿では、インテリジェント反射面(IRS)を備えた充電可能な補助UAV(AUAV)を用いて、MUAVからの通信信号を強化することを提案する。
提案モデルでは,IoTネットワークの蓄積スループットを最大化するために,これらのエネルギー制限されたUAVの最適協調戦略について検討する。
論文 参考訳(メタデータ) (2021-12-20T15:45:28Z) - Multi-Agent Deep Reinforcement Learning Based Trajectory Planning for
Multi-UAV Assisted Mobile Edge Computing [99.27205900403578]
無人航空機(UAV)支援移動エッジコンピューティング(MEC)フレームワークを提案する。
我々は,全ユーザ機器(UE)の地理的公正性と,各UAVのUE負荷の公平性を共同で最適化することを目的としている。
提案手法は他の従来のアルゴリズムよりもかなり性能が高いことを示す。
論文 参考訳(メタデータ) (2020-09-23T17:44:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。