論文の概要: Joint Service Caching, Communication and Computing Resource Allocation
in Collaborative MEC Systems: A DRL-based Two-timescale Approach
- arxiv url: http://arxiv.org/abs/2307.09691v1
- Date: Wed, 19 Jul 2023 00:27:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-20 15:45:07.795171
- Title: Joint Service Caching, Communication and Computing Resource Allocation
in Collaborative MEC Systems: A DRL-based Two-timescale Approach
- Title(参考訳): 協調型MECシステムにおける共同サービスキャッシング・通信・資源配分:DRLに基づく二段階的アプローチ
- Authors: Qianqian Liu and Haixia Zhang and Xin Zhang and Dongfeng Yuan
- Abstract要約: 端末の厳格なQuality of Service(QoS)要件を満たすため、Multi Access Edge Computing(MEC)システムに課題が課されている。
エッジサーバ間のリソース共有を容易にする協調的なフレームワークを提案する。
提案アルゴリズムは,平均スイッチングおよびキャッシュコストにおいて,ベースラインアルゴリズムよりも優れていることを示す。
- 参考スコア(独自算出の注目度): 15.264005855141901
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Meeting the strict Quality of Service (QoS) requirements of terminals has
imposed a signiffcant challenge on Multiaccess Edge Computing (MEC) systems,
due to the limited multidimensional resources. To address this challenge, we
propose a collaborative MEC framework that facilitates resource sharing between
the edge servers, and with the aim to maximize the long-term QoS and reduce the
cache switching cost through joint optimization of service caching,
collaborative offfoading, and computation and communication resource
allocation. The dual timescale feature and temporal recurrence relationship
between service caching and other resource allocation make solving the problem
even more challenging. To solve it, we propose a deep reinforcement learning
(DRL)-based dual timescale scheme, called DGL-DDPG, which is composed of a
short-term genetic algorithm (GA) and a long short-term memory network-based
deep deterministic policy gradient (LSTM-DDPG). In doing so, we reformulate the
optimization problem as a Markov decision process (MDP) where the
small-timescale resource allocation decisions generated by an improved GA are
taken as the states and input into a centralized LSTM-DDPG agent to generate
the service caching decision for the large-timescale. Simulation results
demonstrate that our proposed algorithm outperforms the baseline algorithms in
terms of the average QoS and cache switching cost.
- Abstract(参考訳): 端末の厳格なQuality of Service (QoS) 要件を満たすため、マルチアクセスエッジコンピューティング (MEC) システムには、限られた多次元リソースが要求されている。
そこで本研究では,エッジサーバ間のリソース共有を容易にする協調型mecフレームワークを提案し,サービスキャッシング,協調オフフォアディング,計算および通信リソース割り当ての協調最適化により,長期qosを最大化し,キャッシュ切り替えコストを削減することを目的としている。
サービスキャッシングと他のリソース割り当ての2つのタイムスケール機能と一時的なリカレント関係は、この問題をさらに困難にします。
そこで本研究では,DGL-DDPGと呼ばれるDGL-DDPGという,DRLに基づく2次元時間スケールスキームを提案し,その手法として,短期遺伝的アルゴリズム(GA)と長期記憶ネットワークに基づくDeep Deterministic Policy gradient(LSTM-DDPG)を提案する。
そこで我々は,改良GAによって生成された小規模資源配分決定を状態として,集中型LSTM-DDPGエージェントに入力し,大規模なサービスキャッシュ決定を生成するマルコフ決定プロセス(MDP)として最適化問題を再構築する。
シミュレーションの結果,提案アルゴリズムは,平均QoSおよびキャッシュ切替コストの観点から,ベースラインアルゴリズムよりも優れていた。
関連論文リスト
- Two-Timescale Model Caching and Resource Allocation for Edge-Enabled AI-Generated Content Services [55.0337199834612]
Generative AI(GenAI)は、カスタマイズされたパーソナライズされたAI生成コンテンツ(AIGC)サービスを可能にするトランスフォーメーション技術として登場した。
これらのサービスは数十億のパラメータを持つGenAIモデルの実行を必要とし、リソース制限の無線エッジに重大な障害を生じさせる。
我々は、AIGC品質とレイテンシメトリクスのトレードオフをバランスさせるために、AIGCサービスのジョイントモデルキャッシングとリソースアロケーションの定式化を導入する。
論文 参考訳(メタデータ) (2024-11-03T07:01:13Z) - Adaptive User-Centric Entanglement Routing in Quantum Data Networks [5.421492821020181]
分散量子コンピューティング(DQC)は、量子データネットワーク(QDN)を介して複数の小さな量子コンピュータ(QC)を相互接続することで、量子コンピューティングの可能性を活用するという大きな可能性を秘めている。
QDN内の量子テレポーテーションのための2つのQC間の長距離量子絡み合わせを確立することは重要な側面であり、絡み合わせルーティングを伴う。
既存のアプローチは主に、現在の絡み合い接続(EC)要求に対する絡み合い性能の最適化に重点を置いている。
本稿では,ユーザの予算制約に固執しながら,絡み合いの成功率を最大化するために,長期にわたるユーザ中心の絡み合いルーティング問題を提案する。
論文 参考訳(メタデータ) (2024-04-13T17:20:00Z) - Client Orchestration and Cost-Efficient Joint Optimization for
NOMA-Enabled Hierarchical Federated Learning [55.49099125128281]
半同期クラウドモデルアグリゲーションの下で非直交多重アクセス(NOMA)を実現するHFLシステムを提案する。
提案手法は,HFLの性能改善と総コスト削減に関するベンチマークよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-11-03T13:34:44Z) - Double Deep Q-Learning-based Path Selection and Service Placement for
Latency-Sensitive Beyond 5G Applications [11.864695986880347]
本稿では,CCRAと呼ばれる通信資源割当と計算機資源割当の連立問題を,総コストを最小化するために検討する。
我々は,この問題を非線形プログラミングモデルとして定式化し,B&B-CCRAとWF-CCRAという2つのアプローチを提案する。
数値シミュレーションにより,B&B-CCRAが最適解であるのに対し,WF-CCRAは比較的短い時間でほぼ最適解を提供することがわかった。
論文 参考訳(メタデータ) (2023-09-18T22:17:23Z) - Deep Reinforcement Learning for Uplink Scheduling in NOMA-URLLC Networks [7.182684187774442]
本稿では,無線ネットワークにおけるURLLC(Ultra Reliable Low Communications)の問題に対処する。
本稿では,厳密な期限を含む非直交多重アクセス(NOMA)アップリンクURLLCスケジューリング問題を解くために,DRL(Deep Reinforcement Learning)スケジューリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-08-28T12:18:02Z) - Elastic Entangled Pair and Qubit Resource Management in Quantum Cloud
Computing [73.7522199491117]
量子クラウドコンピューティング(QCC)は、量子コンピューティングリソースを効率的に提供するための有望なアプローチを提供する。
ユーザ需要の変動と量子回路の要求は、効率的なリソース供給のために困難である。
本稿では、量子コンピューティングとネットワークリソースのプロビジョニングのためのリソース割り当てモデルを提案する。
論文 参考訳(メタデータ) (2023-07-25T00:38:46Z) - Decentralized Federated Reinforcement Learning for User-Centric Dynamic
TFDD Control [37.54493447920386]
非対称かつ不均一なトラフィック要求を満たすための学習に基づく動的時間周波数分割二重化(D-TFDD)方式を提案する。
分散化された部分観測可能なマルコフ決定過程(Dec-POMDP)として問題を定式化する。
本稿では,グローバルリソースを分散的に最適化するために,Wolpertinger Deep Deterministic Policy gradient (FWDDPG)アルゴリズムという,連合強化学習(RL)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-11-04T07:39:21Z) - Collaborative Intelligent Reflecting Surface Networks with Multi-Agent
Reinforcement Learning [63.83425382922157]
インテリジェント・リフレクション・サーフェス(IRS)は将来の無線ネットワークに広く応用されることが想定されている。
本稿では,エネルギー収穫能力を備えた協調型IRSデバイスを用いたマルチユーザ通信システムについて検討する。
論文 参考訳(メタデータ) (2022-03-26T20:37:14Z) - Resource Allocation via Model-Free Deep Learning in Free Space Optical
Communications [119.81868223344173]
本稿では,自由空間光学(FSO)通信におけるチャネルフェージング効果の緩和のための資源配分の一般的な問題について検討する。
本フレームワークでは,FSO資源割り当て問題を解決する2つのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-27T17:38:51Z) - Combining Deep Learning and Optimization for Security-Constrained
Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。
SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。
本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-14T12:38:21Z) - Reinforcement Learning Based Cooperative Coded Caching under Dynamic
Popularities in Ultra-Dense Networks [38.44125997148742]
小規模基地局(SBS)のキャッシュ戦略は、膨大なデータレート要求を満たすために重要である。
我々は、強化学習(RL)を利用して、最大距離分離可能(MDS)符号化による協調的なキャッシュ戦略を設計する。
論文 参考訳(メタデータ) (2020-03-08T10:45:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。