論文の概要: Multi-Agent Deep Reinforcement Learning for Cost- and Delay-Sensitive
Virtual Network Function Placement and Routing
- arxiv url: http://arxiv.org/abs/2206.12146v1
- Date: Fri, 24 Jun 2022 08:24:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-27 23:03:42.555882
- Title: Multi-Agent Deep Reinforcement Learning for Cost- and Delay-Sensitive
Virtual Network Function Placement and Routing
- Title(参考訳): コスト・遅延感性仮想ネットワーク機能配置とルーティングのためのマルチエージェント深層強化学習
- Authors: Shaoyang Wang and Chau Yuen and Wei Ni and Guan Yong Liang and Tiejun
Lv
- Abstract要約: 本稿では、仮想ネットワーク機能(VNF)配置とルーティング(P&R)を解決するための、効果的で新しいマルチエージェント深部強化学習(MADRL)法を提案する。
我々はまず,NP完全であるサービス遅延と資源消費コストの重み付けを最小化するために,VNF P&R問題を構築する。
2つのサブタスクを実行するためにMADRL-P&Rフレームワークを設計した。
- 参考スコア(独自算出の注目度): 36.51614774073273
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: This paper proposes an effective and novel multiagent deep reinforcement
learning (MADRL)-based method for solving the joint virtual network function
(VNF) placement and routing (P&R), where multiple service requests with
differentiated demands are delivered at the same time. The differentiated
demands of the service requests are reflected by their delay- and
cost-sensitive factors. We first construct a VNF P&R problem to jointly
minimize a weighted sum of service delay and resource consumption cost, which
is NP-complete. Then, the joint VNF P&R problem is decoupled into two iterative
subtasks: placement subtask and routing subtask. Each subtask consists of
multiple concurrent parallel sequential decision processes. By invoking the
deep deterministic policy gradient method and multi-agent technique, an
MADRL-P&R framework is designed to perform the two subtasks. The new joint
reward and internal rewards mechanism is proposed to match the goals and
constraints of the placement and routing subtasks. We also propose the
parameter migration-based model-retraining method to deal with changing network
topologies. Corroborated by experiments, the proposed MADRL-P&R framework is
superior to its alternatives in terms of service cost and delay, and offers
higher flexibility for personalized service demands. The parameter
migration-based model-retraining method can efficiently accelerate convergence
under moderate network topology changes.
- Abstract(参考訳): 本稿では,複数のサービス要求が同時に配信される仮想ネットワーク機能(vnf)配置とルーティング(p&r)を解決するための,有効かつ新しいマルチエージェント深層強化学習(madrl)ベースの手法を提案する。
サービス要求の異なる要求は、遅延とコストに敏感な要因によって反映されます。
我々はまず,NP完全であるサービス遅延と資源消費コストの重み付けを最小化するために,VNF P&R問題を構築する。
次に、共同VNF P&R問題は、配置サブタスクとルーティングサブタスクの2つの反復サブタスクに分解される。
各サブタスクは、複数の並列逐次決定プロセスで構成される。
深い決定論的ポリシー勾配法とマルチエージェント法を呼び出すことにより、madrl-p&rフレームワークは2つのサブタスクを実行するように設計されている。
新しい共同報酬機構と内部報酬機構は、配置とルーティングサブタスクの目標と制約に合致するように提案されている。
また,ネットワークトポロジの変化に対処するパラメータマイグレーションに基づくモデル調整手法を提案する。
実験によって裏付けられ、提案されたMADRL-P&Rフレームワークは、サービスコストと遅延の点で代替よりも優れており、パーソナライズされたサービス要求に対してより高い柔軟性を提供する。
パラメータマイグレーションに基づくモデルリトレーニング手法は,中程度のネットワークトポロジ変化下での収束を効率的に促進することができる。
関連論文リスト
- Joint Admission Control and Resource Allocation of Virtual Network Embedding via Hierarchical Deep Reinforcement Learning [69.00997996453842]
本稿では,仮想ネットワークの埋め込みにおいて,入出力制御と資源配分を併用して学習する深層強化学習手法を提案する。
HRL-ACRAは,受入率と長期平均収益の両面で,最先端のベースラインを上回っていることを示す。
論文 参考訳(メタデータ) (2024-06-25T07:42:30Z) - A Multi-Head Ensemble Multi-Task Learning Approach for Dynamical
Computation Offloading [62.34538208323411]
共有バックボーンと複数の予測ヘッド(PH)を組み合わせたマルチヘッドマルチタスク学習(MEMTL)手法を提案する。
MEMTLは、追加のトレーニングデータを必要とせず、推測精度と平均平方誤差の両方でベンチマーク手法より優れている。
論文 参考訳(メタデータ) (2023-09-02T11:01:16Z) - Inter-Cell Network Slicing With Transfer Learning Empowered Multi-Agent
Deep Reinforcement Learning [6.523367518762879]
ネットワークスライシングにより、オペレータは共通の物理インフラ上で多様なアプリケーションを効率的にサポートできる。
ネットワーク展開の恒常的に増大する密度化は、複雑で非自明な細胞間干渉を引き起こす。
複数の深層強化学習(DRL)エージェントを用いたDIRPアルゴリズムを開発し,各セルの資源分配を協調的に最適化する。
論文 参考訳(メタデータ) (2023-06-20T14:14:59Z) - A State-Augmented Approach for Learning Optimal Resource Management
Decisions in Wireless Networks [58.720142291102135]
マルチユーザ無線ネットワークにおける無線リソース管理(RRM)問題について考察する。
目標は、ユーザのエルゴード平均パフォーマンスに制約を受けるネットワーク全体のユーティリティ機能を最適化することである。
本稿では, RRM の制約に対応する2変数の集合を入力として, 瞬時ネットワーク状態と並行して, RRM のパラメータ化を提案する。
論文 参考訳(メタデータ) (2022-10-28T21:24:13Z) - Multi-Objective Provisioning of Network Slices using Deep Reinforcement
Learning [5.074839768784803]
リアルタイムネットワークスライスプロビジョニング(NSP)問題は、オンライン多目的プログラミング最適化(MOIPO)問題としてモデル化されている。
交通需要予測にPPO(Proximal Policy Optimization)法を適用することにより,MOIPO問題の解を近似する。
提案手法の有効性を,SLA違反率とネットワーク運用コストの低いMOIPO解法と比較した。
論文 参考訳(メタデータ) (2022-07-27T23:04:22Z) - Fidelity-Guarantee Entanglement Routing in Quantum Networks [64.49733801962198]
絡み合いルーティングは、2つの任意のノード間のリモート絡み合い接続を確立する。
量子ネットワークにおける複数のソース・デスティネーション(SD)ペアの忠実性を保証するために、精製可能な絡み合わせルーティング設計を提案する。
論文 参考訳(メタデータ) (2021-11-15T14:07:22Z) - Joint Resource Management for MC-NOMA: A Deep Reinforcement Learning
Approach [39.54978539962088]
本稿では, 共同資源管理(JRM)への新規かつ効果的な深層強化学習(DRL)に基づくアプローチを提案する。
実用的なマルチキャリア非直交多重アクセス(MC-NOMA)システムでは、ハードウェアの感度と不完全な連続干渉キャンセル(SIC)が考慮されます。
DRL-JRM方式はシステムスループットと干渉耐性の観点から既存の方式よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-03-29T06:52:19Z) - Dynamic RAN Slicing for Service-Oriented Vehicular Networks via
Constrained Learning [40.5603189901241]
品質の異なる車両用インターネット(IoV)サービスにおける無線アクセスネットワーク(RAN)スライシング問題について検討する。
無線スペクトルと演算資源を動的に割り当てる動的RANスライシングフレームワークを提案する。
RAWSは,ベンチマークと比較すると,要求を高い確率で満たしながら,システムコストを効果的に削減できることを示す。
論文 参考訳(メタデータ) (2020-12-03T15:08:38Z) - Meta Reinforcement Learning with Autonomous Inference of Subtask
Dependencies [57.27944046925876]
本稿では,タスクがサブタスクグラフによって特徴づけられるような,新しい数発のRL問題を提案し,対処する。
メタ政治を直接学習する代わりに、Subtask Graph Inferenceを使ったメタラーナーを開発した。
実験の結果,2つのグリッドワールド領域とStarCraft II環境において,提案手法が潜在タスクパラメータを正確に推定できることが確認された。
論文 参考訳(メタデータ) (2020-01-01T17:34:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。