論文の概要: Hierarchical Reinforcement Learning for the Dynamic VNE with Alternatives Problem
- arxiv url: http://arxiv.org/abs/2512.05207v1
- Date: Thu, 04 Dec 2025 19:22:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-13 22:40:56.786692
- Title: Hierarchical Reinforcement Learning for the Dynamic VNE with Alternatives Problem
- Title(参考訳): 代替問題を考慮した動的VNEの階層的強化学習
- Authors: Ali Al Housseini, Cristina Rottondi, Omran Ayoub,
- Abstract要約: VNEと代替位相(VNEAP)は、可鍛性VNRを捕捉するために導入された。
本稿では,動的到着下でのVNEAPの階層的強化学習手法であるHRL-VNEAPを提案する。
- 参考スコア(独自算出の注目度): 0.818198392834469
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Virtual Network Embedding (VNE) is a key enabler of network slicing, yet most formulations assume that each Virtual Network Request (VNR) has a fixed topology. Recently, VNE with Alternative topologies (VNEAP) was introduced to capture malleable VNRs, where each request can be instantiated using one of several functionally equivalent topologies that trade resources differently. While this flexibility enlarges the feasible space, it also introduces an additional decision layer, making dynamic embedding more challenging. This paper proposes HRL-VNEAP, a hierarchical reinforcement learning approach for VNEAP under dynamic arrivals. A high-level policy selects the most suitable alternative topology (or rejects the request), and a low-level policy embeds the chosen topology onto the substrate network. Experiments on realistic substrate topologies under multiple traffic loads show that naive exploitation strategies provide only modest gains, whereas HRL-VNEAP consistently achieves the best performance across all metrics. Compared to the strongest tested baselines, HRL-VNEAP improves acceptance ratio by up to \textbf{20.7\%}, total revenue by up to \textbf{36.2\%}, and revenue-over-cost by up to \textbf{22.1\%}. Finally, we benchmark against an MILP formulation on tractable instances to quantify the remaining gap to optimality and motivate future work on learning- and optimization-based VNEAP solutions.
- Abstract(参考訳): VNE(Virtual Network Embedding)は、ネットワークスライシングの鍵となる実装であるが、ほとんどの定式化では、それぞれのVirtual Network Request(VNR)が固定トポロジを持つと仮定している。
近年,VNEと代替トポロジ(VNEAP)を導入し,資源を交換する機能的に等価なトポロジの1つを用いて,各要求をインスタンス化できるようになった。
この柔軟性は実現可能なスペースを拡大する一方で、さらなる決定層を導入し、動的埋め込みをより困難にします。
本稿では,動的到着下でのVNEAPの階層的強化学習手法であるHRL-VNEAPを提案する。
高レベルポリシーは最も適切な代替トポロジを選択し(または要求を拒否)、低レベルポリシーは選択したトポロジを基板ネットワークに埋め込む。
複数のトラフィック負荷下での現実的な基板トポロジの実験では、単純利用戦略は緩やかな利得しか得られず、HRL-VNEAPは全ての指標で常に最高のパフォーマンスを達成している。
最強試験ベースラインと比較して、HRL-VNEAPは、受け入れ比率を \textbf{20.7\%}、総収入を \textbf{36.2\%}、収益を \textbf{22.1\%} まで改善する。
最後に、抽出可能なインスタンス上でMILPの定式化をベンチマークし、最適性への残りのギャップを定量化し、学習と最適化に基づくVNEAPソリューションの将来的な取り組みを動機付けます。
関連論文リスト
- Multi-Task Vehicle Routing Solver via Mixture of Specialized Experts under State-Decomposable MDP [57.28979643999352]
本稿では,VRPの変種間で共有成分の性質を認識可能な統合解法フレームワークを提案する。
状態空間を基底状態空間のカルテアン積として表現することにより、VRPを再構成する状態分解型MDP(SDMDP)を導入する。
The Latent Space-based SDMDP extension is developed by the both the optimal basis policy and a learnable mix function。
論文 参考訳(メタデータ) (2025-10-24T13:31:31Z) - Joint Admission Control and Resource Allocation of Virtual Network Embedding via Hierarchical Deep Reinforcement Learning [69.00997996453842]
本稿では,仮想ネットワークの埋め込みにおいて,入出力制御と資源配分を併用して学習する深層強化学習手法を提案する。
HRL-ACRAは,受入率と長期平均収益の両面で,最先端のベースラインを上回っていることを示す。
論文 参考訳(メタデータ) (2024-06-25T07:42:30Z) - FlagVNE: A Flexible and Generalizable Reinforcement Learning Framework for Network Resource Allocation [31.74480390058691]
FLexible And Generalizable RL framework for VNE, named FlagVNEを提案する。
広範かつダイナミックな動作空間に取り組むために,適応的な動作確率分布を生成する階層型デコーダを設計する。
様々なVNRサイズの一般化問題を克服するために,メタRLに基づくトレーニング手法を提案する。
論文 参考訳(メタデータ) (2024-04-19T05:24:24Z) - Adaptive Resource Allocation for Virtualized Base Stations in O-RAN with Online Learning [55.08287089554127]
基地局(vBS)を備えたオープンラジオアクセスネットワークシステムは、柔軟性の向上、コスト削減、ベンダーの多様性、相互運用性のメリットを提供する。
本研究では,予期せぬ「混み合う」環境下であっても,効率的なスループットとvBSエネルギー消費のバランスをとるオンライン学習アルゴリズムを提案する。
提案手法は, 課題のある環境においても, 平均最適性ギャップをゼロにすることで, サブ線形後悔を実現する。
論文 参考訳(メタデータ) (2023-09-04T17:30:21Z) - Resource Allocation via Model-Free Deep Learning in Free Space Optical
Communications [119.81868223344173]
本稿では,自由空間光学(FSO)通信におけるチャネルフェージング効果の緩和のための資源配分の一般的な問題について検討する。
本フレームワークでは,FSO資源割り当て問題を解決する2つのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-27T17:38:51Z) - Deep Adaptive Inference Networks for Single Image Super-Resolution [72.7304455761067]
シングルイメージ超解像(SISR)は、ディープ畳み込みニューラルネットワーク(CNN)の展開により、近年大きく進歩している。
本稿では,深部SISR(AdaDSR)の適応型推論ネットワークを活用することで,この問題に対処する。
我々のAdaDSRは、SISRモデルをバックボーンとし、画像の特徴とリソース制約を入力として取り、ローカルネットワーク深さのマップを予測する軽量アダプタモジュールを備える。
論文 参考訳(メタデータ) (2020-04-08T10:08:20Z) - Deep Reinforcement Learning with Robust and Smooth Policy [90.78795857181727]
我々は、国家に対して円滑に振る舞う円滑な政策を学ぶことを提案する。
textbfSmooth textbfRegularized textbfReinforcement textbfLearning(textbfSR2textbfL$)という新しいフレームワークを開発し、スムーズな正規化によってポリシーを訓練する。
このような正規化は、探索空間を効果的に制限し、学習ポリシーの滑らかさを強制する。
論文 参考訳(メタデータ) (2020-03-21T00:10:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。