論文の概要: Monkey Business: Reinforcement learning meets neighborhood search for
Virtual Network Embedding
- arxiv url: http://arxiv.org/abs/2202.13706v1
- Date: Mon, 28 Feb 2022 12:00:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-02 01:48:24.657477
- Title: Monkey Business: Reinforcement learning meets neighborhood search for
Virtual Network Embedding
- Title(参考訳): Monkey Business:強化学習が仮想ネットワークの埋め込みを近隣で検索
- Authors: Maxime Elkael, Massinissa Ait Aba, Andrea Araldo, Hind Castel, Badii
Jouaber
- Abstract要約: 5Gネットワークスライシングにおける仮想ネットワーク埋め込み(VNE)問題について考察する。
我々はNested Rollout Policy Adaptation (NRPA)アルゴリズムにヒントを得て,NEPA(Neighborhood Enhanced Policy Adaptation)と呼ばれる新しいアルゴリズムを提案する。
NEPAはNRPAとNeighbordhood Searchを組み合わせることで学習する。
- 参考スコア(独自算出の注目度): 0.8312192184427761
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this article, we consider the Virtual Network Embedding (VNE) problem for
5G networks slicing. This problem requires to allocate multiple Virtual
Networks (VN) on a substrate virtualized physical network while maximizing
among others, resource utilization, maximum number of placed VNs and network
operator's benefit. We solve the online version of the problem where slices
arrive over time. Inspired by the Nested Rollout Policy Adaptation (NRPA)
algorithm, a variant of the well known Monte Carlo Tree Search (MCTS) that
learns how to perform good simulations over time, we propose a new algorithm
that we call Neighborhood Enhanced Policy Adaptation (NEPA). The key feature of
our algorithm is to observe NRPA cannot exploit knowledge acquired in one
branch of the state tree for another one which starts differently. NEPA learns
by combining NRPA with Neighbordhood Search in a frugal manner which improves
only promising solutions while keeping the running time low. We call this
technique a monkey business because it comes down to jumping from one
interesting branch to the other, similar to how monkeys jump from tree to tree
instead of going down everytime. NEPA achieves better results in terms of
acceptance ratio and revenue-to-cost ratio compared to other state-of-the-art
algorithms, both on real and synthetic topologies.
- Abstract(参考訳): 本稿では,5Gネットワークスライシングにおける仮想ネットワーク埋め込み(VNE)問題について考察する。
この問題は、複数の仮想ネットワーク(VN)を基板仮想化物理ネットワークに割り当てると同時に、リソース利用量、VNの最大配置数、ネットワークオペレータのメリットを最大化する必要がある。
時間とともにスライスが到着する問題のオンライン版を解決します。
NEPA(Neighborhood Enhanced Policy Adaptation)と呼ばれるアルゴリズムを提案する。Nested Rollout Policy Adaptation (NRPA)アルゴリズムは、よく知られたモンテカルロ木探索(MCTS)の変種である。
提案アルゴリズムの重要な特徴は,NRPAが状態木の1つの枝から得た知識を,異なるスタートの枝に対して活用できないことである。
nepaは、nrpaとneighentdhood searchをフルガルな方法で組み合わせて学習し、実行時間を低く保ちながら、有望なソリューションのみを改善する。
このテクニックを猿のビジネスと呼んでいるのは、サルが毎回降りるのではなく、木から木へとジャンプするのと同じように、ある興味深い枝から別の枝へとジャンプするからである。
NEPAは、実際のトポロジと合成トポロジの両方で、他の最先端のアルゴリズムと比較して、受入率と収益対コストの比でより良い結果を得る。
関連論文リスト
- Upside-Down Reinforcement Learning for More Interpretable Optimal Control [2.06242362470764]
ニューラルネットワーク(NN)以外の関数近似アルゴリズムも,アップサイドダウン強化学習フレームワークで利用できるかを検討する。
我々の実験は、いくつかの一般的な最適制御ベンチマークで実施され、ランダムフォレストや極端ランダム化ツリーのような木に基づく手法が、NNと同様に動作可能であることを示す。
論文 参考訳(メタデータ) (2024-11-18T10:44:20Z) - Unveiling Options with Neural Decomposition [11.975013522386538]
強化学習では、エージェントは特定のタスクに対するポリシーを学ぶが、その知識を関連するタスクに一般化することができない。
本稿では、マルコフ決定プロセスのポリシーを復号化することで、この制限に対処するアルゴリズムを提案する。
それぞれのサブポリティシを、さまざまなイテレーションのタイムループでラップすることで、オプションにします。
論文 参考訳(メタデータ) (2024-10-15T04:36:44Z) - LiteSearch: Efficacious Tree Search for LLM [70.29796112457662]
本研究では,動的ノード選択とノードレベルの探索予算を備えた新しいガイド付き木探索アルゴリズムを提案する。
GSM8KおよびTabMWPデータセットを用いて行った実験により,本手法はベースライン法に比べて計算コストが大幅に低いことを示した。
論文 参考訳(メタデータ) (2024-06-29T05:14:04Z) - VN Network: Embedding Newly Emerging Entities with Virtual Neighbors [59.906332784508706]
本稿では,3つの課題に対処するため,VN(Virtual Neighbor)ネットワークという新しいフレームワークを提案する。
まず、近隣の空間問題を減らすために、ルールによって推測される仮想隣人の概念を導入する。
第二に、複雑なパターンを捉えるために、論理と対称パスのルールの両方を識別する。
論文 参考訳(メタデータ) (2024-02-21T03:04:34Z) - Symbolic Distillation for Learned TCP Congestion Control [70.27367981153299]
TCP渋滞制御は、深層強化学習(RL)アプローチで大きな成功を収めた。
ブラックボックスポリシーは解釈可能性と信頼性に欠けており、しばしば従来のTCPデータパスの外で運用する必要がある。
本稿では,まず深部RLエージェントを訓練し,次にNNポリシーをホワイトボックスの軽量なルールに蒸留する,両世界の長所を達成するための新しい2段階のソリューションを提案する。
論文 参考訳(メタデータ) (2022-10-24T00:58:16Z) - Recursive Least Squares for Training and Pruning Convolutional Neural
Networks [27.089496826735672]
畳み込みニューラルネットワーク(CNN)は多くの実用化に成功している。
高い計算とストレージ要件により、リソース制約のあるデバイスへのデプロイが困難になる。
本稿では,CNNの訓練と刈り取りのための新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-01-13T07:14:08Z) - Waypoint Planning Networks [66.72790309889432]
本稿では,ローカルカーネル(A*のような古典的アルゴリズム)と学習アルゴリズムを用いたグローバルカーネルを用いたLSTMに基づくハイブリッドアルゴリズムを提案する。
我々は、WPNとA*を比較し、動き計画ネットワーク(MPNet)やバリューネットワーク(VIN)を含む関連する作業と比較する。
WPN の探索空間は A* よりもかなり小さいが、ほぼ最適な結果が得られることが示されている。
論文 参考訳(メタデータ) (2021-05-01T18:02:01Z) - Growing Deep Forests Efficiently with Soft Routing and Learned
Connectivity [79.83903179393164]
この論文は、いくつかの重要な側面で深い森林のアイデアをさらに拡張します。
我々は、ノードがハードバイナリ決定ではなく、確率的ルーティング決定、すなわちソフトルーティングを行う確率的ツリーを採用する。
MNISTデータセットの実験は、私たちの力のある深部森林が[1]、[3]よりも優れたまたは匹敵するパフォーマンスを達成できることを示しています。
論文 参考訳(メタデータ) (2020-12-29T18:05:05Z) - Neural Contextual Bandits with Deep Representation and Shallow
Exploration [105.8099566651448]
本稿では,深部ReLUニューラルネットワークの最後の隠蔽層を用いて,原特徴ベクトルを変換する新しい学習アルゴリズムを提案する。
既存のニューラルネットワークと比較して、ディープニューラルネットワークの最後の層でのみ探索する必要があるため、我々のアプローチは計算的にはるかに効率的です。
論文 参考訳(メタデータ) (2020-12-03T09:17:55Z) - The Tree Ensemble Layer: Differentiability meets Conditional Computation [8.40843862024745]
我々は、異なる決定木(ソフトツリー)のアンサンブルからなるニューラルネットワークのための新しいレイヤを導入する。
異なる木は文学において有望な結果を示すが、典型的には条件計算をサポートしないため、訓練と推論が遅い。
我々は、空間性を利用する特殊前方及び後方伝播アルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-02-18T18:05:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。