論文の概要: Teal: Learning-Accelerated Optimization of WAN Traffic Engineering
- arxiv url: http://arxiv.org/abs/2210.13763v3
- Date: Wed, 26 Jul 2023 00:26:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-27 16:23:53.432777
- Title: Teal: Learning-Accelerated Optimization of WAN Traffic Engineering
- Title(参考訳): teal: wanトラフィックエンジニアリングの学習促進最適化
- Authors: Zhiying Xu, Francis Y. Yan, Rachee Singh, Justin T. Chiu, Alexander M.
Rush, Minlan Yu
- Abstract要約: 本稿では,GPUの並列処理能力を活用してTE制御を高速化する学習型TEアルゴリズムTealを提案する。
問題スケールの削減と学習のトラクタビリティ向上のために,Tealはマルチエージェント強化学習(RL)アルゴリズムを用いて,各トラフィック要求を独立に割り当てる。
他のTE加速方式と比較して、Tealは需要を6~32%増やし、197~625倍のスピードアップを達成している。
- 参考スコア(独自算出の注目度): 89.23404108080585
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The rapid expansion of global cloud wide-area networks (WANs) has posed a
challenge for commercial optimization engines to efficiently solve network
traffic engineering (TE) problems at scale. Existing acceleration strategies
decompose TE optimization into concurrent subproblems but realize limited
parallelism due to an inherent tradeoff between run time and allocation
performance.
We present Teal, a learning-based TE algorithm that leverages the parallel
processing power of GPUs to accelerate TE control. First, Teal designs a
flow-centric graph neural network (GNN) to capture WAN connectivity and network
flows, learning flow features as inputs to downstream allocation. Second, to
reduce the problem scale and make learning tractable, Teal employs a
multi-agent reinforcement learning (RL) algorithm to independently allocate
each traffic demand while optimizing a central TE objective. Finally, Teal
fine-tunes allocations with ADMM (Alternating Direction Method of Multipliers),
a highly parallelizable optimization algorithm for reducing constraint
violations such as overutilized links.
We evaluate Teal using traffic matrices from Microsoft's WAN. On a large WAN
topology with >1,700 nodes, Teal generates near-optimal flow allocations while
running several orders of magnitude faster than the production optimization
engine. Compared with other TE acceleration schemes, Teal satisfies 6--32% more
traffic demand and yields 197--625x speedups.
- Abstract(参考訳): グローバルクラウドワイドエリアネットワーク(WAN)の急速な拡張は、商用最適化エンジンが大規模なネットワークトラフィックエンジニアリング(TE)問題を効率的に解決する上で、課題となっている。
既存のアクセラレーション戦略は、te最適化を並行部分問題に分解するが、実行時間と割り当て性能の固有のトレードオフにより、限定的な並列性を実現する。
本稿では,GPUの並列処理能力を活用してTE制御を高速化する学習型TEアルゴリズムTealを提案する。
まず、Tealはフロー中心グラフニューラルネットワーク(GNN)を設計し、WAN接続とネットワークフローをキャプチャし、下流アロケーションへの入力としてフロー特徴を学習する。
第2に,問題スケールを小さくし,学習を容易なものにするため,中央のTE目標を最適化しながら,各交通需要を独立的に割り当てるマルチエージェント強化学習(RL)アルゴリズムを用いる。
最後に,ADMM(Alternating Direction Method of Multipliers)を用いたTeal Fine-tunesアロケーションは,過利用リンクなどの制約違反を低減するために,高度に並列化可能な最適化アルゴリズムである。
MicrosoftのWANのトラフィック行列を用いてTealを評価する。
1,700ノード以上の大きなwanトポロジでは、tealはプロダクション最適化エンジンよりも数桁速い速度で実行しながら、ほぼ最適に近いフロー割り当てを生成する。
他のte加速方式と比較して、tealは6~32%のトラフィック需要を満たし、197~625倍のスピードアップを実現している。
関連論文リスト
- FusionLLM: A Decentralized LLM Training System on Geo-distributed GPUs with Adaptive Compression [55.992528247880685]
分散トレーニングは、システム設計と効率に関する重要な課題に直面します。
大規模深層ニューラルネットワーク(DNN)のトレーニング用に設計・実装された分散トレーニングシステムFusionLLMを提案する。
本システムと手法は,収束性を確保しつつ,ベースライン法と比較して1.45~9.39倍の高速化を実現可能であることを示す。
論文 参考訳(メタデータ) (2024-10-16T16:13:19Z) - DNN Partitioning, Task Offloading, and Resource Allocation in Dynamic Vehicular Networks: A Lyapunov-Guided Diffusion-Based Reinforcement Learning Approach [49.56404236394601]
本稿では,Vehicular Edge Computingにおける共同DNNパーティショニング,タスクオフロード,リソース割り当ての問題を定式化する。
我々の目標は、時間とともにシステムの安定性を保証しながら、DNNベースのタスク完了時間を最小化することである。
拡散モデルの革新的利用を取り入れたマルチエージェント拡散に基づく深層強化学習(MAD2RL)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-11T06:31:03Z) - Pruning In Time (PIT): A Lightweight Network Architecture Optimizer for
Temporal Convolutional Networks [20.943095081056857]
時間的畳み込みネットワーク(TCN)は、時系列処理タスクのためのディープラーニングモデルを約束している。
本稿では,時間軸の重み付け問題に対処し,重みとともに拡張因子を学習する自動拡張法を提案する。
論文 参考訳(メタデータ) (2022-03-28T14:03:16Z) - Joint inference and input optimization in equilibrium networks [68.63726855991052]
ディープ均衡モデル(Deep equilibrium model)は、従来のネットワークの深さを予測し、代わりに単一の非線形層の固定点を見つけることによってネットワークの出力を計算するモデルのクラスである。
この2つの設定の間には自然なシナジーがあることが示されています。
この戦略は、生成モデルのトレーニングや、潜時符号の最適化、デノベートやインペインティングといった逆問題に対するトレーニングモデル、対逆トレーニング、勾配に基づくメタラーニングなど、様々なタスクにおいて実証される。
論文 参考訳(メタデータ) (2021-11-25T19:59:33Z) - ENERO: Efficient Real-Time Routing Optimization [2.830334160074889]
交通工学(TE)ソリューションは、高性能なリアルタイムネットワーク運用を実現する必要がある。
現在のTE技術は手工芸品や計算コストの高い解法に依存している。
本稿では,効率的なリアルタイムTEエンジンであるEeroを提案する。
論文 参考訳(メタデータ) (2021-09-22T17:53:30Z) - ZoPE: A Fast Optimizer for ReLU Networks with Low-Dimensional Inputs [30.34898838361206]
低次元入力を持つフィードフォワードReLUネットワークの出力に対する最適化問題を解くZoPEアルゴリズムを提案する。
我々はZoPEを用いて、ACAS Xuニューラルネットワーク検証ベンチマークのプロパティ1における25倍の高速化と、一連の線形最適化問題に対する85倍の高速化を観察した。
論文 参考訳(メタデータ) (2021-06-09T18:36:41Z) - A Heuristically Assisted Deep Reinforcement Learning Approach for
Network Slice Placement [0.7885276250519428]
本稿では,Deep Reinforcement Learning(DRL)に基づくハイブリッド配置ソリューションと,Power of Two Choices原則に基づく専用最適化を提案する。
提案したHuristically-Assisted DRL (HA-DRL) は,他の最先端手法と比較して学習プロセスの高速化と資源利用の促進を可能にする。
論文 参考訳(メタデータ) (2021-05-14T10:04:17Z) - Surrogate-assisted cooperative signal optimization for large-scale
traffic networks [6.223837701805064]
本研究では,サロゲート支援協調信号最適化(SCSO)手法を提案する。
ニューマン・ファスト・アルゴリズムを用いて,分散アルゴリズムを分解器,代理モデル,具体的SCSOアルゴリズムとして修正した。
その有効性と有効性を評価するため、実際の交通ネットワークに基づいて、クロスロードとTジャンクションを含む大規模交通ネットワークを生成する。
論文 参考訳(メタデータ) (2021-03-03T01:03:57Z) - Communication-Efficient Distributed Stochastic AUC Maximization with
Deep Neural Networks [50.42141893913188]
本稿では,ニューラルネットワークを用いた大規模AUCのための分散変数について検討する。
我々のモデルは通信ラウンドをはるかに少なくし、理論上はまだ多くの通信ラウンドを必要としています。
いくつかのデータセットに対する実験は、我々の理論の有効性を示し、我々の理論を裏付けるものである。
論文 参考訳(メタデータ) (2020-05-05T18:08:23Z) - Joint Parameter-and-Bandwidth Allocation for Improving the Efficiency of
Partitioned Edge Learning [73.82875010696849]
機械学習アルゴリズムは、人工知能(AI)モデルをトレーニングするために、ネットワークエッジにデプロイされる。
本稿では,パラメータ(計算負荷)割り当てと帯域幅割り当ての新しい共同設計に焦点を当てる。
論文 参考訳(メタデータ) (2020-03-10T05:52:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。