論文の概要: Multi-Agent Deep Reinforcement Learning for Request Dispatching in
Distributed-Controller Software-Defined Networking
- arxiv url: http://arxiv.org/abs/2103.03022v1
- Date: Sat, 6 Feb 2021 09:49:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-05 00:34:11.955952
- Title: Multi-Agent Deep Reinforcement Learning for Request Dispatching in
Distributed-Controller Software-Defined Networking
- Title(参考訳): 分散コントローラソフトウェア定義ネットワークにおける要求派遣のためのマルチエージェント深層強化学習
- Authors: Victoria Huang, Gang Chen, Qiang Fu
- Abstract要約: 適応性と性能の高いRDポリシーを自動設計するマルチエージェント深層強化学習(MA-DRL)手法を提案する。
MA-DRLの手法は、人造ポリシー、モデルベースのポリシー、およびシングルエージェントDRLアルゴリズムで学んだRDポリシーを大幅に上回るようにRDポリシーを効果的にトレーニングできることを示しています。
- 参考スコア(独自算出の注目度): 6.822624984955834
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, distributed controller architectures have been quickly gaining
popularity in Software-Defined Networking (SDN). However, the use of
distributed controllers introduces a new and important Request Dispatching (RD)
problem with the goal for every SDN switch to properly dispatch their requests
among all controllers so as to optimize network performance. This goal can be
fulfilled by designing an RD policy to guide distribution of requests at each
switch. In this paper, we propose a Multi-Agent Deep Reinforcement Learning
(MA-DRL) approach to automatically design RD policies with high adaptability
and performance. This is achieved through a new problem formulation in the form
of a Multi-Agent Markov Decision Process (MA-MDP), a new adaptive RD policy
design and a new MA-DRL algorithm called MA-PPO. Extensive simulation studies
show that our MA-DRL technique can effectively train RD policies to
significantly outperform man-made policies, model-based policies, as well as RD
policies learned via single-agent DRL algorithms.
- Abstract(参考訳): 近年, Software-Defined Networking (SDN) で分散コントローラアーキテクチャが急速に普及している。
しかし、分散コントローラの使用により、新しい重要なリクエストディスパッチ(RD)問題が導入され、すべてのSDNスイッチがネットワーク性能を最適化するために、すべてのコントローラ間でリクエストを適切にディスパッチすることを目標としている。
この目標は、各スイッチでのリクエストの配布をガイドするRDポリシーを設計することで達成できる。
本稿では,高い適応性と性能を有するRDポリシーを自動設計するマルチエージェント深層強化学習(MA-DRL)手法を提案する。
これは、Multi-Agent Markov Decision Process (MA-MDP) という新しい問題定式化、新しい適応RDポリシー設計、MA-PPOと呼ばれる新しいMA-DRLアルゴリズムによって達成される。
大規模なシミュレーション研究により,我々のMA-DRL技術は,単一エージェントDRLアルゴリズムを用いて学習したRDポリシーだけでなく,人為的ポリシー,モデルベースポリシーを著しく上回るRDポリシーを効果的に訓練できることが示された。
関連論文リスト
- ArCHer: Training Language Model Agents via Hierarchical Multi-Turn RL [80.10358123795946]
大規模言語モデルを微調整するためのマルチターンRLアルゴリズムを構築するためのフレームワークを開発する。
我々のフレームワークは階層的なRLアプローチを採用し、2つのRLアルゴリズムを並列に実行している。
実験により,ArCHerはエージェントタスクの効率と性能を大幅に向上させることがわかった。
論文 参考訳(メタデータ) (2024-02-29T18:45:56Z) - Train Hard, Fight Easy: Robust Meta Reinforcement Learning [78.16589993684698]
実世界のアプリケーションにおける強化学習(RL)の大きな課題は、環境、タスク、クライアントの違いである。
標準的なMRL法は、タスクよりも平均的なリターンを最適化するが、リスクや難易度の高いタスクでは悪い結果に悩まされることが多い。
本研究では, MRL の頑健な目標を制御レベルで定義する。
ロバストメタRLアルゴリズム(RoML)を用いてデータ非効率に対処する
論文 参考訳(メタデータ) (2023-01-26T14:54:39Z) - A Survey of Meta-Reinforcement Learning [69.76165430793571]
我々は,メタRLと呼ばれるプロセスにおいて,機械学習問題自体として,より優れたRLアルゴリズムを開発した。
本稿では,タスク分布の存在と各タスクに利用可能な学習予算に基づいて,高レベルでメタRL研究をクラスタ化する方法について議論する。
RL実践者のための標準ツールボックスにメタRLを組み込むことの道程について,オープンな問題を提示することによって,結論を下す。
論文 参考訳(メタデータ) (2023-01-19T12:01:41Z) - Distributed-Training-and-Execution Multi-Agent Reinforcement Learning
for Power Control in HetNet [48.96004919910818]
We propose a multi-agent Deep reinforcement learning (MADRL) based power control scheme for the HetNet。
エージェント間の協調を促進するために,MADRLシステムのためのペナルティベースQラーニング(PQL)アルゴリズムを開発した。
このように、エージェントのポリシーは、他のエージェントによってより容易に学習でき、より効率的なコラボレーションプロセスをもたらす。
論文 参考訳(メタデータ) (2022-12-15T17:01:56Z) - A State-Augmented Approach for Learning Optimal Resource Management
Decisions in Wireless Networks [58.720142291102135]
マルチユーザ無線ネットワークにおける無線リソース管理(RRM)問題について考察する。
目標は、ユーザのエルゴード平均パフォーマンスに制約を受けるネットワーク全体のユーティリティ機能を最適化することである。
本稿では, RRM の制約に対応する2変数の集合を入力として, 瞬時ネットワーク状態と並行して, RRM のパラメータ化を提案する。
論文 参考訳(メタデータ) (2022-10-28T21:24:13Z) - FORLORN: A Framework for Comparing Offline Methods and Reinforcement
Learning for Optimization of RAN Parameters [0.0]
本稿では,ネットワーク環境におけるRLエージェントの性能をns-3でシミュレートする新しいフレームワークを提案する。
このフレームワークでは、ドメイン固有の知識を持たないRLエージェントが、静的シナリオにおけるオフライン最適化に適合するように、Radio Access Network(RAN)パラメータを効率的に調整する方法を学習できることを実証する。
論文 参考訳(メタデータ) (2022-09-08T12:58:09Z) - Multi-Agent Deep Reinforcement Learning for Cost- and Delay-Sensitive
Virtual Network Function Placement and Routing [36.51614774073273]
本稿では、仮想ネットワーク機能(VNF)配置とルーティング(P&R)を解決するための、効果的で新しいマルチエージェント深部強化学習(MADRL)法を提案する。
我々はまず,NP完全であるサービス遅延と資源消費コストの重み付けを最小化するために,VNF P&R問題を構築する。
2つのサブタスクを実行するためにMADRL-P&Rフレームワークを設計した。
論文 参考訳(メタデータ) (2022-06-24T08:24:48Z) - Processing Network Controls via Deep Reinforcement Learning [0.0]
論文は、理論上の正当化と、高度なポリシー勾配アルゴリズムの実用化に関するものである。
政策改善バウンダリは、APGアルゴリズムの理論的正当性において重要な役割を果たす。
論文 参考訳(メタデータ) (2022-05-01T04:34:21Z) - Semantic-Aware Collaborative Deep Reinforcement Learning Over Wireless
Cellular Networks [82.02891936174221]
複数のエージェントが無線ネットワーク上で協調できるコラボレーティブディープ強化学習(CDRL)アルゴリズムは有望なアプローチである。
本稿では,リソース制約のある無線セルネットワーク上で,意味的にリンクされたDRLタスクを持つ未学習エージェントのグループを効率的に協調させる,新しい意味認識型CDRL手法を提案する。
論文 参考訳(メタデータ) (2021-11-23T18:24:47Z) - Policy Search using Dynamic Mirror Descent MPC for Model Free Off Policy
RL [0.0]
強化学習(RL)における最近の研究は、モデルフリー(Mf)-RLアルゴリズムとモデルベース(Mb)-RLアルゴリズムを組み合わせている。
本稿では,Mb軌道最適化のためのオンライン学習と,Mf-RLの外部政治手法を統合する階層的フレームワークを提案する。
論文 参考訳(メタデータ) (2021-10-23T15:16:49Z) - Joint Resource Management for MC-NOMA: A Deep Reinforcement Learning
Approach [39.54978539962088]
本稿では, 共同資源管理(JRM)への新規かつ効果的な深層強化学習(DRL)に基づくアプローチを提案する。
実用的なマルチキャリア非直交多重アクセス(MC-NOMA)システムでは、ハードウェアの感度と不完全な連続干渉キャンセル(SIC)が考慮されます。
DRL-JRM方式はシステムスループットと干渉耐性の観点から既存の方式よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-03-29T06:52:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。