論文の概要: Robust and Scalable Routing with Multi-Agent Deep Reinforcement Learning
for MANETs
- arxiv url: http://arxiv.org/abs/2101.03273v2
- Date: Mon, 29 Mar 2021 02:53:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-09 07:25:41.368455
- Title: Robust and Scalable Routing with Multi-Agent Deep Reinforcement Learning
for MANETs
- Title(参考訳): MANETのためのマルチエージェントディープ強化学習によるロバストかつスケーラブルなルーティング
- Authors: Saeed Kaviani, Bo Ryu, Ejaz Ahmed, Kevin A. Larson, Anh Le, Alex
Yahja, Jae H. Kim
- Abstract要約: DeepCQ+ルーティングは、新しいマルチエージェントディープラーニング技術を既存のQラーニングベースのルーティングプロトコルに統合します。
これは、限られた範囲のネットワークパラメータと条件でのみトレーニングしながら、幅広いMANET構成で持続的に高いパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 1.8375389588718993
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Highly dynamic mobile ad-hoc networks (MANETs) are continuing to serve as one
of the most challenging environments to develop and deploy robust, efficient,
and scalable routing protocols. In this paper, we present DeepCQ+ routing
which, in a novel manner, integrates emerging multi-agent deep reinforcement
learning (MADRL) techniques into existing Q-learning-based routing protocols
and their variants, and achieves persistently higher performance across a wide
range of MANET configurations while training only on a limited range of network
parameters and conditions. Quantitatively, DeepCQ+ shows consistently higher
end-to-end throughput with lower overhead compared to its Q-learning-based
counterparts with the overall gain of 10-15% in its efficiency. Qualitatively
and more significantly, DeepCQ+ maintains remarkably similar performance gains
under many scenarios that it was not trained for in terms of network sizes,
mobility conditions, and traffic dynamics. To the best of our knowledge, this
is the first successful demonstration of MADRL for the MANET routing problem
that achieves and maintains a high degree of scalability and robustness even in
the environments that are outside the trained range of scenarios. This implies
that the proposed hybrid design approach of DeepCQ+ that combines MADRL and
Q-learning significantly increases its practicality and explainability because
the real-world MANET environment will likely vary outside the trained range of
MANET scenarios.
- Abstract(参考訳): 高ダイナミックなモバイルアドホックネットワーク(MANET)は、堅牢で効率的でスケーラブルなルーティングプロトコルを開発し、デプロイする上で最も困難な環境の1つであり続けている。
本稿では,新たなマルチエージェント深層強化学習(madrl,multi-agent deep reinforcement learning)手法を既存のq-learningベースのルーティングプロトコルとその変種に統合したdeepcq+ルーティングを提案する。
定量的に見ると、DeepCQ+は、Qラーニングベースの処理に比べて、オーバーヘッドの少ないエンドツーエンドのスループットが一貫して高く、全体的な効率は10~15%向上している。
deepcq+は、ネットワークサイズ、モビリティ条件、およびトラフィックダイナミクスに関して訓練されていない多くのシナリオにおいて、非常に類似したパフォーマンス向上を維持している。
私たちの知る限り、これはMANETルーティング問題に対するMADRLの最初の成功例であり、訓練されたシナリオの範囲外の環境でも高いスケーラビリティと堅牢性を実現し、維持します。
これは、MADRLとQ-learningを組み合わせたDeepCQ+のハイブリッド設計アプローチが、実世界のMANET環境が訓練された様々なMANETシナリオの外で異なるため、実用性と説明可能性を大幅に向上させることを意味する。
関連論文リスト
- Differentiable Discrete Event Simulation for Queuing Network Control [7.965453961211742]
キューのネットワーク制御は、高い性、大きな状態とアクション空間、安定性の欠如など、異なる課題を生んでいる。
本稿では,異なる離散イベントシミュレーションに基づくポリシー最適化のためのスケーラブルなフレームワークを提案する。
本手法は,非定常環境で動作するシステムなど,現実的なシナリオを柔軟に処理することができる。
論文 参考訳(メタデータ) (2024-09-05T17:53:54Z) - Principled Architecture-aware Scaling of Hyperparameters [69.98414153320894]
高品質のディープニューラルネットワークをトレーニングするには、非自明で高価なプロセスである適切なハイパーパラメータを選択する必要がある。
本研究では,ネットワークアーキテクチャにおける初期化と最大学習率の依存性を正確に評価する。
ネットワークランキングは、ベンチマークのトレーニングネットワークにより容易に変更可能であることを実証する。
論文 参考訳(メタデータ) (2024-02-27T11:52:49Z) - Multi Agent DeepRL based Joint Power and Subchannel Allocation in IAB
networks [0.0]
統合アクセスとバックハウリング(IRL)は、将来の世代におけるより高いデータレートに対する前例のない要求を満たすための、実行可能なアプローチである。
本稿では,分数ノードに付随する巨大なアクション空間の問題を,Deep Q-Learning Networkを用いて処理する方法を示す。
論文 参考訳(メタデータ) (2023-08-31T21:30:25Z) - MARLIN: Soft Actor-Critic based Reinforcement Learning for Congestion
Control in Real Networks [63.24965775030673]
そこで本研究では,汎用的な渋滞制御(CC)アルゴリズムを設計するための新しい強化学習(RL)手法を提案する。
我々の解であるMARLINは、Soft Actor-Criticアルゴリズムを用いてエントロピーとリターンの両方を最大化する。
我々は,MARLINを実ネットワーク上で訓練し,実ミスマッチを克服した。
論文 参考訳(メタデータ) (2023-02-02T18:27:20Z) - Residual Q-Networks for Value Function Factorizing in Multi-Agent
Reinforcement Learning [0.0]
マルチエージェント強化学習(MARL)のためのResidual Q-Networks(RQN)の概念を提案する。
RQNは、個人-グローバル-マックス基準(IGM)を保存する方法で、個々のQ値軌跡を変換することを学ぶ
提案手法はより高速に収束し、安定性が向上し、より広い環境群で堅牢な性能を示す。
論文 参考訳(メタデータ) (2022-05-30T16:56:06Z) - Pervasive Machine Learning for Smart Radio Environments Enabled by
Reconfigurable Intelligent Surfaces [56.35676570414731]
Reconfigurable Intelligent Surfaces(RIS)の新たな技術は、スマート無線環境の実現手段として準備されている。
RISは、無線媒体上の電磁信号の伝搬を動的に制御するための、高度にスケーラブルで低コストで、ハードウェア効率が高く、ほぼエネルギーニュートラルなソリューションを提供する。
このような再構成可能な無線環境におけるRISの密配置に関する大きな課題の1つは、複数の準曲面の効率的な構成である。
論文 参考訳(メタデータ) (2022-05-08T06:21:33Z) - Collaborative Intelligent Reflecting Surface Networks with Multi-Agent
Reinforcement Learning [63.83425382922157]
インテリジェント・リフレクション・サーフェス(IRS)は将来の無線ネットワークに広く応用されることが想定されている。
本稿では,エネルギー収穫能力を備えた協調型IRSデバイスを用いたマルチユーザ通信システムについて検討する。
論文 参考訳(メタデータ) (2022-03-26T20:37:14Z) - Hierarchical Multi-Agent DRL-Based Framework for Joint Multi-RAT
Assignment and Dynamic Resource Allocation in Next-Generation HetNets [21.637440368520487]
本稿では,次世代無線ネットワーク(HetNets)における共同最適無線アクセス技術(RATs)の割り当てと電力割り当てによるコストアウェアダウンリンク総和率の問題について考察する。
本稿では,DeepRAT(DeepRAT)と呼ばれる階層型多エージェント深層強化学習(DRL)フレームワークを提案する。
特に、DeepRATフレームワークは、問題を2つの主要なステージに分解する: 単一エージェントのDeep Q Networkアルゴリズムを実装するRATs-EDs割り当てステージと、マルチエージェントのDeep Deterministic Policy Gradientを利用するパワー割り当てステージである。
論文 参考訳(メタデータ) (2022-02-28T09:49:44Z) - Reinforcement Learning-Empowered Mobile Edge Computing for 6G Edge
Intelligence [76.96698721128406]
モバイルエッジコンピューティング(MEC)は、第5世代(5G)ネットワークなどにおける計算と遅延に敏感なタスクのための新しいパラダイムであると考えた。
本稿では、フリー対応RLに関する総合的な研究レビューと、開発のための洞察を提供する。
論文 参考訳(メタデータ) (2022-01-27T10:02:54Z) - DeepCQ+: Robust and Scalable Routing with Multi-Agent Deep Reinforcement
Learning for Highly Dynamic Networks [2.819857535390181]
DeepCQ+ルーティングプロトコルは、新しいマルチエージェントディープ強化学習(MADRL)技術を既存のQラーニングベースのルーティングプロトコルに統合する。
大規模なシミュレーションにより、DeepCQ+は、オーバーヘッドを小さくして、エンドツーエンドのスループットを著しく向上させることが示された。
DeepCQ+は、トレーニングされていない多くのシナリオにおいて、非常に類似したパフォーマンス向上を維持している。
論文 参考訳(メタデータ) (2021-11-29T23:05:49Z) - Deep Multi-Task Learning for Cooperative NOMA: System Design and
Principles [52.79089414630366]
我々は,近年のディープラーニング(DL)の進歩を反映した,新しいディープ・コラボレーティブなNOMAスキームを開発する。
我々は,システム全体を包括的に最適化できるように,新しいハイブリッドカスケードディープニューラルネットワーク(DNN)アーキテクチャを開発した。
論文 参考訳(メタデータ) (2020-07-27T12:38:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。