論文の概要: Multi-Agent Reinforcement Learning for Network Routing in Integrated
Access Backhaul Networks
- arxiv url: http://arxiv.org/abs/2305.16170v1
- Date: Fri, 12 May 2023 13:03:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-28 04:32:45.876293
- Title: Multi-Agent Reinforcement Learning for Network Routing in Integrated
Access Backhaul Networks
- Title(参考訳): 統合アクセスバックホールネットワークにおけるネットワークルーティングのためのマルチエージェント強化学習
- Authors: Shahaf Yamin and Haim Permuter
- Abstract要約: IABネットワークの遅延を最小化しながらパケット到着率を最大化することを目的としている。
この問題を解決するため、我々はマルチエージェントで部分的に観察されたマルコフ決定プロセス(POMD)を開発した。
A2Cは他の強化学習アルゴリズムよりも優れており、ネットワーク効率が向上し、利己的エージェントの挙動が低下することを示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We investigate the problem of wireless routing in integrated access backhaul
(IAB) networks consisting of fiber-connected and wireless base stations and
multiple users. The physical constraints of these networks prevent the use of a
central controller, and base stations have limited access to real-time network
conditions. We aim to maximize packet arrival ratio while minimizing their
latency, for this purpose, we formulate the problem as a multi-agent partially
observed Markov decision process (POMDP). To solve this problem, we develop a
Relational Advantage Actor Critic (Relational A2C) algorithm that uses
Multi-Agent Reinforcement Learning (MARL) and information about similar
destinations to derive a joint routing policy on a distributed basis. We
present three training paradigms for this algorithm and demonstrate its ability
to achieve near-centralized performance. Our results show that Relational A2C
outperforms other reinforcement learning algorithms, leading to increased
network efficiency and reduced selfish agent behavior. To the best of our
knowledge, this work is the first to optimize routing strategy for IAB
networks.
- Abstract(参考訳): 本稿では,fiber-connected and wireless base stationと複数ユーザからなるiabネットワークにおける無線ルーティングの問題点について検討する。
これらのネットワークの物理的制約は中央制御器の使用を妨げ、基地局はリアルタイムネットワーク条件へのアクセスを制限している。
遅延を最小限に抑えつつパケット到着率を最大化することを目的として,マルチエージェント部分観測マルコフ決定プロセス(pomdp)として問題を定式化する。
この問題を解決するために,MARL(Multi-Agent Reinforcement Learning)と類似の宛先情報を用いたリレーショナルアドバンテージアクタ批判(Relational Advantage Actor Critic, Relational A2C)アルゴリズムを開発した。
本稿では,このアルゴリズムの3つの学習パラダイムを提示し,ほぼ集中型性能を実現する能力を示す。
その結果,リレーショナルA2Cは他の強化学習アルゴリズムよりも優れており,ネットワーク効率が向上し,利己的エージェントの挙動が低下することがわかった。
我々の知る限りでは、この作業はIABネットワークのルーティング戦略を最適化する最初のものである。
関連論文リスト
- Design Optimization of NOMA Aided Multi-STAR-RIS for Indoor Environments: A Convex Approximation Imitated Reinforcement Learning Approach [51.63921041249406]
非直交多重アクセス(Noma)により、複数のユーザが同じ周波数帯域を共有でき、同時に再構成可能なインテリジェントサーフェス(STAR-RIS)を送信および反射することができる。
STAR-RISを屋内に展開することは、干渉緩和、電力消費、リアルタイム設定における課題を提示する。
複数のアクセスポイント(AP)、STAR-RIS、NOMAを利用した新しいネットワークアーキテクチャが屋内通信のために提案されている。
論文 参考訳(メタデータ) (2024-06-19T07:17:04Z) - Semi-Supervised Learning Approach for Efficient Resource Allocation with Network Slicing in O-RAN [5.1435595246496595]
本稿では資源配分問題に対する革新的なアプローチを紹介する。
Open Radio Access Network (O-RAN) におけるネットワークスライシングとリソース割り当てのために、複数の独立したx-appplications (xAPPs) を協調することを目的としている。
論文 参考訳(メタデータ) (2024-01-16T22:23:27Z) - A Novel Reinforcement Learning Routing Algorithm for Congestion Control
in Complex Networks [0.0]
本稿では,最短経路アルゴリズムに基づく渋滞制御と経路長最適化という,強化学習を活用するルーティングアルゴリズムを提案する。
提案手法は,バラビ・アルベルトスケールフリーネットワークだけでなく,Watts-Strogatz (小世界) や Erd"os-R'enyi (ランダムネットワーク) などのネットワークモデルでも有効であることを示す。
論文 参考訳(メタデータ) (2023-12-30T18:21:13Z) - A State-Augmented Approach for Learning Optimal Resource Management
Decisions in Wireless Networks [58.720142291102135]
マルチユーザ無線ネットワークにおける無線リソース管理(RRM)問題について考察する。
目標は、ユーザのエルゴード平均パフォーマンスに制約を受けるネットワーク全体のユーティリティ機能を最適化することである。
本稿では, RRM の制約に対応する2変数の集合を入力として, 瞬時ネットワーク状態と並行して, RRM のパラメータ化を提案する。
論文 参考訳(メタデータ) (2022-10-28T21:24:13Z) - Artificial Intelligence Empowered Multiple Access for Ultra Reliable and
Low Latency THz Wireless Networks [76.89730672544216]
テラヘルツ(THz)無線ネットワークは、第5世代(B5G)以上の時代を触媒すると予想されている。
いくつかのB5Gアプリケーションの超信頼性と低レイテンシ要求を満たすためには、新しいモビリティ管理アプローチが必要である。
本稿では、インテリジェントなユーザアソシエーションとリソースアロケーションを実現するとともに、フレキシブルで適応的なモビリティ管理を可能にする、全体論的MAC層アプローチを提案する。
論文 参考訳(メタデータ) (2022-08-17T03:00:24Z) - State-Augmented Learnable Algorithms for Resource Management in Wireless
Networks [124.89036526192268]
本稿では,無線ネットワークにおける資源管理問題を解決するためのステート拡張アルゴリズムを提案する。
提案アルゴリズムは, RRM決定を可能, ほぼ最適に行うことができることを示す。
論文 参考訳(メタデータ) (2022-07-05T18:02:54Z) - Hierarchical Multi-Agent DRL-Based Framework for Joint Multi-RAT
Assignment and Dynamic Resource Allocation in Next-Generation HetNets [21.637440368520487]
本稿では,次世代無線ネットワーク(HetNets)における共同最適無線アクセス技術(RATs)の割り当てと電力割り当てによるコストアウェアダウンリンク総和率の問題について考察する。
本稿では,DeepRAT(DeepRAT)と呼ばれる階層型多エージェント深層強化学習(DRL)フレームワークを提案する。
特に、DeepRATフレームワークは、問題を2つの主要なステージに分解する: 単一エージェントのDeep Q Networkアルゴリズムを実装するRATs-EDs割り当てステージと、マルチエージェントのDeep Deterministic Policy Gradientを利用するパワー割り当てステージである。
論文 参考訳(メタデータ) (2022-02-28T09:49:44Z) - Packet Routing with Graph Attention Multi-agent Reinforcement Learning [4.78921052969006]
我々は強化学習(RL)を利用したモデルフリーでデータ駆動型ルーティング戦略を開発する。
ネットワークトポロジのグラフ特性を考慮すると、グラフニューラルネットワーク(GNN)と組み合わせたマルチエージェントRLフレームワークを設計する。
論文 参考訳(メタデータ) (2021-07-28T06:20:34Z) - Reinforcement Learning for Datacenter Congestion Control [50.225885814524304]
渋滞制御アルゴリズムの成功は、レイテンシとネットワーク全体のスループットを劇的に改善する。
今日まで、このような学習ベースのアルゴリズムはこの領域で実用的な可能性を示さなかった。
実世界のデータセンターネットワークの様々な構成に一般化することを目的としたRLに基づくアルゴリズムを考案する。
本稿では,この手法が他のRL手法よりも優れており,トレーニング中に見られなかったシナリオに一般化可能であることを示す。
論文 参考訳(メタデータ) (2021-02-18T13:49:28Z) - On Topology Optimization and Routing in Integrated Access and Backhaul
Networks: A Genetic Algorithm-based Approach [70.85399600288737]
IABネットワークにおけるトポロジ最適化とルーティングの問題について検討する。
我々は、IABノード配置と非IABバックホールリンク分布の両方に効率的な遺伝的アルゴリズムベースのスキームを開発する。
メッシュベースのIABネットワークを実現する上での課題について論じる。
論文 参考訳(メタデータ) (2021-02-14T21:52:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。