論文の概要: Signal attenuation enables scalable decentralized multi-agent reinforcement learning over networks
- arxiv url: http://arxiv.org/abs/2505.11461v1
- Date: Fri, 16 May 2025 17:14:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-19 14:36:15.687127
- Title: Signal attenuation enables scalable decentralized multi-agent reinforcement learning over networks
- Title(参考訳): 信号減衰は、スケーラブルな分散マルチエージェント強化学習を可能にする
- Authors: Wesley A Suttle, Vipul K Sharma, Brian M Sadler,
- Abstract要約: 本稿では,MARLにおける信号減衰の分散化を,レーダネットワークにおける目標検出のための電力割当を行うための実証的な特別な事例を考慮し,その分散化を可能にすることを示す。
我々のアプローチは、私たちが考慮している特定のレーダネットワーク問題に向けられているが、無線通信やレーダネットワークにおけるさらなる問題への将来の拡張に有用なモデルを提供する。
- 参考スコア(独自算出の注目度): 9.875965151731718
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Classic multi-agent reinforcement learning (MARL) methods require that agents enjoy global state observability, preventing development of decentralized algorithms and limiting scalability. Recent work has shown that, under assumptions on decaying inter-agent influence, global observability can be replaced by local neighborhood observability at each agent, enabling decentralization and scalability. Real-world applications enjoying such decay properties remain underexplored, however, despite the fact that signal power decay, or signal attenuation, due to path loss is an intrinsic feature of many problems in wireless communications and radar networks. In this paper, we show that signal attenuation enables decentralization in MARL by considering the illustrative special case of performing power allocation for target detection in a radar network. To achieve this, we propose two new constrained multi-agent Markov decision process formulations of this power allocation problem, derive local neighborhood approximations for global value function and gradient estimates and establish corresponding error bounds, and develop decentralized saddle point policy gradient algorithms for solving the proposed problems. Our approach, though oriented towards the specific radar network problem we consider, provides a useful model for future extensions to additional problems in wireless communications and radar networks.
- Abstract(参考訳): 古典的マルチエージェント強化学習 (MARL) 法では,エージェントはグローバルな状態観測性や分散アルゴリズムの開発,スケーラビリティの制限を享受する必要がある。
近年の研究では、エージェント間影響の減衰を前提として、グローバルな観測性は各エージェントの局所的な観測可能性に置き換えられ、分散化とスケーラビリティを実現することが示されている。
しかし、信号パワー減衰や信号減衰は、無線通信やレーダネットワークにおける多くの問題の本質的な特徴である。
本稿では,MARLにおける信号減衰が,レーダーネットワークにおける目標検出のための電力割当を行う実例を考慮した分散化を可能にすることを示す。
これを実現するために,このパワー割り当て問題の制約付きマルチエージェントマルコフ決定プロセスの定式化,大域的値関数と勾配推定の局所近似の導出,対応する誤差境界の確立,および提案した問題を解くための分散サドル点ポリシー勾配アルゴリズムの開発を提案する。
我々のアプローチは、私たちが考慮している特定のレーダネットワーク問題に向けられているが、無線通信やレーダネットワークにおけるさらなる問題への将来の拡張に有用なモデルを提供する。
関連論文リスト
- Toward Dependency Dynamics in Multi-Agent Reinforcement Learning for Traffic Signal Control [8.312659530314937]
適応的な信号制御のためのデータ駆動型アプローチとして強化学習(RL)が出現する。
本稿では,DQN-DPUS(Deep Q-Network)のための動的強化更新戦略を提案する。
提案手法は最適探索を犠牲にすることなく収束速度を向上できることを示す。
論文 参考訳(メタデータ) (2025-02-23T15:29:12Z) - Scalable spectral representations for multi-agent reinforcement learning in network MDPs [13.782868855372774]
マルチエージェント制御の一般的なモデルであるNetwork Markov Decision Processes (MDPs)は、効率的な学習に重大な課題をもたらす。
まず、ネットワークMDPに対してスケーラブルなスペクトル局所表現を導出し、各エージェントの局所$Q$関数に対するネットワーク線形部分空間を誘導する。
我々は,連続的な状態対応ネットワークMDPのためのスケーラブルなアルゴリズムフレームワークを設計し,アルゴリズムの収束をエンドツーエンドで保証する。
論文 参考訳(メタデータ) (2024-10-22T17:45:45Z) - Compressed Regression over Adaptive Networks [58.79251288443156]
分散エージェントのネットワークによって達成可能な性能を導出し,通信制約や回帰問題を解消し,適応的に解決する。
エージェントによって最適化に必要なパラメータをオンラインで学習できる最適化アロケーション戦略を考案する。
論文 参考訳(メタデータ) (2023-04-07T13:41:08Z) - Non-Coherent Over-the-Air Decentralized Gradient Descent [0.0]
無線システムにおける分散グラディエントDescentの実装は、ノイズ、フェーディング、帯域幅の制限により困難である。
本稿では,スケジューリング,トポロジ情報,CSIの必要性を解消するスケーラブルなDGDアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-11-19T19:15:34Z) - Artificial Intelligence Empowered Multiple Access for Ultra Reliable and
Low Latency THz Wireless Networks [76.89730672544216]
テラヘルツ(THz)無線ネットワークは、第5世代(B5G)以上の時代を触媒すると予想されている。
いくつかのB5Gアプリケーションの超信頼性と低レイテンシ要求を満たすためには、新しいモビリティ管理アプローチが必要である。
本稿では、インテリジェントなユーザアソシエーションとリソースアロケーションを実現するとともに、フレキシブルで適応的なモビリティ管理を可能にする、全体論的MAC層アプローチを提案する。
論文 参考訳(メタデータ) (2022-08-17T03:00:24Z) - State-Augmented Learnable Algorithms for Resource Management in Wireless
Networks [124.89036526192268]
本稿では,無線ネットワークにおける資源管理問題を解決するためのステート拡張アルゴリズムを提案する。
提案アルゴリズムは, RRM決定を可能, ほぼ最適に行うことができることを示す。
論文 参考訳(メタデータ) (2022-07-05T18:02:54Z) - Learning Resilient Radio Resource Management Policies with Graph Neural
Networks [124.89036526192268]
我々は、ユーザ当たりの最小容量制約でレジリエントな無線リソース管理問題を定式化する。
有限個のパラメータ集合を用いてユーザ選択と電力制御ポリシーをパラメータ化できることを示す。
このような適応により,提案手法は平均レートと5番目のパーセンタイルレートとの良好なトレードオフを実現する。
論文 参考訳(メタデータ) (2022-03-07T19:40:39Z) - Cooperative Multi-Agent Reinforcement Learning Based Distributed Dynamic
Spectrum Access in Cognitive Radio Networks [46.723006378363785]
ダイナミックスペクトルアクセス(DSA)は、非効率的なスペクトル利用の問題を改善するための、有望なパラダイムである。
本稿では,一般的な認知無線ネットワークにおけるマルチユーザに対する分散DSA問題について検討する。
我々は、各認知ユーザに対する状態の部分的観測可能性に対処するために、DRQN(Deep Recurrent Q-network)を用いている。
論文 参考訳(メタデータ) (2021-06-17T06:52:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。