論文の概要: Signal attenuation enables scalable decentralized multi-agent reinforcement learning over networks
- arxiv url: http://arxiv.org/abs/2505.11461v2
- Date: Wed, 28 May 2025 21:19:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-30 18:14:07.412809
- Title: Signal attenuation enables scalable decentralized multi-agent reinforcement learning over networks
- Title(参考訳): 信号減衰は、スケーラブルな分散マルチエージェント強化学習を可能にする
- Authors: Wesley A Suttle, Vipul K Sharma, Brian M Sadler,
- Abstract要約: マルチエージェント強化学習(MARL)法は通常、エージェントがグローバルな状態観測可能性を楽しむ必要がある。
近年の研究では、エージェント間影響の減衰を前提に、各エージェントの局所的な近傍観測性に置き換えられることが示されている。
本稿では,MARLにおける信号減衰の分散化を,レーダネットワークにおける目標検出のための電力割当を行うための実証的な特別な事例を考慮し,その分散化を可能にすることを示す。
- 参考スコア(独自算出の注目度): 9.875965151731718
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-agent reinforcement learning (MARL) methods typically require that agents enjoy global state observability, preventing development of decentralized algorithms and limiting scalability. Recent work has shown that, under assumptions on decaying inter-agent influence, global observability can be replaced by local neighborhood observability at each agent, enabling decentralization and scalability. Real-world applications enjoying such decay properties remain underexplored, however, despite the fact that signal power decay, or signal attenuation, due to path loss is an intrinsic feature of many problems in wireless communications and radar networks. In this paper, we show that signal attenuation enables decentralization in MARL by considering the illustrative special case of performing power allocation for target detection in a radar network. To achieve this, we propose two new constrained multi-agent Markov decision process formulations of this power allocation problem, derive local neighborhood approximations for global value function and policy gradient estimates and establish corresponding error bounds, and develop decentralized saddle point policy gradient algorithms for solving the proposed problems. Our approach, though oriented towards the specific radar network problem we consider, provides a useful model for extensions to additional problems in wireless communications and radar networks.
- Abstract(参考訳): マルチエージェント強化学習(MARL)の手法は、エージェントがグローバルな状態の可観測性を享受し、分散アルゴリズムの開発を阻止し、スケーラビリティを制限することを必要とする。
近年の研究では、エージェント間影響の減衰を前提として、グローバルな観測性は各エージェントの局所的な観測可能性に置き換えられ、分散化とスケーラビリティを実現することが示されている。
しかし、信号パワー減衰や信号減衰は、無線通信やレーダネットワークにおける多くの問題の本質的な特徴である。
本稿では,MARLにおける信号減衰が,レーダーネットワークにおける目標検出のための電力割当を行う実例を考慮した分散化を可能にすることを示す。
そこで我々は,このパワー割り当て問題の制約付きマルチエージェントマルコフ決定プロセスの定式化,大域的値関数とポリシ勾配推定の局所近似の導出,対応するエラー境界の確立,および提案した問題を解決するための分散サドル点ポリシー勾配アルゴリズムの開発を提案する。
我々のアプローチは、私たちが考慮している特定のレーダネットワーク問題に向けられているが、無線通信やレーダネットワークにおける追加問題への拡張に有用なモデルを提供する。
関連論文リスト
- Blockchain-Enabled Routing for Zero-Trust Low-Altitude Intelligent Networks [77.17664010626726]
低高度インテリジェントネットワーク(LAIN)における複数のUAVクラスタによるルーティングに焦点を当てる。
潜在的な脅威によるダメージを最小限に抑えるため,ソフトウェア定義の周辺技術とブロックチェーン技術を用いたゼロトラストアーキテクチャを提案する。
提案手法は,平均E2E遅延を59%削減し,TSRを29%改善することを示した。
論文 参考訳(メタデータ) (2026-02-27T04:30:35Z) - Multi-Agent Collaborative Intrusion Detection for Low-Altitude Economy IoT: An LLM-Enhanced Agentic AI Framework [60.72591149679355]
低高度経済の急速な拡大により、インターネット・オブ・モノ(LAE-IoT)ネットワークは前例のないセキュリティ上の課題を生んだ。
従来の侵入検知システムは、空中IoT環境のユニークな特徴に対処できない。
LAE-IoTネットワークにおける侵入検出を強化するための大規模言語モデル(LLM)対応エージェントAIフレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-25T12:47:25Z) - Multi-Agent Deep Reinforcement Learning for Collaborative UAV Relay Networks under Jamming Atatcks [36.380478794869234]
本稿では,この課題を,分散実行トレーニング(CTDE)フレームワークを用いて解決したMARL(Multi-Agent Reinforcement Learning)問題として定式化する。
提案手法はベースラインを著しく上回り,システム全体のスループットを約50%向上し,同時にほぼゼロの衝突速度を実現した。
重要な発見は、エージェントが明示的なプログラミングなしに創発的なアンチジャミング戦略を開発することである。
論文 参考訳(メタデータ) (2025-12-09T08:11:21Z) - A Probabilistic Approach to Pose Synchronization for Multi-Reference Alignment with Applications to MIMO Wireless Communication Systems [23.395471718542712]
本稿では,Creo-EMやコンピュータビジョン,特に無線通信システムなど,現実の多くの問題において発生するマルチ参照アライメントの問題について検討する。
我々は、相対的なポーズをニュアンス変数として生み出す新しいアルゴリズムを見つけ、それによって問題のグローバルな対称性を排除し、より直接的な解決を可能にし、収束を改善した。
論文 参考訳(メタデータ) (2025-11-05T08:23:58Z) - Learning Decentralized Routing Policies via Graph Attention-based Multi-Agent Reinforcement Learning in Lunar Delay-Tolerant Networks [4.030873682988143]
我々は,Lunar Delay-Tolerant Network (LDTN) の制約下で動作するマルチロボット探査ミッションのための,完全に分散化されたルーティングフレームワークを提案する。
本稿では、部分観測可能なマルコフ決定問題(POMDP)として問題を定式化し、強化訓練、分散実行(CTDE)を行うグラフ注意に基づくマルチエージェント強化学習(GAT-MARL)政策を提案する。
本手法は局所的な観測のみに依存し,最短経路や制御されたフラッディングベースアルゴリズムのような古典的アプローチとは異なり,グローバルなトポロジ更新やパケット複製を必要としない。
論文 参考訳(メタデータ) (2025-10-23T11:13:11Z) - Efficient Beam Selection for ISAC in Cell-Free Massive MIMO via Digital Twin-Assisted Deep Reinforcement Learning [37.540612510652174]
我々は、誤報率制約の下で複数の受信APに対して共同目標検出確率の分布を導出する。
次に、マルコフ決定過程(MDP)としてビーム選択手順を定式化する。
リアルタイムエージェント環境相互作用の高コスト化とそれに伴うリスクを解消するために,新しいディジタルツイン(DT)支援オフラインDRL手法を提案する。
論文 参考訳(メタデータ) (2025-06-23T12:17:57Z) - Toward Dependency Dynamics in Multi-Agent Reinforcement Learning for Traffic Signal Control [8.312659530314937]
適応的な信号制御のためのデータ駆動型アプローチとして強化学習(RL)が出現する。
本稿では,DQN-DPUS(Deep Q-Network)のための動的強化更新戦略を提案する。
提案手法は最適探索を犠牲にすることなく収束速度を向上できることを示す。
論文 参考訳(メタデータ) (2025-02-23T15:29:12Z) - Scalable spectral representations for multi-agent reinforcement learning in network MDPs [13.782868855372774]
マルチエージェント制御の一般的なモデルであるNetwork Markov Decision Processes (MDPs)は、効率的な学習に重大な課題をもたらす。
まず、ネットワークMDPに対してスケーラブルなスペクトル局所表現を導出し、各エージェントの局所$Q$関数に対するネットワーク線形部分空間を誘導する。
我々は,連続的な状態対応ネットワークMDPのためのスケーラブルなアルゴリズムフレームワークを設計し,アルゴリズムの収束をエンドツーエンドで保証する。
論文 参考訳(メタデータ) (2024-10-22T17:45:45Z) - Decentralized Learning Strategies for Estimation Error Minimization with Graph Neural Networks [94.2860766709971]
統計的に同一性を持つ無線ネットワークにおける自己回帰的マルコフ過程のサンプリングとリモート推定の課題に対処する。
我々のゴールは、分散化されたスケーラブルサンプリングおよび送信ポリシーを用いて、時間平均推定誤差と/または情報の年齢を最小化することである。
論文 参考訳(メタデータ) (2024-04-04T06:24:11Z) - Compressed Regression over Adaptive Networks [58.79251288443156]
分散エージェントのネットワークによって達成可能な性能を導出し,通信制約や回帰問題を解消し,適応的に解決する。
エージェントによって最適化に必要なパラメータをオンラインで学習できる最適化アロケーション戦略を考案する。
論文 参考訳(メタデータ) (2023-04-07T13:41:08Z) - Non-Coherent Over-the-Air Decentralized Gradient Descent [0.0]
無線システムにおける分散グラディエントDescentの実装は、ノイズ、フェーディング、帯域幅の制限により困難である。
本稿では,スケジューリング,トポロジ情報,CSIの必要性を解消するスケーラブルなDGDアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-11-19T19:15:34Z) - Artificial Intelligence Empowered Multiple Access for Ultra Reliable and
Low Latency THz Wireless Networks [76.89730672544216]
テラヘルツ(THz)無線ネットワークは、第5世代(B5G)以上の時代を触媒すると予想されている。
いくつかのB5Gアプリケーションの超信頼性と低レイテンシ要求を満たすためには、新しいモビリティ管理アプローチが必要である。
本稿では、インテリジェントなユーザアソシエーションとリソースアロケーションを実現するとともに、フレキシブルで適応的なモビリティ管理を可能にする、全体論的MAC層アプローチを提案する。
論文 参考訳(メタデータ) (2022-08-17T03:00:24Z) - State-Augmented Learnable Algorithms for Resource Management in Wireless
Networks [124.89036526192268]
本稿では,無線ネットワークにおける資源管理問題を解決するためのステート拡張アルゴリズムを提案する。
提案アルゴリズムは, RRM決定を可能, ほぼ最適に行うことができることを示す。
論文 参考訳(メタデータ) (2022-07-05T18:02:54Z) - Design and Analysis of Robust Resilient Diffusion over Multi-Task
Networks Against Byzantine Attacks [38.740376971569695]
本稿では,マルチタスクネットワーク上での分散拡散適応について,インパルス干渉とビザンチン攻撃の存在下で検討する。
我々は,Geman-McClure-estimation (RDLMG) アルゴリズムを,Geman-McClure estimator のコスト関数に基づいて開発する。
提案したRDLMGアルゴリズムのマルチターゲットローカライゼーションおよびマルチタスクスペクトルセンシングへの応用に関する数値的な評価を行った。
論文 参考訳(メタデータ) (2022-06-25T22:58:51Z) - Learning Resilient Radio Resource Management Policies with Graph Neural
Networks [124.89036526192268]
我々は、ユーザ当たりの最小容量制約でレジリエントな無線リソース管理問題を定式化する。
有限個のパラメータ集合を用いてユーザ選択と電力制御ポリシーをパラメータ化できることを示す。
このような適応により,提案手法は平均レートと5番目のパーセンタイルレートとの良好なトレードオフを実現する。
論文 参考訳(メタデータ) (2022-03-07T19:40:39Z) - Cooperative Multi-Agent Reinforcement Learning Based Distributed Dynamic
Spectrum Access in Cognitive Radio Networks [46.723006378363785]
ダイナミックスペクトルアクセス(DSA)は、非効率的なスペクトル利用の問題を改善するための、有望なパラダイムである。
本稿では,一般的な認知無線ネットワークにおけるマルチユーザに対する分散DSA問題について検討する。
我々は、各認知ユーザに対する状態の部分的観測可能性に対処するために、DRQN(Deep Recurrent Q-network)を用いている。
論文 参考訳(メタデータ) (2021-06-17T06:52:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。