論文の概要: Fair Dynamic Spectrum Access via Fully Decentralized Multi-Agent Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2503.24296v1
- Date: Mon, 31 Mar 2025 16:42:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-01 14:33:01.672107
- Title: Fair Dynamic Spectrum Access via Fully Decentralized Multi-Agent Reinforcement Learning
- Title(参考訳): 完全分散マルチエージェント強化学習による公正スペクトルアクセス
- Authors: Yubo Zhang, Pedro Botelho, Trevor Gordon, Gil Zussman, Igor Kadota,
- Abstract要約: 周波数帯域が限られている複数のソース・デスティネーションペアを持つ分散無線ネットワークについて検討する。
ソースは、情報を共有することなく、分散的に送信(具体的にはバンド選択戦略)を時間とともに適応させることを学ぶ。
コーディネーションを伴わない公平性を実現するために, 完全分散強化学習(RL)に基づく新しいソリューションを提案する。
- 参考スコア(独自算出の注目度): 6.293219180238377
- License:
- Abstract: We consider a decentralized wireless network with several source-destination pairs sharing a limited number of orthogonal frequency bands. Sources learn to adapt their transmissions (specifically, their band selection strategy) over time, in a decentralized manner, without sharing information with each other. Sources can only observe the outcome of their own transmissions (i.e., success or collision), having no prior knowledge of the network size or of the transmission strategy of other sources. The goal of each source is to maximize their own throughput while striving for network-wide fairness. We propose a novel fully decentralized Reinforcement Learning (RL)-based solution that achieves fairness without coordination. The proposed Fair Share RL (FSRL) solution combines: (i) state augmentation with a semi-adaptive time reference; (ii) an architecture that leverages risk control and time difference likelihood; and (iii) a fairness-driven reward structure. We evaluate FSRL in more than 50 network settings with different number of agents, different amounts of available spectrum, in the presence of jammers, and in an ad-hoc setting. Simulation results suggest that, when we compare FSRL with a common baseline RL algorithm from the literature, FSRL can be up to 89.0% fairer (as measured by Jain's fairness index) in stringent settings with several sources and a single frequency band, and 48.1% fairer on average.
- Abstract(参考訳): 直交周波数帯域を限定的に共有する複数のソース-終端ペアを持つ分散無線ネットワークについて検討する。
ソースは、情報を共有することなく、分散的に送信(具体的にはバンド選択戦略)を時間とともに適応させることを学ぶ。
ソースは、ネットワークサイズや他のソースの送信戦略に関する事前知識を持たない、自身の送信結果(すなわち、成功または衝突)のみを観測できる。
それぞれのソースの目標は、ネットワーク全体の公平性を追求しながら、自身のスループットを最大化することです。
コーディネーションを伴わない公平性を実現するために, 完全分散強化学習(RL)に基づく新しいソリューションを提案する。
提案されたフェアシェアRL(FSRL)ソリューションは、以下の2つを組み合わせている。
(i)準適応時間参照による状態拡張
二 リスク管理及び時間差の可能性を生かした建築
(三)フェアネスによる報酬構造。
我々はFSRLを50以上のネットワーク設定で評価し、エージェント数、利用可能なスペクトルの量、ジャマーの有無、アドホックな設定で評価した。
シミュレーションの結果、文献からFSRLと共通のベースラインRLアルゴリズムを比較すると、FSRLは複数のソースと単一周波数帯域の厳密な設定で最大89.0%のフェアラー、平均48.1%のフェアラーとなることが示唆された。
関連論文リスト
- Enhancing Spectrum Efficiency in 6G Satellite Networks: A GAIL-Powered Policy Learning via Asynchronous Federated Inverse Reinforcement Learning [67.95280175998792]
ビームフォーミング,スペクトルアロケーション,リモートユーザ機器(RUE)アソシエイトを最適化するために,GAILを利用した新しいポリシー学習手法を提案する。
手動チューニングなしで報酬関数を自動的に学習するために、逆RL(IRL)を用いる。
提案手法は従来のRL手法よりも優れており,コンバージェンスと報酬値の14.6%の改善が達成されている。
論文 参考訳(メタデータ) (2024-09-27T13:05:02Z) - A Federated Reinforcement Learning Framework for Link Activation in
Multi-link Wi-Fi Networks [3.093231349723552]
マルチリンク操作(MLO)は、高い干渉とチャネル競合が生じ、性能と信頼性が低下する。
本稿では,複数の分散エージェント間でデータを交換することなくモデルを学習するための協調機械学習手法を提案する。
その結果,FRLをベースとした分散MLO-LA戦略により,スループットの公平性が向上し,信頼性が向上した。
論文 参考訳(メタデータ) (2023-04-28T09:39:10Z) - Offline Reinforcement Learning at Multiple Frequencies [62.08749079914275]
本研究では、オフライン強化学習アルゴリズムが、トレーニング中に複数の周波数を混合したデータに対応できるかどうかについて検討する。
学習を安定させるために$Q$-valueの更新率で一貫性を強制する、単純だが効果的なソリューションを提案する。
論文 参考訳(メタデータ) (2022-07-26T17:54:49Z) - Distributional Reinforcement Learning for Multi-Dimensional Reward
Functions [91.88969237680669]
多次元分布DQN(MD3QN)を導入し、複数の報酬源からの共振分布をモデル化する。
関節分布モデリングの副産物として、MD3QNは各報酬源に対するリターンのランダム性を捉えることができる。
実験では,リッチな相関型報酬関数を持つ環境下での連立戻り分布を精度良くモデル化した。
論文 参考訳(メタデータ) (2021-10-26T11:24:23Z) - Federated Learning over Wireless IoT Networks with Optimized
Communication and Resources [98.18365881575805]
協調学習技術のパラダイムとしてのフェデレートラーニング(FL)は研究の注目を集めている。
無線システム上での高速応答および高精度FLスキームの検証が重要である。
提案する通信効率のよいフェデレーション学習フレームワークは,強い線形速度で収束することを示す。
論文 参考訳(メタデータ) (2021-10-22T13:25:57Z) - Cooperative Multi-Agent Reinforcement Learning Based Distributed Dynamic
Spectrum Access in Cognitive Radio Networks [46.723006378363785]
ダイナミックスペクトルアクセス(DSA)は、非効率的なスペクトル利用の問題を改善するための、有望なパラダイムである。
本稿では,一般的な認知無線ネットワークにおけるマルチユーザに対する分散DSA問題について検討する。
我々は、各認知ユーザに対する状態の部分的観測可能性に対処するために、DRQN(Deep Recurrent Q-network)を用いている。
論文 参考訳(メタデータ) (2021-06-17T06:52:21Z) - Decentralized Local Stochastic Extra-Gradient for Variational
Inequalities [125.62877849447729]
我々は、不均一(非IID)で多くのデバイスに分散する問題データを持つ領域上での分散変分不等式(VIs)を考察する。
我々は、完全に分散化された計算の設定を網羅する計算ネットワークについて、非常に一般的な仮定を行う。
理論的には, モノトン, モノトンおよび非モノトンセッティングにおける収束速度を理論的に解析する。
論文 参考訳(メタデータ) (2021-06-15T17:45:51Z) - Self-Organizing mmWave MIMO Cell-Free Networks With Hybrid Beamforming:
A Hierarchical DRL-Based Design [30.70798412145064]
セルフリー無線ネットワークにおいて、分散アクセスポイント(AP)は、同じ時間/周波数リソースを用いて、カバーエリア内のすべてのユーザ機器(UE)を共同で提供する。
深層学習(DRL)に基づく複数のネットワーク分割を提案する。
異なるセルフリーワーク間の干渉を設計するために,新しいハイブリッドビームストデジタルビームモデルを開発した。
論文 参考訳(メタデータ) (2021-03-17T03:31:52Z) - Hierarchical Reinforcement Learning for Relay Selection and Power
Optimization in Two-Hop Cooperative Relay Network [7.5377621697101205]
本研究では,2ホップ協調型中継ネットワークにおいて,送信電力の制約を考慮に入れた停止確率最小化問題について検討する。
我々は、リレー選択と配電のための戦略を学ぶために強化学習(RL)手法を用いる。
階層型強化学習(HRL)フレームワークとトレーニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-11-10T04:47:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。