論文の概要: Distributed Learning in Markovian Restless Bandits over Interference Graphs for Stable Spectrum Sharing
- arxiv url: http://arxiv.org/abs/2512.17161v1
- Date: Fri, 19 Dec 2025 01:43:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-22 19:25:54.215639
- Title: Distributed Learning in Markovian Restless Bandits over Interference Graphs for Stable Spectrum Sharing
- Title(参考訳): 安定スペクトル共有のための干渉グラフを用いたマルコフ型レストバンドの分散学習
- Authors: Liad Lea Didi, Kobi Cohen,
- Abstract要約: 無線ネットワークにおける認知コミュニケーションエンティティ間のスペクトルアクセスと共有のための分散学習について検討する。
私たちのゴールは、グローバルに安定し、干渉対応のチャネルアロケーションを達成することです。
我々は、レスレスブライト学習とグラフ制約付き協調を統合した通信効率の高い分散学習アルゴリズムSMILEを開発した。
- 参考スコア(独自算出の注目度): 9.446392400546364
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study distributed learning for spectrum access and sharing among multiple cognitive communication entities, such as cells, subnetworks, or cognitive radio users (collectively referred to as cells), in communication-constrained wireless networks modeled by interference graphs. Our goal is to achieve a globally stable and interference-aware channel allocation. Stability is defined through a generalized Gale-Shapley multi-to-one matching, a well-established solution concept in wireless resource allocation. We consider wireless networks where L cells share S orthogonal channels and cannot simultaneously use the same channel as their neighbors. Each channel evolves as an unknown restless Markov process with cell-dependent rewards, making this the first work to establish global Gale-Shapley stability for channel allocation in a stochastic, temporally varying restless environment. To address this challenge, we develop SMILE (Stable Multi-matching with Interference-aware LEarning), a communication-efficient distributed learning algorithm that integrates restless bandit learning with graph-constrained coordination. SMILE enables cells to distributedly balance exploration of unknown channels with exploitation of learned information. We prove that SMILE converges to the optimal stable allocation and achieves logarithmic regret relative to a genie with full knowledge of expected utilities. Simulations validate the theoretical guarantees and demonstrate SMILE's robustness, scalability, and efficiency across diverse spectrum-sharing scenarios.
- Abstract(参考訳): 干渉グラフをモデルとした通信制約無線ネットワークにおいて,複数の認知コミュニケーションエンティティ(セル,サブネットワーク,あるいは認知無線ユーザ)間でのスペクトルアクセスと共有のための分散学習について検討した。
私たちのゴールは、グローバルに安定し、干渉対応のチャネルアロケーションを達成することです。
安定性は、無線リソース割り当てにおいて確立された概念である一般化されたGale-Shapley multi-to-oneマッチングによって定義される。
我々は、L細胞がS直交チャネルを共有し、隣人と同じチャネルを同時に使用できない無線ネットワークを考える。
各チャネルは、セル依存的な報酬を伴う未知のレストレスマルコフ過程として進化し、確率的かつ時間的に変化するレストレス環境において、チャネル割り当てのためのグローバルなガレ-シャプリー安定性を確立する最初の試みとなる。
この課題に対処するために,レスレス・バンディット学習とグラフ制約付きコーディネーションを組み合わせた通信効率の高い分散学習アルゴリズムSMILE(Stable Multi-matching with Interference-aware LEarning)を開発した。
SMILEは、未知のチャネルの探索と学習情報の活用を分散的に行うことができる。
SMILEが最適安定配分に収束し,期待されたユーティリティを十分に把握したジェニーに対して対数的後悔を実現することを証明した。
シミュレーションは、SMILEの堅牢性、スケーラビリティ、および様々なスペクトル共有シナリオにおける効率性を理論的に検証し、実証する。
関連論文リスト
- Communication-Efficient Device Scheduling for Federated Learning Using Lyapunov Optimization [35.34598274073446]
フェデレートラーニング(FL)は、データを集中的に収集することなく、分散データ上で機械学習モデルのトレーニングを可能にする便利なツールである。
FLを制約された無線環境にデプロイする場合、接続性、断続的な接続品質、および非i.d.データは、機械学習モデルのトレーニングを著しく遅くする。
論文 参考訳(メタデータ) (2025-03-01T17:30:56Z) - SOFTS: Efficient Multivariate Time Series Forecasting with Series-Core Fusion [59.96233305733875]
時系列予測は、金融、交通管理、エネルギー、医療など様々な分野で重要な役割を果たしている。
いくつかの方法は、注意やミキサーのようなメカニズムを利用して、チャネル相関をキャプチャすることでこの問題に対処する。
本稿では,効率的なモデルであるSOFTS(Series-cOre Fused Time Series forecaster)を提案する。
論文 参考訳(メタデータ) (2024-04-22T14:06:35Z) - SINR-Aware Deep Reinforcement Learning for Distributed Dynamic Channel
Allocation in Cognitive Interference Networks [10.514231683620517]
本稿では,複数の大規模ネットワークによるキャリヤ間干渉(ICI)とチャネル再利用を経験する実世界のシステムに焦点を当てる。
CARLTON(Channel Allocation RL To Overlapped Networks)と呼ばれる分散DCAのための新しいマルチエージェント強化学習フレームワークを提案する。
本結果は,従来の最先端手法に比べて優れた効率性を示し,優れた性能とロバストな一般化を示した。
論文 参考訳(メタデータ) (2024-02-17T20:03:02Z) - Rendering Wireless Environments Useful for Gradient Estimators: A Zero-Order Stochastic Federated Learning Method [14.986031916712108]
クロスデバイスフェデレーション学習(FL)は成長する機械学習フレームワークであり、複数のエッジデバイスが協力して、生データを公開せずにモデルをトレーニングする。
学習アルゴリズム自体において、その影響を解析する代わりに、無線チャネルを利用する方法を示す。
論文 参考訳(メタデータ) (2024-01-30T21:46:09Z) - Decentralized Learning over Wireless Networks: The Effect of Broadcast
with Random Access [56.91063444859008]
本稿では,D-SGDのコンバージェンス性能に及ぼす放送送信と確率的ランダムアクセスポリシーの影響について検討する。
この結果から,アクセス確率を最適化し,期待されるリンク数の最大化が,システム収束を加速するための極めて効果的な戦略であることが示唆された。
論文 参考訳(メタデータ) (2023-05-12T10:32:26Z) - Federated Learning over Wireless Networks: A Band-limited Coordinated
Descent Approach [28.616890702473526]
ネットワークエッジにおけるフェデレート学習のための多対一無線アーキテクチャについて検討する。
エッジデバイスのローカルアップデートは、利用可能な無線通信リソースに合わせて慎重に作成および圧縮されなければならない。
本稿では,SGDに基づく帯域限定座標降下アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-16T06:21:08Z) - FedRec: Federated Learning of Universal Receivers over Fading Channels [92.15358738530037]
本稿では,ダウンリンクフェージングチャネルに対するニューラルネットワークを用いたシンボル検出手法を提案する。
複数のユーザが協力して、普遍的なデータ駆動型検出器を学習する。
得られた受信機の性能は、フェーディング統計の知識を必要とせずに、様々なチャネル条件下でMAP性能に近づくことを示す。
論文 参考訳(メタデータ) (2020-11-14T11:29:55Z) - Decentralized Learning for Channel Allocation in IoT Networks over
Unlicensed Bandwidth as a Contextual Multi-player Multi-armed Bandit Game [134.88020946767404]
本稿では,プライマリセルネットワークにライセンスされたスペクトルに基づいて,アドホックなモノのインターネットネットワークにおける分散チャネル割り当て問題について検討する。
本研究では,この問題をコンテキスト型マルチプレイヤー・マルチアームバンディットゲームにマッピングし,試行錯誤による純粋に分散化された3段階ポリシー学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-03-30T10:05:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。