論文の概要: FedCritic: Serverless Federated Critic Learning-based Resource Allocation for Multi-Cell OFDMA in 6G
- arxiv url: http://arxiv.org/abs/2605.21418v1
- Date: Wed, 20 May 2026 17:13:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.803666
- Title: FedCritic: Serverless Federated Critic Learning-based Resource Allocation for Multi-Cell OFDMA in 6G
- Title(参考訳): FedCritic: 6G におけるマルチセル OFDMA のためのサーバレスフェデレーションによる批判的学習に基づくリソース割り当て
- Authors: Amin Farajzadeh, Melike Erol-Kantarci,
- Abstract要約: 6G超高密度ネットワークでは、アグレッシブ周波数再利用はセル間干渉を増幅する。
分散実行を備えたサーバレスフェデレーションマルチエージェントフレームワークであるFedCriticを開発した。
- 参考スコア(独自算出の注目度): 4.726504262162973
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In sixth-generation (6G) ultra-dense networks, aggressive frequency reuse amplifies inter-cell interference (ICI), making multi-cell orthogonal frequency-division multiple access (OFDMA) scheduling and power control strongly coupled across neighboring cells. We study distributed downlink resource management -- joint subcarrier scheduling and power allocation -- under interference coupling and long-term per-user quality-of-service (QoS) minimum-rate constraints. By using virtual-queue deficit weights to enforce long-term QoS, we develop FedCritic, a serverless federated multi-agent actor-critic framework with decentralized execution. Unlike centralized training with decentralized execution (CTDE) approaches that require centralized critic learning and joint trajectory aggregation, FedCritic federates the critic through lightweight gossip-based parameter averaging over the interference graph, enabling stable value estimation without a central coordinator while keeping policies local. Simulations in an interference-rich reuse-1 setting show that FedCritic improves mean signal-to-interference-plus-noise ratio (SINR) and cell-edge rate, increases network-wide average sum-rate and fairness relative to non-coordinated and CTDE baselines, and achieves more stable training with lower coordination overhead.
- Abstract(参考訳): 第6世代(6G)超高密度ネットワークにおいて、アグレッシブ周波数再利用は細胞間干渉(ICI)を増幅し、マルチセル直交周波数分割多重アクセス(OFDMA)スケジューリングと、近隣細胞間で強く結合された電力制御を実現する。
本稿では,分散ダウンリンクリソース管理(連系サブキャリアスケジューリングと電力配分)について,相互干渉結合とQoS(Long-term per-user quality-of-service)の制約下で検討する。
長期QoSを実施するために仮想キュー障害重みを用いることで、サーバーレスフェデレーションのマルチエージェントアクタ批判フレームワークであるFedCriticを開発した。
集中的な批判学習と共同軌道集約を必要とするCTDE(decentralized execution)アプローチとは異なり、FedCriticは干渉グラフを平均化する軽量なゴシップベースのパラメータを通じて批判をフェデレートし、ポリシーをローカルに保ちながら集中コーディネータを使わずに安定した価値推定を可能にする。
干渉リッチ・リユース-1設定のシミュレーションでは、FedCriticは平均信号対干渉+ノイズ比(SINR)とセルエッジレートを改善し、非コーディネートおよびCTDEベースラインに対するネットワーク全体の平均和率と公平性を向上し、調整オーバーヘッドを低くしてより安定したトレーニングを実現する。
関連論文リスト
- RADAR-Q: Resource-Aware Distributed Asynchronous Routing for Entanglement Distribution in Multi-Tenant Quantum Networks [11.815937275904467]
量子ネットワークは同時に絡み合うリクエストをサポートする必要があるが、既存のルーティングプロトコルはユーザーが共有リピータリソースと競合する際に失敗する。
本稿では、リアルタイムリソース競合を経路選択に埋め込んだリソース対応分散ルーティングプロトコルRADAR-Qを提案する。
論文 参考訳(メタデータ) (2026-03-29T08:10:41Z) - GEPO: Group Expectation Policy Optimization for Stable Heterogeneous Reinforcement Learning [43.46954951944727]
パラメータ学習とロールアウトサンプリングを分離する異種RLアーキテクチャであるHeteroRLを提案する。
コアコンポーネントは、レイテンシに堅牢な非同期RLアルゴリズムであるグループ期待ポリシー最適化(GEPO)である。
GEPOが優れた安定性を実現していることを示す実験は、オンラインから1800年代のレイテンシまで、わずか3%のパフォーマンス低下である。
論文 参考訳(メタデータ) (2025-08-25T09:57:35Z) - FAuNO: Semi-Asynchronous Federated Reinforcement Learning Framework for Task Offloading in Edge Systems [41.364418162255184]
textbfFAuNO -- emphFederated Asynchronous Network Orchestrator -- エッジシステムの分散タスクオフロードのためのバッファリングされた非同期の強化学習フレームワーク。
emphPeersimGym環境での実験では、FAuNOはタスクの損失と遅延を減らすために、フェデレーションされたマルチエージェントRLベースラインと一貫して一致または超えている。
論文 参考訳(メタデータ) (2025-06-03T09:15:03Z) - Communication-Efficient Federated Learning by Quantized Variance Reduction for Heterogeneous Wireless Edge Networks [55.467288506826755]
フェデレーテッド・ラーニング(FL)は、無線エッジネットワークにおけるローカル・プライバシ・アウェア・コラボレーティブ・モデルトレーニングの有効なソリューションとして認識されている。
既存の通信効率の高いFLアルゴリズムは、デバイス間の大きなばらつきを低減できない。
本稿では,高度分散還元方式に依存する新しい通信効率FLアルゴリズムであるFedQVRを提案する。
論文 参考訳(メタデータ) (2025-01-20T04:26:21Z) - Cluster-Based Multi-Agent Task Scheduling for Space-Air-Ground Integrated Networks [60.085771314013044]
低高度経済は、コミュニケーションやセンシングなどの分野で発展する大きな可能性を秘めている。
本稿では,SAGINにおけるマルチUAV協調タスクスケジューリング問題に対処するため,クラスタリングに基づく多エージェントDeep Deterministic Policy Gradient (CMADDPG)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-12-14T06:17:33Z) - Non-Coherent Over-the-Air Decentralized Gradient Descent [0.0]
無線システムにおける分散グラディエントDescentの実装は、ノイズ、フェーディング、帯域幅の制限により困難である。
本稿では,スケジューリング,トポロジ情報,CSIの必要性を解消するスケーラブルなDGDアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-11-19T19:15:34Z) - Decentralized Federated Reinforcement Learning for User-Centric Dynamic
TFDD Control [37.54493447920386]
非対称かつ不均一なトラフィック要求を満たすための学習に基づく動的時間周波数分割二重化(D-TFDD)方式を提案する。
分散化された部分観測可能なマルコフ決定過程(Dec-POMDP)として問題を定式化する。
本稿では,グローバルリソースを分散的に最適化するために,Wolpertinger Deep Deterministic Policy gradient (FWDDPG)アルゴリズムという,連合強化学習(RL)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-11-04T07:39:21Z) - Convergence Acceleration in Wireless Federated Learning: A Stackelberg Game Approach [46.72890704790504]
本稿では,FLOWN(Federated Learning over Wireless Network)における収束時間の共同最適化に関する問題点について検討する。
エネルギー制約下でのFLOWNの参加デバイス選択の基準とプロトコルを考察し,そのデバイス選択への影響を導出する。
本稿では,AoUに基づくデバイス選択アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-09-14T13:20:26Z) - Artificial Intelligence Empowered Multiple Access for Ultra Reliable and
Low Latency THz Wireless Networks [76.89730672544216]
テラヘルツ(THz)無線ネットワークは、第5世代(B5G)以上の時代を触媒すると予想されている。
いくつかのB5Gアプリケーションの超信頼性と低レイテンシ要求を満たすためには、新しいモビリティ管理アプローチが必要である。
本稿では、インテリジェントなユーザアソシエーションとリソースアロケーションを実現するとともに、フレキシブルで適応的なモビリティ管理を可能にする、全体論的MAC層アプローチを提案する。
論文 参考訳(メタデータ) (2022-08-17T03:00:24Z) - Learning Resilient Radio Resource Management Policies with Graph Neural
Networks [124.89036526192268]
我々は、ユーザ当たりの最小容量制約でレジリエントな無線リソース管理問題を定式化する。
有限個のパラメータ集合を用いてユーザ選択と電力制御ポリシーをパラメータ化できることを示す。
このような適応により,提案手法は平均レートと5番目のパーセンタイルレートとの良好なトレードオフを実現する。
論文 参考訳(メタデータ) (2022-03-07T19:40:39Z) - Semantic-Aware Collaborative Deep Reinforcement Learning Over Wireless
Cellular Networks [82.02891936174221]
複数のエージェントが無線ネットワーク上で協調できるコラボレーティブディープ強化学習(CDRL)アルゴリズムは有望なアプローチである。
本稿では,リソース制約のある無線セルネットワーク上で,意味的にリンクされたDRLタスクを持つ未学習エージェントのグループを効率的に協調させる,新しい意味認識型CDRL手法を提案する。
論文 参考訳(メタデータ) (2021-11-23T18:24:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。