論文の概要: Bayesian Optimization for Non-Cooperative Game-Based Radio Resource Management
- arxiv url: http://arxiv.org/abs/2512.01245v1
- Date: Mon, 01 Dec 2025 03:44:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.672206
- Title: Bayesian Optimization for Non-Cooperative Game-Based Radio Resource Management
- Title(参考訳): 非協調型ゲームベース無線資源管理のためのベイズ最適化
- Authors: Yunchuan Zhang, Jiechen Chen, Junshuo Liu, Robert C. Qiu,
- Abstract要約: 本稿では、スペクトル共有BS間の資源配分を非協調ゲームとして定式化する。
逐次決定-評価ペアから学習する新しいベイズ最適化戦略であるPPR-UCBを提案する。
マルチセルマルチアンテナシステムにおけるダウンリンク伝送電力配分実験は、PPR-UCBの効率を実証する。
- 参考スコア(独自算出の注目度): 3.652142532307204
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Radio resource management in modern cellular networks often calls for the optimization of complex utility functions that are potentially conflicting between different base stations (BSs). Coordinating the resource allocation strategies efficiently across BSs to ensure stable network service poses significant challenges, especially when each utility is accessible only via costly, black-box evaluations. This paper considers formulating the resource allocation among spectrum sharing BSs as a non-cooperative game, with the goal of aligning their allocation incentives toward a stable outcome. To address this challenge, we propose PPR-UCB, a novel Bayesian optimization (BO) strategy that learns from sequential decision-evaluation pairs to approximate pure Nash equilibrium (PNE) solutions. PPR-UCB applies martingale techniques to Gaussian process (GP) surrogates and constructs high probability confidence bounds for utilities uncertainty quantification. Experiments on downlink transmission power allocation in a multi-cell multi-antenna system demonstrate the efficiency of PPR-UCB in identifying effective equilibrium solutions within a few data samples.
- Abstract(参考訳): 現代の携帯電話ネットワークにおける無線リソース管理は、しばしば異なる基地局(BS)間で競合する可能性のある複雑なユーティリティ機能の最適化を要求する。
安定したネットワークサービスを確保するために、BS全体のリソース割り当て戦略を効率的に調整することは、特にコストがかかるブラックボックス評価を通じて、各ユーティリティがアクセス可能である場合、大きな課題となる。
本稿では、スペクトル共有BS間のリソース割り当てを非協調ゲームとして定式化し、安定した結果に向けてアロケーションインセンティブを調整することを目的とする。
この課題に対処するために、PPR-UCBを提案する。これは、シーケンシャルな決定-評価ペアから学習し、純粋なナッシュ均衡(PNE)解を近似する新しいベイズ最適化(BO)戦略である。
PPR-UCBはガウス過程(GP)にマーチンゲール法を適用し、有効性不確実性定量化のための高い確率信頼境界を構築する。
マルチセルマルチアンテナシステムにおけるダウンリンク伝送電力配分実験は、数個のデータサンプル内で有効な平衡解を同定する上で、PPR-UCBの有効性を示す。
関連論文リスト
- MMR1: Enhancing Multimodal Reasoning with Variance-Aware Sampling and Open Resources [113.33902847941941]
VAS (Variance-Aware Sampling) は、Variance Promotion Score (VPS) によって導かれるデータ選択戦略である。
我々は、1.6MのCoT冷間開始データと15kのRLQAペアを含む大規模かつ慎重にキュレートされたリソースをリリースする。
数学的推論ベンチマークによる実験では、キュレートされたデータと提案されたVASの有効性が示されている。
論文 参考訳(メタデータ) (2025-09-25T14:58:29Z) - Heterogeneous Resource Allocation for Ensuring End-to-End Quality of Service in Multi-hop Integrated Access and Backhaul Network [0.0]
マルチホップ統合アクセス・バックホール(IAB)アーキテクチャは、ネットワーク密度化のための費用対効果の高いソリューションとして登場した。
動的時間分割デュプレックス(D-TDD)は、非対称なアップリンクとダウンリンクのトラフィックを持つ非常にダイナミックなシナリオに適応する、有望なソリューションです。
統合最適化問題(IOP)をサブプロブレムに分解して解空間を小さくする。
システム全体のソリューションを実現するために,一元的ヘテロジニアマルチフォロガーのStackelberg-gameベースのリソース割り当て方式を提案する。
論文 参考訳(メタデータ) (2025-04-04T16:29:08Z) - Efficient and Scalable Deep Reinforcement Learning for Mean Field Control Games [16.62770187749295]
平均場制御ゲーム(MFCG)は、無限に多くの相互作用するエージェントのシステムを解析するための強力な理論的枠組みを提供する。
本稿では,MFCGの近似平衡解に対する拡張性のある深層強化学習(RL)手法を提案する。
論文 参考訳(メタデータ) (2024-12-28T02:04:53Z) - Cluster-Based Multi-Agent Task Scheduling for Space-Air-Ground Integrated Networks [60.085771314013044]
低高度経済は、コミュニケーションやセンシングなどの分野で発展する大きな可能性を秘めている。
本稿では,SAGINにおけるマルチUAV協調タスクスケジューリング問題に対処するため,クラスタリングに基づく多エージェントDeep Deterministic Policy Gradient (CMADDPG)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-12-14T06:17:33Z) - Generative AI for O-RAN Slicing: A Semi-Supervised Approach with VAE and Contrastive Learning [5.1435595246496595]
本稿では,O-RANにおける資源割り当てとネットワークスライシングを最適化する,新しい生成型AI(GAI)による半教師付き学習アーキテクチャを提案する。
本稿では,eMBB と URLLC サービスの質を高めるために,ユーザ機器のスループット(UE)を最大化し,物理リソースブロック(PRB)を割り当てる。
論文 参考訳(メタデータ) (2024-01-16T22:23:27Z) - Joint User Association, Interference Cancellation and Power Control for
Multi-IRS Assisted UAV Communications [80.35959154762381]
インテリジェント反射面(IRS)支援無人航空機(UAV)通信は、地上基地局の負荷を低コストで軽減することが期待されている。
既存の研究は主に、複数のIRSではなく単一のIRSの配置とリソース割り当てに焦点を当てている。
我々は,共同IRSユーザアソシエーションのための新しい最適化アルゴリズム,UAVの軌道最適化,逐次干渉キャンセル(SIC)復号命令スケジューリング,電力割り当てを提案する。
論文 参考訳(メタデータ) (2023-12-08T01:57:10Z) - Coverage and Capacity Optimization in STAR-RISs Assisted Networks: A
Machine Learning Approach [102.00221938474344]
再構成可能なインテリジェントサーフェス (STAR-RIS) アシストネットワークを同時に送信および反射するカバレッジとキャパシティ最適化のための新しいモデルを提案する。
損失関数ベースの更新戦略はコアポイントであり、各更新時にmin-normソルバによってカバレッジとキャパシティの両方の損失関数の重みを計算することができる。
解析結果から,提案手法は固定重みに基づくMOアルゴリズムよりも優れていることがわかった。
論文 参考訳(メタデータ) (2022-04-13T13:52:22Z) - Learning Resilient Radio Resource Management Policies with Graph Neural
Networks [124.89036526192268]
我々は、ユーザ当たりの最小容量制約でレジリエントな無線リソース管理問題を定式化する。
有限個のパラメータ集合を用いてユーザ選択と電力制御ポリシーをパラメータ化できることを示す。
このような適応により,提案手法は平均レートと5番目のパーセンタイルレートとの良好なトレードオフを実現する。
論文 参考訳(メタデータ) (2022-03-07T19:40:39Z) - A Q-Learning-based Approach for Distributed Beam Scheduling in mmWave
Networks [18.22250038264899]
ミリ波(mmWave)セルネットワークにおける分散ダウンリンクビームスケジューリングと電力配分の問題点を考察する。
異なるサービス事業者に属する複数の基地局は同じ無許可のスペクトルを共有しており、中心的な調整や協調は行われていない。
本稿では,各BSを独立したQ学習エージェントとしてモデル化し,分散スケジューリング手法を提案する。
論文 参考訳(メタデータ) (2021-10-17T02:58:13Z) - Deep Reinforcement Learning Based Multidimensional Resource Management
for Energy Harvesting Cognitive NOMA Communications [64.1076645382049]
エネルギー収穫(EH)、認知無線(CR)、非直交多重アクセス(NOMA)の組み合わせはエネルギー効率を向上させるための有望な解決策である。
本稿では,決定論的CR-NOMA IoTシステムにおけるスペクトル,エネルギー,時間資源管理について検討する。
論文 参考訳(メタデータ) (2021-09-17T08:55:48Z) - Cooperative Multi-Agent Reinforcement Learning Based Distributed Dynamic
Spectrum Access in Cognitive Radio Networks [46.723006378363785]
ダイナミックスペクトルアクセス(DSA)は、非効率的なスペクトル利用の問題を改善するための、有望なパラダイムである。
本稿では,一般的な認知無線ネットワークにおけるマルチユーザに対する分散DSA問題について検討する。
我々は、各認知ユーザに対する状態の部分的観測可能性に対処するために、DRQN(Deep Recurrent Q-network)を用いている。
論文 参考訳(メタデータ) (2021-06-17T06:52:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。