論文の概要: Multi-User mmWave Beam and Rate Adaptation via Combinatorial Satisficing Bandits
- arxiv url: http://arxiv.org/abs/2604.14908v1
- Date: Thu, 16 Apr 2026 11:49:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-17 21:29:31.87726
- Title: Multi-User mmWave Beam and Rate Adaptation via Combinatorial Satisficing Bandits
- Title(参考訳): 組合せ充足帯域によるマルチユーザmmWaveビームとレート適応
- Authors: Emre Özyıldırım, Barış Yaycı, Umut Eren Akturk, Cem Tekin,
- Abstract要約: 複数の基地局(BSs)が複数の単一アンテナ用ユーザ機器(UEs)に、UE毎に一意なビームと離散データ伝送速度で接続するマルチユーザmmWave MISOシステムにおいて、ダウンリンクビームとレート適応について検討する。
サービス目標を符号化するために、整合スループットしきい値$_r$を導入し、ビームレート境界を超える半帯域として、鋳造継手ビームとレート適応を導入する。
SAT-CTSは,ユーザ間の平均スループットと公平性を良好に達成しつつ,常に後悔を減らし,競争標準の後悔を維持していることを示す。
- 参考スコア(独自算出の注目度): 5.873949143662286
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study downlink beam and rate adaptation in a multi-user mmWave MISO system where multiple base stations (BSs), each using analog beamforming from finite codebooks, serve multiple single-antenna user equipments (UEs) with a unique beam per UE and discrete data transmission rates. BSs learn about transmission success based on ACK/NACK feedback. To encode service goals, we introduce a satisficing throughput threshold $τ_r$ and cast joint beam and rate adaptation as a combinatorial semi-bandit over beam-rate tuples. Within this framework, we propose SAT-CTS, a lightweight, threshold-aware policy that blends conservative confidence estimates with posterior sampling, steering learning toward meeting $τ_r$ rather than merely maximizing. Our main theoretical contribution provides the first finite-time regret bounds for combinatorial semi-bandits with satisficing objective: when $τ_r$ is realizable, we upper bound the cumulative satisficing regret to the target with a time-independent constant, and when $τ_r$ is non-realizable, we show that SAT-CTS incurs only a finite expected transient outside committed CTS rounds, after which its regret is governed by the sum of the regret contributions of restarted CTS rounds, yielding an $O((\log T)^2)$ standard regret bound. On the practical side, we evaluate the performance via cumulative satisficing regret to $τ_r$ alongside standard regret and fairness. Experiments with time-varying sparse multipath channels show that SAT-CTS consistently reduces satisficing regret and maintains competitive standard regret, while achieving favorable average throughput and fairness across users, indicating that feedback-efficient learning can equitably allocate beams and rates to meet QoS targets without channel state knowledge.
- Abstract(参考訳): 複数基地局 (BSs) を有限符号帳からアナログビームフォーミングし, UE毎に一意なビームと離散データ伝送率を持つ単一アンテナユーザ機器 (UEs) を複数提供するマルチユーザmmWave MISOシステムにおいて, ダウンリンクビームとレート適応について検討した。
BSはACK/NACKフィードバックに基づいて送信の成功について学ぶ。
サービス目標を符号化するために,ビームレートタプル上での整合性スループットしきい値τ_r$と鋳造継手ビームと周波数適応を組合せ半帯域として導入する。
このフレームワーク内ではSAT-CTSが提案される。SAT-CTSは、保守的信頼度推定と後続サンプリングをブレンドし、単に最大化するのではなく、$τ_r$の達成に向けた学習を操る軽量なしきい値認識ポリシーである。
我々の主要な理論的貢献は、組合せ半バンドに対する最初の有限時間後悔境界を満足する目的を持つ: $τ_r$ が実現可能なとき、累積満足の後悔境界を時間非依存定数で上界し、$τ_r$ が非実現可能であるとき、SAT-CTS は CTS ラウンドの有限の過渡的外部にしか生じないことを示し、その後、その後悔は再帰された CTS ラウンドの後悔の寄与の和によって支配され、$O(\log T)^2) が標準後悔境界となる。
実用面では、標準的な後悔と公正さとともに、後悔の累積満足度を$τ_r$とすることで、性能を評価する。
時間変化したスパースマルチパスチャネルを用いた実験では、SAT-CTSは相反する後悔を一貫して減らし、競合する標準後悔を保ちながら、ユーザの平均スループットと公正性を良好に達成し、フィードバック効率の高い学習は、チャンネル状態の知識なしにQoSターゲットに等しくビームとレートを割り当てることができることを示す。
関連論文リスト
- ZIP-RC: Optimizing Test-Time Compute via Zero-Overhead Joint Reward-Cost Prediction [57.799425838564]
ZIP-RCは、モデルに報酬とコストのゼロオーバーヘッド推論時間予測を持たせる適応推論手法である。
ZIP-RCは、同じまたはより低い平均コストで過半数投票よりも最大12%精度が向上する。
論文 参考訳(メタデータ) (2025-12-01T09:44:31Z) - Stochastic Approximation with Delayed Updates: Finite-Time Rates under Markovian Sampling [73.5602474095954]
マルコフサンプリングの遅延更新による近似スキームの非漸近的性能について検討した。
我々の理論的な発見は、幅広いアルゴリズムの遅延の有限時間効果に光を当てた。
論文 参考訳(メタデータ) (2024-02-19T03:08:02Z) - Discounted Thompson Sampling for Non-Stationary Bandit Problems [13.656518163592349]
NS-MAB(Non-stationary multi-armed bandit)問題も最近注目されている。
非定常条件の両方に対処するため,ガウシアン先行値を用いたディスカウントトンプソンサンプリング(DS-TS)を提案する。
我々のアルゴリズムは、トンプソンサンプリングに割引係数を組み込むことにより、変化に順応的に適応する。
論文 参考訳(メタデータ) (2023-05-18T05:29:52Z) - Batch-Size Independent Regret Bounds for Combinatorial Semi-Bandits with Probabilistically Triggered Arms or Independent Arms [59.8188496313214]
半帯域 (CMAB) について検討し, 半帯域 (CMAB) におけるバッチサイズ (K$) の依存性の低減に着目した。
まず,確率的に引き起こされるアーム(CMAB-T)を用いたCMABの設定に対して,分散を考慮した信頼区間を持つBCUCB-Tアルゴリズムを提案する。
次に,独立アームを用いた非トリガ型CMABの設定に対して,TPVM条件の非トリガ型を利用したSESCBアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-08-31T13:09:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。