Fugu-MT 論文翻訳(概要): Multi-User mmWave Beam and Rate Adaptation via Combinatorial Satisficing Bandits

論文の概要: Multi-User mmWave Beam and Rate Adaptation via Combinatorial Satisficing Bandits

arxiv url: http://arxiv.org/abs/2604.14908v1
Date: Thu, 16 Apr 2026 11:49:51 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-17 21:29:31.87726
Title: Multi-User mmWave Beam and Rate Adaptation via Combinatorial Satisficing Bandits
Title（参考訳）: 組合せ充足帯域によるマルチユーザmmWaveビームとレート適応
Authors: Emre Özyıldırım, Barış Yaycı, Umut Eren Akturk, Cem Tekin,
Abstract要約: 複数の基地局(BSs)が複数の単一アンテナ用ユーザ機器(UEs)に、UE毎に一意なビームと離散データ伝送速度で接続するマルチユーザmmWave MISOシステムにおいて、ダウンリンクビームとレート適応について検討する。サービス目標を符号化するために、整合スループットしきい値$_r$を導入し、ビームレート境界を超える半帯域として、鋳造継手ビームとレート適応を導入する。 SAT-CTSは,ユーザ間の平均スループットと公平性を良好に達成しつつ,常に後悔を減らし,競争標準の後悔を維持していることを示す。
参考スコア（独自算出の注目度）: 5.873949143662286
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We study downlink beam and rate adaptation in a multi-user mmWave MISO system where multiple base stations (BSs), each using analog beamforming from finite codebooks, serve multiple single-antenna user equipments (UEs) with a unique beam per UE and discrete data transmission rates. BSs learn about transmission success based on ACK/NACK feedback. To encode service goals, we introduce a satisficing throughput threshold $τ_r$ and cast joint beam and rate adaptation as a combinatorial semi-bandit over beam-rate tuples. Within this framework, we propose SAT-CTS, a lightweight, threshold-aware policy that blends conservative confidence estimates with posterior sampling, steering learning toward meeting $τ_r$ rather than merely maximizing. Our main theoretical contribution provides the first finite-time regret bounds for combinatorial semi-bandits with satisficing objective: when $τ_r$ is realizable, we upper bound the cumulative satisficing regret to the target with a time-independent constant, and when $τ_r$ is non-realizable, we show that SAT-CTS incurs only a finite expected transient outside committed CTS rounds, after which its regret is governed by the sum of the regret contributions of restarted CTS rounds, yielding an $O((\log T)^2)$ standard regret bound. On the practical side, we evaluate the performance via cumulative satisficing regret to $τ_r$ alongside standard regret and fairness. Experiments with time-varying sparse multipath channels show that SAT-CTS consistently reduces satisficing regret and maintains competitive standard regret, while achieving favorable average throughput and fairness across users, indicating that feedback-efficient learning can equitably allocate beams and rates to meet QoS targets without channel state knowledge.
Abstract（参考訳）: 複数基地局 (BSs) を有限符号帳からアナログビームフォーミングし, UE毎に一意なビームと離散データ伝送率を持つ単一アンテナユーザ機器 (UEs) を複数提供するマルチユーザmmWave MISOシステムにおいて, ダウンリンクビームとレート適応について検討した。 BSはACK/NACKフィードバックに基づいて送信の成功について学ぶ。サービス目標を符号化するために,ビームレートタプル上での整合性スループットしきい値τ_r$と鋳造継手ビームと周波数適応を組合せ半帯域として導入する。このフレームワーク内ではSAT-CTSが提案される。SAT-CTSは、保守的信頼度推定と後続サンプリングをブレンドし、単に最大化するのではなく、$τ_r$の達成に向けた学習を操る軽量なしきい値認識ポリシーである。我々の主要な理論的貢献は、組合せ半バンドに対する最初の有限時間後悔境界を満足する目的を持つ: $τ_r$ が実現可能なとき、累積満足の後悔境界を時間非依存定数で上界し、$τ_r$ が非実現可能であるとき、SAT-CTS は CTS ラウンドの有限の過渡的外部にしか生じないことを示し、その後、その後悔は再帰された CTS ラウンドの後悔の寄与の和によって支配され、$O(\log T)^2) が標準後悔境界となる。実用面では、標準的な後悔と公正さとともに、後悔の累積満足度を$τ_r$とすることで、性能を評価する。時間変化したスパースマルチパスチャネルを用いた実験では、SAT-CTSは相反する後悔を一貫して減らし、競合する標準後悔を保ちながら、ユーザの平均スループットと公正性を良好に達成し、フィードバック効率の高い学習は、チャンネル状態の知識なしにQoSターゲットに等しくビームとレートを割り当てることができることを示す。

論文の概要: Multi-User mmWave Beam and Rate Adaptation via Combinatorial Satisficing Bandits

関連論文リスト