論文の概要: Challenger-Based Combinatorial Bandits for Subcarrier Selection in OFDM Systems
- arxiv url: http://arxiv.org/abs/2510.04559v1
- Date: Mon, 06 Oct 2025 07:48:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-07 16:52:59.735993
- Title: Challenger-Based Combinatorial Bandits for Subcarrier Selection in OFDM Systems
- Title(参考訳): OFDMシステムにおけるサブキャリア選択のためのチャレンジャーベース組合せ帯域
- Authors: Mohsen Amiri, V Venktesh, Sindri Magnússon,
- Abstract要約: 本稿では,マルチユーザダウンリンクにおけるトップmユーザスケジューリングセットの同定について検討する。
作用空間は指数関数的に増大するので、徹底的な探索は不可能である。
チャンピオンアームの現在の推定値のショートリストを維持するためのギャップインデックスフレームワークを導入する。
- 参考スコア(独自算出の注目度): 3.4155322317700585
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper investigates the identification of the top-m user-scheduling sets in multi-user MIMO downlink, which is cast as a combinatorial pure-exploration problem in stochastic linear bandits. Because the action space grows exponentially, exhaustive search is infeasible. We therefore adopt a linear utility model to enable efficient exploration and reliable selection of promising user subsets. We introduce a gap-index framework that maintains a shortlist of current estimates of champion arms (top-m sets) and a rotating shortlist of challenger arms that pose the greatest threat to the champions. This design focuses on measurements that yield the most informative gap-index-based comparisons, resulting in significant reductions in runtime and computation compared to state-of-the-art linear bandit methods, with high identification accuracy. The method also exposes a tunable trade-off between speed and accuracy. Simulations on a realistic OFDM downlink show that shortlist-driven pure exploration makes online, measurement-efficient subcarrier selection practical for AI-enabled communication systems.
- Abstract(参考訳): 本稿では,マルチユーザMIMOダウンリンクにおけるトップmユーザスケジューリングセットの同定について検討する。
作用空間は指数関数的に増大するので、徹底的な探索は不可能である。
そこで我々は,有望なユーザサブセットの効率的な探索と信頼性の選択を可能にするために,線形ユーティリティモデルを採用する。
チャンピオンアーム(トップmセット)の現在の見積のショートリストを維持するギャップインデックスフレームワークと、チャンピオンにとって最大の脅威となるチャレンジャーアームの回転ショートリストを導入する。
この設計は、最も有意義なギャップ-インデックスベースの比較結果に焦点が当てられ、その結果、最先端の線形バンドイット法と比較して、実行時間と計算量が大幅に削減され、高い識別精度がもたらされる。
この方法は、速度と精度の間の調整可能なトレードオフを露呈する。
リアルなOFDMダウンリンクのシミュレーションは、ショートリスト駆動の純粋な探索によって、AI対応通信システムにおいて、オンライン、測定効率の低いサブキャリア選択が実用的であることを示している。
関連論文リスト
- Fair Algorithms with Probing for Multi-Agent Multi-Armed Bandits [15.700062892888084]
我々は、割り当て前に選択した武器に関する情報を戦略的に収集する新しい探索フレームワークを導入する。
報奨分布が知られているオフライン環境では、準モジュラ特性を利用して、証明可能な性能境界を持つ欲求探索アルゴリズムを設計する。
より複雑なオンライン設定では、公平性を維持しながらサブ線形後悔を実現するアルゴリズムを開発する。
論文 参考訳(メタデータ) (2025-06-17T21:43:21Z) - Semi-Parametric Batched Global Multi-Armed Bandits with Covariates [0.48342038441006807]
マルチアームバンディット(MAB)フレームワークは、シーケンシャルな意思決定に広く使われているアプローチである。
本稿では,コパラメトリックと腕間の共有パラメータを持つバッチバンドの半パラメトリックフレームワークを提案する。
Batched Single-Index Dynamic binning and Successive arm elimination (BIDS) というアルゴリズムでは、バッチ化された逐次アームの除去戦略を採用している。
論文 参考訳(メタデータ) (2025-03-01T17:23:55Z) - SIGMA: Selective Gated Mamba for Sequential Recommendation [56.85338055215429]
最近の進歩であるMambaは、時系列予測において例外的なパフォーマンスを示した。
SIGMA(Selective Gated Mamba)と呼ばれる,シークエンシャルレコメンデーションのための新しいフレームワークを紹介する。
以上の結果から,SIGMAは5つの実世界のデータセットにおいて,現在のモデルよりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2024-08-21T09:12:59Z) - Meta-Learning Adversarial Bandit Algorithms [55.72892209124227]
我々は,バンディットフィードバックを用いたオンラインメタラーニングについて研究する。
我々は自己協和障壁正規化器を用いてオンラインミラー降下一般化(OMD)をチューニングすることを学ぶ。
論文 参考訳(メタデータ) (2023-07-05T13:52:10Z) - Advertising Media and Target Audience Optimization via High-dimensional
Bandits [2.5137859989323537]
我々は、広告主がオンラインパブリッシャーのデジタル広告管理を自動化するために利用できるデータ駆動アルゴリズムを提案する。
このアルゴリズムにより、広告主は利用可能なターゲットオーディエンスと広告メディアをまたいで検索し、オンライン実験を通じてキャンペーンの最良の組み合わせを見つけることができる。
論文 参考訳(メタデータ) (2022-09-17T21:00:53Z) - Semi-Supervised Temporal Action Detection with Proposal-Free Masking [134.26292288193298]
PropOsal-free Temporal mask (SPOT) に基づく新しい半教師付き時間行動検出モデルを提案する。
SPOTは最先端の代替品よりも優れている。
論文 参考訳(メタデータ) (2022-07-14T16:58:47Z) - Meta-Learning Adversarial Bandits [49.094361442409785]
本研究の目的は,複数のタスクにまたがる帯域幅フィードバックを用いてオンライン学習を学習し,タスク間の平均性能を改善することである。
敵対的設定を最初に対象とするメタアルゴリズムとして,マルチアーム・バンディット(MAB)とバンディット・最適化(BLO)の2つの重要なケースに対して,特定の保証を設定するメタアルゴリズムを設計する。
我々の保証は、非正規化されたフォローザリーダーと乗法重みを組み合わせることで、オンラインで非滑らかで非Bシーケンスを学ぶのに十分であることを示すことに依存しています。
論文 参考訳(メタデータ) (2022-05-27T17:40:32Z) - Coded Stochastic ADMM for Decentralized Consensus Optimization with Edge
Computing [113.52575069030192]
セキュリティ要件の高いアプリケーションを含むビッグデータは、モバイルデバイスやドローン、車両など、複数の異種デバイスに収集され、格納されることが多い。
通信コストとセキュリティ要件の制限のため、核融合センターにデータを集約するのではなく、分散的に情報を抽出することが最重要となる。
分散エッジノードを介してデータを局所的に処理するマルチエージェントシステムにおいて,モデルパラメータを学習する問題を考える。
分散学習モデルを開発するために,乗算器アルゴリズムの最小バッチ交互方向法(ADMM)のクラスについて検討した。
論文 参考訳(メタデータ) (2020-10-02T10:41:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。