論文の概要: A Context Augmented Multi-Play Multi-Armed Bandit Algorithm for Fast Channel Allocation in Opportunistic Spectrum Access
- arxiv url: http://arxiv.org/abs/2605.25391v1
- Date: Mon, 25 May 2026 03:37:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:19.272871
- Title: A Context Augmented Multi-Play Multi-Armed Bandit Algorithm for Fast Channel Allocation in Opportunistic Spectrum Access
- Title(参考訳): 随伴スペクトルアクセスにおける高速チャネル割り当てのためのコンテキスト拡張マルチモード帯域幅アルゴリズム
- Authors: Ruiyu Li, Guangxia Li, Xiao Lu, Jichao Liu, Yan Jin,
- Abstract要約: 機会スペクトルアクセス (OSA) のシナリオにおいて, チャネル割り当てのための無作為なコンテキストマルチプレイ・マルチアーム・バンディット (MP-MAB) 問題について検討する。
本研究では,MP-MABにおける腕の報酬関数の摂動としてチャネルノイズをモデル化することにより,この影響を具現化する。
- 参考スコア(独自算出の注目度): 7.39140567810707
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study the restless contextual multi-play multi-armed bandit (MP-MAB) problem for channel allocation in the opportunity spectrum access (OSA) scenario. Most existing MP-MAB methods are impractical for real-world OSA systems as they assume many ideal conditions, incur a heavy computational cost, and most importantly, ignore the impact of channel noise which is directly related to the quality of service. In this study, we embody this impact by modeling channel noise as a perturbation of the arm's reward function in MP-MAB. As there is an implicit correlation between channel state information and channel noise, we take the former as a context for MP-MAB to present the perturbation caused by the latter. We investigate two types of correlation between the context and the perturbation -- linear and nonlinear, and derive two index policies, respectively. These policies learn the correlations through a linear model and a neural network, and use estimated noise value to adjust the upper confidence bound. Numerical experiments demonstrate that the proposed policies can achieve lower regret and select sub-optimal arms in a more reasonable way.
- Abstract(参考訳): 機会スペクトルアクセス (OSA) のシナリオにおいて, チャネル割り当てのための無作為なコンテキストマルチプレイ・マルチアーム・バンディット (MP-MAB) 問題について検討する。
既存のMP-MAB法は、多くの理想的な条件を前提として、多くの計算コストを発生させるため、現実のOSAシステムでは非現実的であり、また、サービス品質に直接関係するチャネルノイズの影響を無視する。
本研究では,MP-MABにおける腕の報酬関数の摂動としてチャネルノイズをモデル化することにより,この影響を具現化する。
チャネル状態情報とチャネルノイズの間には暗黙の相関関係があるため、前者はMP-MABの文脈として、後者が引き起こす摂動を示す。
文脈と摂動の2種類の相関関係(線形と非線形)を考察し,それぞれ2つの指標ポリシーを導出する。
これらのポリシーは線形モデルとニューラルネットワークを通して相関関係を学習し、推定ノイズ値を用いて上限信頼度を調節する。
数値実験により,提案した政策はより少ない後悔を達成し,より合理的な方法で準最適腕を選択できることが示されている。
関連論文リスト
- MealRec: Multi-granularity Sequential Modeling via Hierarchical Diffusion Models for Micro-Video Recommendation [9.268996272239034]
マイクロビデオレコメンデーションは、対話されたマイクロビデオのコラボレーティブおよびコンテキスト情報からユーザの好みをキャプチャすることを目的としている。
マイクロビデオレコメンデーション(MealRec)のための階層拡散モデルを用いた多重粒度連続モデリング手法を提案する。
論文 参考訳(メタデータ) (2026-03-02T14:39:18Z) - Wireless Federated Multi-Task LLM Fine-Tuning via Sparse-and-Orthogonal LoRA [61.12136997430116]
低ランク適応(LoRA)に基づく分散連合学習(DFL)により、マルチタスクデータセットを持つモバイルデバイスは、ローカルに更新されたパラメータを、無線接続を介して近隣デバイスのサブセットと交換することで、大きな言語モデル(LLM)を協調的に微調整することができる。
不均一データセットに微調整されたパラメータを直接集約すると、DFLライフサイクルの3つの主要な問題が発生する: (i) 微調整プロセス中に忘れる破滅的な知識、(ii) データの異種性に起因する更新方向の矛盾に起因する。
論文 参考訳(メタデータ) (2026-02-24T02:45:32Z) - Test-time Adaptive Hierarchical Co-enhanced Denoising Network for Reliable Multimodal Classification [55.56234913868664]
マルチモーダルデータを用いた信頼性学習のためのTAHCD(Test-time Adaptive Hierarchical Co-enhanced Denoising Network)を提案する。
提案手法は,最先端の信頼性の高いマルチモーダル学習手法と比較して,優れた分類性能,堅牢性,一般化を実現する。
論文 参考訳(メタデータ) (2026-01-12T03:14:12Z) - Modality-Specific Speech Enhancement and Noise-Adaptive Fusion for Acoustic and Body-Conduction Microphone Framework [0.0]
体導マイクロホン信号(BMS)は空中音をバイパスし、強い耐雑音性を提供する。
本稿では,BMSと音響マイクロホン信号(AMS)を組み合わせた新しいマルチモーダルフレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-24T12:45:34Z) - Backscatter Device-aided Integrated Sensing and Communication: A Pareto Optimization Framework [59.30060797118097]
統合センシング・通信(ISAC)システムは、密集した都市非視線シナリオにおいて大きな性能劣化に遭遇する可能性がある。
本稿では,自然環境に分散した受動的BDを利用した後方散乱近似(BD)支援ISACシステムを提案する。
論文 参考訳(メタデータ) (2025-07-12T17:11:06Z) - Plug-and-Play AMC: Context Is King in Training-Free, Open-Set Modulation with LLMs [22.990537822143907]
自動変調分類(AMC)は、効率的なスペクトル管理とロバストな無線通信において重要である。
本稿では,従来の信号処理技術と大規模言語モデルを統合する革新的なフレームワークを提案する。
この研究は、次世代無線ネットワークにおけるスケーラブルで解釈可能で汎用的な信号分類システムの基礎を築いた。
論文 参考訳(メタデータ) (2025-05-06T02:07:47Z) - DM-SBL: Channel Estimation under Structured Interference [6.94612534055972]
チャネル推定は通信システムの基本課題であり、効率的な復調に不可欠である。
この研究は、ホワイトガウスノイズ(AWGN)と構造化干渉が共存するより困難なシナリオに対処する。
これらのシナリオにおいて正確なチャネル推定を保証するために、遅延領域内のチャネルの間隔と干渉の複雑な構造を併用する。
論文 参考訳(メタデータ) (2024-12-07T08:26:00Z) - Disentangled Noisy Correspondence Learning [56.06801962154915]
クロスモーダル検索は、モダリティ間の潜在対応を理解する上で重要である。
DisNCLはノイズ対応学習における特徴分散のための新しい情報理論フレームワークである。
論文 参考訳(メタデータ) (2024-08-10T09:49:55Z) - Low-Latency Federated Learning over Wireless Channels with Differential
Privacy [142.5983499872664]
フェデレートラーニング(FL)では、モデルトレーニングはクライアントに分散し、ローカルモデルは中央サーバによって集約される。
本稿では,各クライアントの差分プライバシ(DP)要件だけでなく,全体としてのトレーニング性能に制約された無線チャネル上でのFLトレーニング遅延を最小限に抑えることを目的とする。
論文 参考訳(メタデータ) (2021-06-20T13:51:18Z) - BSN++: Complementary Boundary Regressor with Scale-Balanced Relation
Modeling for Temporal Action Proposal Generation [85.13713217986738]
我々は,時間的提案生成のための補完的境界回帰器と関係モデリングを利用する新しいフレームワークであるBSN++を提案する。
当然のことながら、提案されたBSN++は、時間的アクションローカライゼーションタスクに関するCVPR19 - ActivityNetのリーダーボードで1位にランクインした。
論文 参考訳(メタデータ) (2020-09-15T07:08:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。