論文の概要: Linear Jamming Bandits: Sample-Efficient Learning for Non-Coherent
Digital Jamming
- arxiv url: http://arxiv.org/abs/2207.02365v1
- Date: Tue, 5 Jul 2022 23:51:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-08 03:14:40.023155
- Title: Linear Jamming Bandits: Sample-Efficient Learning for Non-Coherent
Digital Jamming
- Title(参考訳): リニアジャミングバンド:非コヒーレントデジタルジャミングのためのサンプル効率学習
- Authors: Charles E. Thornton and R. Michael Buehrer
- Abstract要約: 学習アルゴリズムは、被害者の送信戦略の事前知識を必要とせずに、デジタル変調スキームに対してジャミングするための最適な物理層パラメータを効果的に選択することができる。
被害者の送信に関する事前知識が,学習フレームワークにシームレスに統合可能であることを示す。
- 参考スコア(独自算出の注目度): 10.772161254015389
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: It has been shown (Amuru et al. 2015) that online learning algorithms can be
effectively used to select optimal physical layer parameters for jamming
against digital modulation schemes without a priori knowledge of the victim's
transmission strategy. However, this learning problem involves solving a
multi-armed bandit problem with a mixed action space that can grow very large.
As a result, convergence to the optimal jamming strategy can be slow,
especially when the victim and jammer's symbols are not perfectly synchronized.
In this work, we remedy the sample efficiency issues by introducing a linear
bandit algorithm that accounts for inherent similarities between actions.
Further, we propose context features which are well-suited for the statistical
features of the non-coherent jamming problem and demonstrate significantly
improved convergence behavior compared to the prior art. Additionally, we show
how prior knowledge about the victim's transmissions can be seamlessly
integrated into the learning framework. We finally discuss limitations in the
asymptotic regime.
- Abstract(参考訳): オンライン学習アルゴリズムは,被害者の送信戦略を事前に知ることなく,デジタル変調スキームを妨害するための最適な物理層パラメータを効果的に選択できることが示されている(Amuruら)。
しかし、この学習問題は、非常に大きく成長できる混合作用空間で、多武装のバンディット問題を解決することを伴う。
その結果、特に被害者とジャマーのシンボルが完全に同期していない場合、最適なジャミング戦略への収束が遅くなる。
本研究では,アクション間の固有類似性を考慮した線形バンディットアルゴリズムを導入することで,サンプル効率問題を改善する。
さらに,非コヒーレントジャミング問題の統計的特徴に適する文脈特徴を提案し,先行技術と比較して収束挙動が著しく改善されたことを示す。
さらに,被害者の送信に関する事前知識が,学習フレームワークにシームレスに統合可能であることを示す。
我々は最終的に漸近体制の限界について議論する。
関連論文リスト
- Provable Optimization for Adversarial Fair Self-supervised Contrastive Learning [49.417414031031264]
本稿では,自己教師型学習環境におけるフェアエンコーダの学習について検討する。
すべてのデータはラベル付けされておらず、そのごく一部だけが機密属性で注釈付けされている。
論文 参考訳(メタデータ) (2024-06-09T08:11:12Z) - Learning Interpretable Deep Disentangled Neural Networks for
Hyperspectral Unmixing [16.02193274044797]
非線形性および終端変動を考慮した高スペクトルアンミックスのための新しい解釈可能な深層学習法を提案する。
モデルは、バックプロパゲーションを使用してエンドツーエンドに学習され、セルフ教師付き戦略を使用してトレーニングされる。
合成および実データを用いた実験結果から,提案手法の性能が示唆された。
論文 参考訳(メタデータ) (2023-10-03T18:21:37Z) - Provably Efficient Learning in Partially Observable Contextual Bandit [4.910658441596583]
古典的帯域幅アルゴリズムの改善に因果境界をどのように適用できるかを示す。
本研究は,実世界の応用における文脈的包括的エージェントの性能を高める可能性を秘めている。
論文 参考訳(メタデータ) (2023-08-07T13:24:50Z) - Learning to Optimize with Stochastic Dominance Constraints [103.26714928625582]
本稿では,不確実量を比較する問題に対して,単純かつ効率的なアプローチを開発する。
我々はラグランジアンの内部最適化をサロゲート近似の学習問題として再考した。
提案したライト-SDは、ファイナンスからサプライチェーン管理に至るまで、いくつかの代表的な問題において優れた性能を示す。
論文 参考訳(メタデータ) (2022-11-14T21:54:31Z) - Smoothed Online Learning is as Easy as Statistical Learning [77.00766067963195]
この設定では、最初のオラクル効率、非回帰アルゴリズムを提供する。
古典的な設定で関数クラスが学習可能な場合、文脈的包帯に対するオラクル効率のよい非回帰アルゴリズムが存在することを示す。
論文 参考訳(メタデータ) (2022-02-09T19:22:34Z) - Experimental Design for Regret Minimization in Linear Bandits [19.8309784360219]
オンライン・リニア・バンドレットにおける後悔を最小限に抑える設計に基づく新しいアルゴリズムを提案する。
我々は、現在最先端の有限時間後悔保証を提供し、このアルゴリズムが帯域幅と半帯域幅の両方のフィードバックシステムに適用可能であることを示す。
論文 参考訳(メタデータ) (2020-11-01T17:59:19Z) - A Hamiltonian Monte Carlo Method for Probabilistic Adversarial Attack
and Learning [122.49765136434353]
本稿では,HMCAM (Acumulated Momentum) を用いたハミルトニアンモンテカルロ法を提案する。
また, 対数的対数的対数的学習(Contrastive Adversarial Training, CAT)と呼ばれる新たな生成法を提案し, 対数的例の平衡分布にアプローチする。
いくつかの自然画像データセットと実用システムに関する定量的および定性的な解析により、提案アルゴリズムの優位性が確認された。
論文 参考訳(メタデータ) (2020-10-15T16:07:26Z) - Differentiable Causal Discovery from Interventional Data [141.41931444927184]
本稿では、介入データを活用可能なニューラルネットワークに基づく理論的基盤化手法を提案する。
提案手法は,様々な環境下での美術品の状態と良好に比較できることを示す。
論文 参考訳(メタデータ) (2020-07-03T15:19:17Z) - The Simulator: Understanding Adaptive Sampling in the
Moderate-Confidence Regime [52.38455827779212]
エミュレータと呼ばれる適応サンプリングを解析するための新しい手法を提案する。
適切なログファクタを組み込んだトップk問題の最初のインスタンスベースの下位境界を証明します。
我々の新しい分析は、後者の問題に対するこの種の最初のエミュレータであるベストアームとトップkの識別に、シンプルでほぼ最適であることを示した。
論文 参考訳(メタデータ) (2017-02-16T23:42:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。