論文の概要: When Are Linear Stochastic Bandits Attackable?
- arxiv url: http://arxiv.org/abs/2110.09008v1
- Date: Mon, 18 Oct 2021 04:12:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-19 20:56:31.203806
- Title: When Are Linear Stochastic Bandits Attackable?
- Title(参考訳): 線形確率帯域はいつ攻撃可能か?
- Authors: Huazheng Wang, Haifeng Xu, Hongning Wang
- Abstract要約: 本稿では,$k$のリニアバンディット環境の攻撃性について検討する。
本稿では,LinUCBとロバスト位相除去に対する2段階攻撃法を提案する。
- 参考スコア(独自算出の注目度): 47.25702824488642
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study adversarial attacks on linear stochastic bandits, a sequential
decision making problem with many important applications in recommender
systems, online advertising, medical treatment, and etc. By manipulating the
rewards, an adversary aims to control the behaviour of the bandit algorithm.
Perhaps surprisingly, we first show that some attack goals can never be
achieved. This is in sharp contrast to context-free stochastic bandits, and is
intrinsically due to the correlation among arms in linear stochastic bandits.
Motivated by this observation, this paper studies the attackability of a
$k$-armed linear bandit environment. We first provide a full necessity and
sufficiency characterization of attackability based on the geometry of the
context vectors. We then propose a two-stage attack method against LinUCB and
Robust Phase Elimination. The method first asserts whether the current
environment is attackable, and if Yes, modifies the rewards to force the
algorithm to pull a target arm linear times using only a sublinear cost.
Numerical experiments further validate the effectiveness and cost-efficiency of
the proposed method.
- Abstract(参考訳): 我々は,線形確率的包帯に対する敵対的攻撃,レコメンデータシステム,オンライン広告,医療治療などにおいて,多くの重要な応用において逐次決定問題について検討する。
報酬を操作することで、敵はバンディットアルゴリズムの動作を制御することを目指す。
おそらく、まず最初に、いくつかの攻撃目標が達成できないことを示す。
これは文脈自由確率バンディットとは対照的であり、本質的には線形確率バンディットの腕間の相関によるものである。
本研究は,この観察に動機づけられ,$k$の線形バンディット環境の攻撃性について検討した。
まず,コンテキストベクトルの幾何学に基づく攻撃可能性の完全必要性と十分性について述べる。
次に,LinUCBとロバスト相除去に対する2段階攻撃法を提案する。
この方法はまず、現在の環境が攻撃可能かどうかを断定し、もしそうなら、アルゴリズムがサブ線形コストのみを使用して目標のアームを線形に引くように報酬を変更する。
数値実験により,提案手法の有効性とコスト効率がさらに検証された。
関連論文リスト
- Robust Lipschitz Bandits to Adversarial Corruptions [61.85150061213987]
リプシッツ・バンディット(英: Lipschitz bandit)は、計量空間上で定義された連続アーム集合を扱うバンディットの変種である。
本稿では,敵対的腐敗の存在下でのリプシッツ・バンディットの新たな問題を紹介する。
我々の研究は、両タイプの敵の下でサブ線形後悔を達成できるロバストなリプシッツ・バンディットアルゴリズムの最初のラインを提示する。
論文 参考訳(メタデータ) (2023-05-29T18:16:59Z) - Adversarial Attacks on Adversarial Bandits [10.891819703383408]
攻撃者は,任意の非相対的帯域幅アルゴリズムをミスリードして,準最適目標アームを選択することができることを示す。
この結果は、現実世界の盗賊ベースのシステムにおける重要なセキュリティ上の懸念を意味する。
論文 参考訳(メタデータ) (2023-01-30T00:51:39Z) - Zero-Query Transfer Attacks on Context-Aware Object Detectors [95.18656036716972]
敵は、ディープニューラルネットワークが誤った分類結果を生成するような摂動画像を攻撃する。
自然の多目的シーンに対する敵対的攻撃を防御するための有望なアプローチは、文脈整合性チェックを課すことである。
本稿では,コンテキスト整合性チェックを回避可能な,コンテキスト整合性攻撃を生成するための最初のアプローチを提案する。
論文 参考訳(メタデータ) (2022-03-29T04:33:06Z) - Efficient Action Poisoning Attacks on Linear Contextual Bandits [41.1063033715314]
我々は新たな種類の攻撃を提案している。
相手は、エージェントが選択したアクション信号を変更することができる。
ホワイトボックスとブラックボックスの設定の両方において、提案した攻撃スキームはLinUCBエージェントにターゲットアームを非常に頻繁に引くように強制することができることを示す。
論文 参考訳(メタデータ) (2021-12-10T07:39:07Z) - Robust Stochastic Linear Contextual Bandits Under Adversarial Attacks [81.13338949407205]
近年の研究では、最適なバンディットアルゴリズムは敵攻撃に対して脆弱であり、攻撃の有無で完全に失敗する可能性があることが示されている。
既存の堅牢なバンディットアルゴリズムは、報酬の攻撃下では、非コンテキスト設定でのみ機能する。
完全適応的かつ全能的な攻撃下での線形文脈帯域設定のための最初の頑健な帯域幅アルゴリズムを提供する。
論文 参考訳(メタデータ) (2021-06-05T22:20:34Z) - Bias-Robust Bayesian Optimization via Dueling Bandit [57.82422045437126]
ベイジアン最適化は、観測が逆偏りとなるような環境において考慮する。
情報指向サンプリング(IDS)に基づくダリングバンディットの新しい手法を提案する。
これにより、累積的後悔保証を伴う帯域幅の並列化のための、最初の効率的なカーネル化アルゴリズムが得られる。
論文 参考訳(メタデータ) (2021-05-25T10:08:41Z) - Online Adversarial Attacks [57.448101834579624]
我々は、実世界のユースケースで見られる2つの重要な要素を強調し、オンライン敵攻撃問題を定式化する。
まず、オンライン脅威モデルの決定論的変種を厳格に分析する。
このアルゴリズムは、現在の最良の単一しきい値アルゴリズムよりも、$k=2$の競争率を確実に向上させる。
論文 参考訳(メタデータ) (2021-03-02T20:36:04Z) - Action-Manipulation Attacks Against Stochastic Bandits: Attacks and
Defense [45.408568528354216]
我々はアクション・マニピュレーション・アタックと呼ばれる新しいタイプの攻撃を導入する。
この攻撃では、相手が選択したアクション信号を変更することができる。
このような攻撃に対して防御するために,アクション操作攻撃に対して堅牢な新しいアルゴリズムを導入する。
論文 参考訳(メタデータ) (2020-02-19T04:09:15Z) - Robust Stochastic Bandit Algorithms under Probabilistic Unbounded
Adversarial Attack [41.060507338755784]
本稿では,各ラウンドで敵が一定の確率で攻撃する攻撃モデルについて検討する。
そこで我々は, 中央値および探索支援UPBアルゴリズム(med-E-UCB)と中央値の$epsilon$-greedyアルゴリズム(med-$epsilon$-greedy)を提案する。
どちらのアルゴリズムも上記の攻撃モデルに対して確実に堅牢である。より具体的には、どちらのアルゴリズムも$mathcalO(log T)$ pseudo-regret (i.e.)を達成することを示す。
論文 参考訳(メタデータ) (2020-02-17T19:21:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。