論文の概要: Adversarial Attacks on Combinatorial Multi-Armed Bandits
- arxiv url: http://arxiv.org/abs/2310.05308v1
- Date: Sun, 8 Oct 2023 23:22:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-12 08:42:18.540054
- Title: Adversarial Attacks on Combinatorial Multi-Armed Bandits
- Title(参考訳): コンビニアル・マルチアーマード・バンドに対する敵対的攻撃
- Authors: Rishab Balasubramanian, Jiawei Li, Prasad Tadepalli, Huazheng Wang,
Qingyun Wu, Haoyu Zhao
- Abstract要約: 我々は、コンビニアル・マルチアーム・バンドイット(CMAB)に対する報酬中毒攻撃について研究する。
まず,CMABの攻撃性について十分かつ必要な条件を提示する。
次に、攻撃可能なCMABインスタンスに対する攻撃アルゴリズムを考案する。
- 参考スコア(独自算出の注目度): 36.17209929039619
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study reward poisoning attacks on Combinatorial Multi-armed Bandits
(CMAB). We first provide a sufficient and necessary condition for the
attackability of CMAB, which depends on the intrinsic properties of the
corresponding CMAB instance such as the reward distributions of super arms and
outcome distributions of base arms. Additionally, we devise an attack algorithm
for attackable CMAB instances. Contrary to prior understanding of multi-armed
bandits, our work reveals a surprising fact that the attackability of a
specific CMAB instance also depends on whether the bandit instance is known or
unknown to the adversary. This finding indicates that adversarial attacks on
CMAB are difficult in practice and a general attack strategy for any CMAB
instance does not exist since the environment is mostly unknown to the
adversary. We validate our theoretical findings via extensive experiments on
real-world CMAB applications including probabilistic maximum covering problem,
online minimum spanning tree, cascading bandits for online ranking, and online
shortest path.
- Abstract(参考訳): 我々は,コンビニアル・マルチアームバンド(CMAB)に対する報酬中毒攻撃について検討した。
まず,CMABの攻撃性について,スーパーアームの報酬分布やベースアームの成果分布など,対応するCMABインスタンスの本質的な特性に依存する十分な条件を提供する。
さらに,攻撃可能なCMABインスタンスに対する攻撃アルゴリズムを考案した。
マルチ武器の盗賊に対する事前の理解とは対照的に,我々の研究は,特定のCMABインスタンスの攻撃性が,盗賊インスタンスが敵に未知であるかによっても影響していることを明らかにする。
この結果から, CMAB に対する敵攻撃は実際は困難であり, CMAB インスタンスに対する一般的な攻撃戦略は存在しないことが明らかとなった。
我々は,確率的最大被覆問題,オンライン最小スパンニング木,オンラインランキング用カスケード帯状地,オンライン最短経路など,実世界のCMABアプリケーションに関する広範な実験を通じて理論的知見を検証する。
関連論文リスト
- Causally Abstracted Multi-armed Bandits [7.741729770041214]
マルチアームバンディット (MAB) と因果MAB (CMAB) は意思決定問題の枠組みとして確立されている。
転送学習を、潜在的に異なる変数で定義されたCMABを含む設定に拡張する。
本稿では,CAMABで学習するアルゴリズムを提案し,その後悔について検討する。
論文 参考訳(メタデータ) (2024-04-26T15:48:09Z) - Stealthy Adversarial Attacks on Stochastic Multi-Armed Bandits [46.6541562214783]
マルチアーマド・バンディット(MAB)アルゴリズムに対する敵対的攻撃は文献で広く研究されている。
本研究は, 報酬中毒に対する攻撃に焦点を当て, 提案した検出方法により, 既存の攻撃のほとんどが容易に検出できることを示す。
このことは、MABに対するステルスシー攻撃の概念を研究し、その結果の攻撃可能性について調査する動機となっている。
論文 参考訳(メタデータ) (2024-02-21T02:54:00Z) - Bandit Social Learning: Exploration under Myopic Behavior [58.75758600464338]
オンラインプラットフォーム上でのレビューによって動機付けられた社会学習のダイナミクスについて検討する。
エージェントはまとめて単純なマルチアームのバンディットプロトコルに従うが、各エージェントは探索を伴わずにミオプティカルに振る舞う。
このような振る舞いに対して,スターク学習の失敗を導出し,好意的な結果を提供する。
論文 参考訳(メタデータ) (2023-02-15T01:57:57Z) - Understanding the Vulnerability of Skeleton-based Human Activity Recognition via Black-box Attack [53.032801921915436]
HAR(Human Activity Recognition)は、自動運転車など、幅広い用途に採用されている。
近年,敵対的攻撃に対する脆弱性から,骨格型HAR法の堅牢性に疑問が呈されている。
攻撃者がモデルの入出力しかアクセスできない場合でも、そのような脅威が存在することを示す。
BASARと呼ばれる骨格をベースとしたHARにおいて,最初のブラックボックス攻撃手法を提案する。
論文 参考訳(メタデータ) (2022-11-21T09:51:28Z) - Efficient Action Poisoning Attacks on Linear Contextual Bandits [41.1063033715314]
我々は新たな種類の攻撃を提案している。
相手は、エージェントが選択したアクション信号を変更することができる。
ホワイトボックスとブラックボックスの設定の両方において、提案した攻撃スキームはLinUCBエージェントにターゲットアームを非常に頻繁に引くように強制することができることを示す。
論文 参考訳(メタデータ) (2021-12-10T07:39:07Z) - Robust Stochastic Linear Contextual Bandits Under Adversarial Attacks [81.13338949407205]
近年の研究では、最適なバンディットアルゴリズムは敵攻撃に対して脆弱であり、攻撃の有無で完全に失敗する可能性があることが示されている。
既存の堅牢なバンディットアルゴリズムは、報酬の攻撃下では、非コンテキスト設定でのみ機能する。
完全適応的かつ全能的な攻撃下での線形文脈帯域設定のための最初の頑健な帯域幅アルゴリズムを提供する。
論文 参考訳(メタデータ) (2021-06-05T22:20:34Z) - Adversarial Attacks on Linear Contextual Bandits [87.08004581867537]
悪意のあるエージェントは、望ましい行動を実行するためにバンディットアルゴリズムを攻撃するインセンティブを持つ可能性がある。
悪意のあるエージェントは、線形コンテキストのバンドイットアルゴリズムに任意のアーム$T - o(T)$倍を$T$ステップで引き出すように強制することができる。
また,悪意のあるエージェントが単一コンテキストにおける帯域幅アルゴリズムの動作に影響を与えることに関心がある場合についても検討する。
論文 参考訳(メタデータ) (2020-02-10T15:04:09Z) - Sequential Monte Carlo Bandits [1.9205272414658485]
我々は、連続モンテカルロ法(SMC)を用いることで、ベイジアン多重武装バンディット(MAB)アルゴリズムを元の設定を超えて拡張する。
MABは、長期的な支払いを最大化するポリシーを学ぶことを目標とするシーケンシャルな意思決定問題である。
本稿では,線形力学系を用いて時間力学をモデル化した非定常帯域について述べる。
論文 参考訳(メタデータ) (2018-08-08T20:40:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。