論文の概要: Adversarial Attacks on Combinatorial Multi-Armed Bandits
- arxiv url: http://arxiv.org/abs/2310.05308v1
- Date: Sun, 8 Oct 2023 23:22:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-12 08:42:18.540054
- Title: Adversarial Attacks on Combinatorial Multi-Armed Bandits
- Title(参考訳): コンビニアル・マルチアーマード・バンドに対する敵対的攻撃
- Authors: Rishab Balasubramanian, Jiawei Li, Prasad Tadepalli, Huazheng Wang,
Qingyun Wu, Haoyu Zhao
- Abstract要約: 我々は、コンビニアル・マルチアーム・バンドイット(CMAB)に対する報酬中毒攻撃について研究する。
まず,CMABの攻撃性について十分かつ必要な条件を提示する。
次に、攻撃可能なCMABインスタンスに対する攻撃アルゴリズムを考案する。
- 参考スコア(独自算出の注目度): 36.17209929039619
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study reward poisoning attacks on Combinatorial Multi-armed Bandits
(CMAB). We first provide a sufficient and necessary condition for the
attackability of CMAB, which depends on the intrinsic properties of the
corresponding CMAB instance such as the reward distributions of super arms and
outcome distributions of base arms. Additionally, we devise an attack algorithm
for attackable CMAB instances. Contrary to prior understanding of multi-armed
bandits, our work reveals a surprising fact that the attackability of a
specific CMAB instance also depends on whether the bandit instance is known or
unknown to the adversary. This finding indicates that adversarial attacks on
CMAB are difficult in practice and a general attack strategy for any CMAB
instance does not exist since the environment is mostly unknown to the
adversary. We validate our theoretical findings via extensive experiments on
real-world CMAB applications including probabilistic maximum covering problem,
online minimum spanning tree, cascading bandits for online ranking, and online
shortest path.
- Abstract(参考訳): 我々は,コンビニアル・マルチアームバンド(CMAB)に対する報酬中毒攻撃について検討した。
まず,CMABの攻撃性について,スーパーアームの報酬分布やベースアームの成果分布など,対応するCMABインスタンスの本質的な特性に依存する十分な条件を提供する。
さらに,攻撃可能なCMABインスタンスに対する攻撃アルゴリズムを考案した。
マルチ武器の盗賊に対する事前の理解とは対照的に,我々の研究は,特定のCMABインスタンスの攻撃性が,盗賊インスタンスが敵に未知であるかによっても影響していることを明らかにする。
この結果から, CMAB に対する敵攻撃は実際は困難であり, CMAB インスタンスに対する一般的な攻撃戦略は存在しないことが明らかとなった。
我々は,確率的最大被覆問題,オンライン最小スパンニング木,オンラインランキング用カスケード帯状地,オンライン最短経路など,実世界のCMABアプリケーションに関する広範な実験を通じて理論的知見を検証する。
関連論文リスト
- BadCM: Invisible Backdoor Attack Against Cross-Modal Learning [110.37205323355695]
クロスモーダルバックドアにおけるパズルの欠片を補うために,新たな両面バックドアを導入する。
BadCMは、1つの統合されたフレームワーク内で多様なクロスモーダルアタックのために意図的に設計された最初の目に見えないバックドアメソッドである。
論文 参考訳(メタデータ) (2024-10-03T03:51:53Z) - Combinatorial Multivariant Multi-Armed Bandits with Applications to Episodic Reinforcement Learning and Beyond [58.39457881271146]
CMAB(Multi-armed bandits)の多変量および確率的トリガーアーム(CMAB-MT)を用いた新しい枠組みを導入する。
CMAB-MTは既存のCMABと比べ、モデリング能力を高めるだけでなく、多変量確率変数の異なる統計特性を活用することで結果を改善することができる。
本フレームワークは, エピソード強化学習(RL)や商品分布の確率的最大カバレッジなど, 応用として多くの重要な問題を含むことができる。
論文 参考訳(メタデータ) (2024-06-03T14:48:53Z) - Stealthy Adversarial Attacks on Stochastic Multi-Armed Bandits [46.6541562214783]
マルチアーマド・バンディット(MAB)アルゴリズムに対する敵対的攻撃は文献で広く研究されている。
本研究は, 報酬中毒に対する攻撃に焦点を当て, 提案した検出方法により, 既存の攻撃のほとんどが容易に検出できることを示す。
このことは、MABに対するステルスシー攻撃の概念を研究し、その結果の攻撃可能性について調査する動機となっている。
論文 参考訳(メタデータ) (2024-02-21T02:54:00Z) - Understanding the Vulnerability of Skeleton-based Human Activity Recognition via Black-box Attack [53.032801921915436]
HAR(Human Activity Recognition)は、自動運転車など、幅広い用途に採用されている。
近年,敵対的攻撃に対する脆弱性から,骨格型HAR法の堅牢性に疑問が呈されている。
攻撃者がモデルの入出力しかアクセスできない場合でも、そのような脅威が存在することを示す。
BASARと呼ばれる骨格をベースとしたHARにおいて,最初のブラックボックス攻撃手法を提案する。
論文 参考訳(メタデータ) (2022-11-21T09:51:28Z) - Robust Stochastic Linear Contextual Bandits Under Adversarial Attacks [81.13338949407205]
近年の研究では、最適なバンディットアルゴリズムは敵攻撃に対して脆弱であり、攻撃の有無で完全に失敗する可能性があることが示されている。
既存の堅牢なバンディットアルゴリズムは、報酬の攻撃下では、非コンテキスト設定でのみ機能する。
完全適応的かつ全能的な攻撃下での線形文脈帯域設定のための最初の頑健な帯域幅アルゴリズムを提供する。
論文 参考訳(メタデータ) (2021-06-05T22:20:34Z) - Sequential Monte Carlo Bandits [1.9205272414658485]
我々は、連続モンテカルロ法(SMC)を用いることで、ベイジアン多重武装バンディット(MAB)アルゴリズムを元の設定を超えて拡張する。
MABは、長期的な支払いを最大化するポリシーを学ぶことを目標とするシーケンシャルな意思決定問題である。
本稿では,線形力学系を用いて時間力学をモデル化した非定常帯域について述べる。
論文 参考訳(メタデータ) (2018-08-08T20:40:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。