論文の概要: On No-Sensing Adversarial Multi-player Multi-armed Bandits with
Collision Communications
- arxiv url: http://arxiv.org/abs/2011.01090v2
- Date: Sat, 24 Apr 2021 18:36:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-30 11:29:21.276071
- Title: On No-Sensing Adversarial Multi-player Multi-armed Bandits with
Collision Communications
- Title(参考訳): 衝突通信を用いたノンセンシングマルチプレイヤーマルチアームバンディットについて
- Authors: Chengshuai Shi, Cong Shen
- Abstract要約: 我々は,MP-MAB問題について,新たな視点から検討した。
複数のプレイヤーの硬さに焦点を合わせるのではなく、攻撃性と呼ばれる新しい硬さの次元を導入する。
全ての敵は攻撃性に基づいて分類でき、プレイヤー間で強制協調通信を行うアルゴリズムのファミリーであるAdversary-Adaptive Collision-Communication (A2C2)を導入する。
- 参考スコア(独自算出の注目度): 24.379502555329363
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the notoriously difficult no-sensing adversarial multi-player
multi-armed bandits (MP-MAB) problem from a new perspective. Instead of
focusing on the hardness of multiple players, we introduce a new dimension of
hardness, called attackability. All adversaries can be categorized based on the
attackability and we introduce Adversary-Adaptive Collision-Communication
(A2C2), a family of algorithms with forced-collision communication among
players. Both attackability-aware and unaware settings are studied, and
information-theoretic tools of the Z-channel model and error-correction coding
are utilized to address the challenge of implicit communication without
collision information in an adversarial environment. For the more challenging
attackability-unaware problem, we propose a simple method to estimate the
attackability enabled by a novel error-detection repetition code and randomized
communication for synchronization. Theoretical analysis proves that asymptotic
attackability-dependent sublinear regret can be achieved, with or without
knowing the attackability. In particular, the asymptotic regret does not have
an exponential dependence on the number of players, revealing a fundamental
tradeoff between the two dimensions of hardness in this problem.
- Abstract(参考訳): 我々は,新しい視点から,難解な非感知型マルチプレイヤー・マルチアーム・バンディット(mp-mab)問題について検討した。
複数のプレイヤーの硬さに焦点を当てる代わりに、攻撃可能性と呼ばれる新しい硬さの次元を導入する。
全ての敵は攻撃性に基づいて分類でき、プレイヤー間で強制協調通信を行うアルゴリズムのファミリーであるAdversary-Adaptive Collision-Communication (A2C2)を導入する。
攻撃性認識と無意識設定の両方を研究し,zチャネルモデルの情報理論ツールと誤り訂正符号化を用いて,敵対環境における衝突情報のない暗黙的通信の課題に対処する。
そこで本研究では,新たな誤り検出繰り返し符号と同期のためのランダム化通信により,攻撃可能性を推定する簡単な手法を提案する。
理論的分析は、漸近的攻撃可能性に依存したサブ線形後悔は、攻撃可能性を知ることなく達成可能であることを証明している。
特に、漸近的後悔はプレイヤー数に指数関数的依存を持たず、この問題における2次元の硬さの基本的なトレードオフを明らかにする。
関連論文リスト
- Multi-granular Adversarial Attacks against Black-box Neural Ranking Models [111.58315434849047]
多粒性摂動を取り入れた高品質な逆数例を作成する。
我々は,多粒体攻撃を逐次的意思決定プロセスに変換する。
本手法は,攻撃の有効性と非受容性の両方において,一般的なベースラインを超えている。
論文 参考訳(メタデータ) (2024-04-02T02:08:29Z) - Enhancing Multiple Reliability Measures via Nuisance-extended
Information Bottleneck [77.37409441129995]
トレーニングデータに制限がある現実的なシナリオでは、データ内の多くの予測信号は、データ取得のバイアスからより多く得る。
我々は,相互情報制約の下で,より広い範囲の摂動をカバーできる敵の脅威モデルを考える。
そこで本研究では,その目的を実現するためのオートエンコーダベーストレーニングと,提案したハイブリッド識別世代学習を促進するための実用的なエンコーダ設計を提案する。
論文 参考訳(メタデータ) (2023-03-24T16:03:21Z) - ExploreADV: Towards exploratory attack for Neural Networks [0.33302293148249124]
ExploreADVは、地域的および非受容的な攻撃をモデル化できる汎用的で柔軟な敵攻撃システムである。
提案システムは,入力のサブリージョンに着目し,知覚不能な摂動を探索し,攻撃に対する画素/領域の脆弱性を理解するための柔軟性をユーザに提供する。
論文 参考訳(メタデータ) (2023-01-01T07:17:03Z) - Improving Adversarial Robustness to Sensitivity and Invariance Attacks
with Deep Metric Learning [80.21709045433096]
対向ロバスト性の標準的な方法は、サンプルを最小に摂動させることによって作られたサンプルに対して防御する枠組みを仮定する。
距離学習を用いて、最適輸送問題として逆正則化をフレーム化する。
予備的な結果から, 変分摂動の規則化は, 変分防御と敏感防御の両方を改善することが示唆された。
論文 参考訳(メタデータ) (2022-11-04T13:54:02Z) - Adversarial Robustness of Deep Reinforcement Learning based Dynamic
Recommender Systems [50.758281304737444]
本稿では,強化学習に基づく対話型レコメンデーションシステムにおける敵例の探索と攻撃検出を提案する。
まず、入力に摂動を加え、カジュアルな要因に介入することで、異なる種類の逆例を作成する。
そこで,本研究では,人工データに基づく深層学習に基づく分類器による潜在的攻撃を検出することにより,推薦システムを強化した。
論文 参考訳(メタデータ) (2021-12-02T04:12:24Z) - An Instance-Dependent Analysis for the Cooperative Multi-Player
Multi-Armed Bandit [93.97385339354318]
マルチプレイヤーマルチアーマッドバンドにおける情報共有と協調の課題について検討する。
まず, プレイヤーの最適度差を推定するために, 逐次的除去戦略への簡単な修正が可能であることを示す。
第2に,第1の結果を利用して,衝突の小さな報奨をプレイヤー間の協調に役立てる通信プロトコルを設計する。
論文 参考訳(メタデータ) (2021-11-08T23:38:47Z) - Learning Generative Deception Strategies in Combinatorial Masking Games [27.2744631811653]
詐欺の1つの方法は、システムがどのように構成されているかに関する情報を隠蔽したり、マスキングしたりすることである。
本稿では,攻撃者側がマスクする属性のサブセットを選択するのに対して,攻撃者は攻撃を行うエクスプロイトを選択することで応答する,結果として生じるディフェンダー・アタックラー相互作用のゲーム理論モデルを提案する。
両プレイヤーの戦略をニューラルネットワークとして表現することにより,そのようなゲームを概ね解くための,新しい高度にスケーラブルなアプローチを提案する。
論文 参考訳(メタデータ) (2021-09-23T20:42:44Z) - Multi-player Multi-armed Bandits with Collision-Dependent Reward
Distributions [18.95281057580889]
本稿では,MP-MAB(Multi-player multi-armed bandits)問題について検討する。
既存の文献は常に、衝突が発生した場合、関連するプレイヤーにゼロ報酬を仮定するが、認知無線のような応用の場合、より現実的なシナリオは、衝突が平均報酬を減らし、必ずしもゼロにしないことである。
本稿では,暗黙的な通信をノイズチャネル問題に対する信頼性の高い通信としてモデル化する,誤り訂正衝突通信(EC3)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-06-25T14:39:34Z) - Learning to Generate Noise for Multi-Attack Robustness [126.23656251512762]
対人学習は、対人摂動に対する既存の方法の感受性を回避できる手法の1つとして登場した。
安全クリティカルなアプリケーションでは、攻撃者は様々な敵を採用してシステムを騙すことができるため、これらの手法は極端に便利である。
本稿では,複数種類の攻撃に対するモデルの堅牢性を改善するために,ノイズ発生を明示的に学習するメタラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-22T10:44:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。