論文の概要: SoK: Colluding Adversaries in Machine Learning Pipelines
- arxiv url: http://arxiv.org/abs/2606.10091v1
- Date: Mon, 08 Jun 2026 19:16:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-10 15:40:58.150453
- Title: SoK: Colluding Adversaries in Machine Learning Pipelines
- Title(参考訳): SoK: マシンラーニングパイプラインでアダプタをコラボする
- Authors: Vasisht Duddu, Lipeng He, Asim Waheed, N. Asokan,
- Abstract要約: 既存の作業には、敵同士の共謀を探求する体系的な枠組みが欠けている。
列車と推論時の敵同士の共謀を網羅する枠組みを提案する。
敵の性格が共謀の可能性にどのように影響するかを論じる。
- 参考スコア(独自算出の注目度): 11.674926242137177
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning (ML) models are susceptible to various security, privacy, and fairness risks. Adversaries with different characteristics (i.e., objectives, knowledge, and capabilities) can collude by executing one attack to amplify others. Existing work lacks a systematic framework to explore collusion among adversaries, and to study the implications of the adversaries' characteristics. We present a framework covering collusion (a) between train- and inference-time adversaries, and (b) among inference-time adversaries. Our framework accounts for factors enabling collusion between adversaries. We propose a guideline to conjecture about the potential for collusion using enabling factors. We use it to explain prior work, conjecture about unexplored collusions, and empirically validate five such cases. Finally, we discuss how adversaries' characteristics influence the potential for collusion.
- Abstract(参考訳): 機械学習(ML)モデルは、さまざまなセキュリティ、プライバシ、公正性リスクに影響を受けやすい。
異なる特徴(目的、知識、能力)を持つ敵は、1つの攻撃を実行して他の攻撃を増幅することで衝突することがある。
既存の作業には、敵同士の共謀を探究する体系的な枠組みが欠如し、敵の性格がもたらす影響を研究するための体系的な枠組みが欠如している。
共謀を包括する枠組みを提示する
(a)列車と推論時間の間の敵、及び
b) 推測時敵のうちの1。
我々の枠組みは、敵同士の共謀を可能にする要因を考慮に入れている。
本稿では,有効因子を用いた共謀の可能性を推測するためのガイドラインを提案する。
我々は、事前の作業の説明、未発見の共謀に関する予想、そして5つのケースを実証的に検証するためにそれを利用する。
最後に、敵の性格が共謀の可能性にどのように影響するかを論じる。
関連論文リスト
- Adversarial Attacks Leverage Interference Between Features in Superposition [22.16331063882095]
敵の脆弱性は、ニューラルネットワークの効率的な情報符号化から生じる可能性があると我々は主張する。
具体的には、スーパーポジションが、敵が活用できる潜在表現の配列を生成する方法を示す。
論文 参考訳(メタデータ) (2025-10-13T17:59:02Z) - The Sum Leaks More Than Its Parts: Compositional Privacy Risks and Mitigations in Multi-Agent Collaboration [72.33801123508145]
大規模言語モデル(LLM)はマルチエージェントシステムに不可欠なものである。
プライバシーリスクは、暗記、直接推論、シングルターン評価を超えて現れる。
特に、相互作用によって構成される一見無害な反応は、敵が機密情報の回復を累積的に行うことができる。
論文 参考訳(メタデータ) (2025-09-16T16:57:25Z) - Adversaries With Incentives: A Strategic Alternative to Adversarial Robustness [11.722685584919757]
敵の訓練は、あらゆる意味で予測性能を損なうことが唯一の目的である敵に対して防御することを目的としている。
対戦相手を,分類者に対して直接取り組むのではなく,単に自身の目標を追求するものとしてモデル化することを提案する。
我々は、相手のインセンティブに関する穏やかな知識がいかに有用であるかを示す一連の実験を行う。
論文 参考訳(メタデータ) (2024-06-17T12:20:59Z) - Adversarial Contrastive Learning via Asymmetric InfoNCE [64.42740292752069]
非対称なInfoNCEの目的と対比した場合,非対称なサンプルを不等に扱うことを提案する。
非対称的な方法では、CLと対向学習の相反する目的の悪影響を効果的に軽減することができる。
実験の結果,提案手法は既存CL法より一貫して優れていることがわかった。
論文 参考訳(メタデータ) (2022-07-18T04:14:36Z) - A Unified Game-Theoretic Interpretation of Adversarial Robustness [39.64586231421121]
本稿では,異なる敵攻撃と防御方法を説明する統一的な視点を提供する。
本研究は, 敵の摂動と強靭性を統一する可能性があり, 既存の防御法を原則的に説明できる。
論文 参考訳(メタデータ) (2021-11-05T14:57:49Z) - Detecting adversaries in Crowdsourcing [71.20185379303479]
本研究は, クラウドソース型分類における敵の影響を, 人気のダウィド・アンド・スケネモデルを用いて検討する。
敵は、クラウドソーシングモデルから任意に逸脱することを許され、潜在的に協力する可能性がある。
我々は,アノテータ応答の2次モーメント構造を利用して,多数の敵を識別し,クラウドソーシングタスクへの影響を軽減するアプローチを開発した。
論文 参考訳(メタデータ) (2021-10-07T15:07:07Z) - Adversarial Visual Robustness by Causal Intervention [56.766342028800445]
敵の訓練は、敵の例に対する事実上最も有望な防御である。
しかし、その受動性は必然的に未知の攻撃者への免疫を妨げる。
我々は、敵対的脆弱性の因果的視点を提供する: 原因は、学習に普遍的に存在する共同創設者である。
論文 参考訳(メタデータ) (2021-06-17T14:23:54Z) - Game-theoretic Understanding of Adversarially Learned Features [38.19291233245746]
本論文は,DNNの信号処理挙動という,新たな種別からの敵対攻撃と防御を理解することを目的とする。
6つの性質を満たすゲーム理論における多階相互作用を新たに定義する。
論文 参考訳(メタデータ) (2021-03-12T15:56:28Z) - Sampling Attacks: Amplification of Membership Inference Attacks by
Repeated Queries [74.59376038272661]
本手法は,他の標準メンバーシップ相手と異なり,被害者モデルのスコアにアクセスできないような厳格な制限の下で動作可能な,新しいメンバーシップ推論手法であるサンプリングアタックを導入する。
ラベルのみを公開している被害者モデルでは,攻撃のサンプリングが引き続き可能であり,攻撃者はその性能の最大100%を回復できることを示す。
防衛においては,被害者モデルのトレーニング中の勾配摂動と予測時の出力摂動の形式で差分プライバシーを選択する。
論文 参考訳(メタデータ) (2020-09-01T12:54:54Z) - Adversarial Attacks and Defenses: An Interpretation Perspective [80.23908920686625]
敵の攻撃と防御に関する最近の研究、特に機械学習の解釈の観点から概観する。
モデル解釈(モデル解釈、英: model interpretation)または解釈可能な機械学習(英: interpretable machine learning)の目標は、モデルの動作メカニズムに対する人間の理解可能な用語を抽出することである。
それぞれの解釈に対して、敵の攻撃や防御にどのように使用できるかについて詳述する。
論文 参考訳(メタデータ) (2020-04-23T23:19:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。