Fugu-MT 論文翻訳(概要): CausalDiff: Causality-Inspired Disentanglement via Diffusion Model for Adversarial Defense

論文の概要: CausalDiff: Causality-Inspired Disentanglement via Diffusion Model for Adversarial Defense

arxiv url: http://arxiv.org/abs/2410.23091v4
Date: Mon, 18 Nov 2024 03:06:52 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:42.376007
Title: CausalDiff: Causality-Inspired Disentanglement via Diffusion Model for Adversarial Defense
Title（参考訳）: CausalDiff: 対人防御のための拡散モデルによる因果性誘発遠絡
Authors: Mingkun Zhang, Keping Bi, Wei Chen, Quanrun Chen, Jiafeng Guo, Xueqi Cheng,
Abstract要約: 人間は、本質的な要因のみに基づいて判断するので、微妙な操作によって騙されるのは難しい。この観察に触発されて、本質的なラベル因果因子を用いたラベル生成をモデル化し、ラベル非因果因子を組み込んでデータ生成を支援する。逆の例では、摂動を非因果因子として識別し、ラベル因果因子のみに基づいて予測することを目的としている。
参考スコア（独自算出の注目度）: 61.78357530675446
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Despite ongoing efforts to defend neural classifiers from adversarial attacks, they remain vulnerable, especially to unseen attacks. In contrast, humans are difficult to be cheated by subtle manipulations, since we make judgments only based on essential factors. Inspired by this observation, we attempt to model label generation with essential label-causative factors and incorporate label-non-causative factors to assist data generation. For an adversarial example, we aim to discriminate the perturbations as non-causative factors and make predictions only based on the label-causative factors. Concretely, we propose a casual diffusion model (CausalDiff) that adapts diffusion models for conditional data generation and disentangles the two types of casual factors by learning towards a novel casual information bottleneck objective. Empirically, CausalDiff has significantly outperformed state-of-the-art defense methods on various unseen attacks, achieving an average robustness of 86.39% (+4.01%) on CIFAR-10, 56.25% (+3.13%) on CIFAR-100, and 82.62% (+4.93%) on GTSRB (German Traffic Sign Recognition Benchmark). The code is available at \href{https://github.com/CAS-AISafetyBasicResearchGroup/CausalDiff}{https://github.com/CAS-AISafetyBasicResearchGroup/CausalDiff}
Abstract（参考訳）: 神経分類器を敵の攻撃から守る努力は続いているが、特に目に見えない攻撃に対して脆弱なままである。対照的に、本質的な要因のみに基づいて判断を行うため、微妙な操作によって人間を騙すことは困難である。この観察に触発されて、本質的なラベル因果因子を用いたラベル生成をモデル化し、ラベル非因果因子を組み込んでデータ生成を支援する。逆の例では、摂動を非因果因子として識別し、ラベル因果因子のみに基づいて予測することを目的としている。具体的には、条件付きデータ生成に拡散モデルを適用するカジュアル拡散モデル(CausalDiff)を提案する。 CIFAR-10では86.39%(+4.01%)、CIFAR-100では56.25%(+3.13%)、GTSRBでは82.62%(+4.93%)である。コードは \href{https://github.com/CAS-AISafetyBasicResearchGroup/CausalDiff}{https://github.com/CAS-AISafetyBasicResearchGroup/CausalDiff} で公開されている。

関連論文リスト

Flattery, Fluff, and Fog: Diagnosing and Mitigating Idiosyncratic Biases in Preference Models [12.445845925904466]
言語モデルは、アライメントと評価において人間の嗜好判断のためのプロキシとして機能する。それらは体系的な誤校正を示し、実質的な品質よりも表面的なパターンを優先する。このバイアスは長さ、構造、スタイルといった機能への過度な依存として現れ、報酬のハッキングや信頼できない評価といった問題につながります。
論文参考訳（メタデータ） (2025-06-05T17:59:32Z)
CopyrightShield: Enhancing Diffusion Model Security against Copyright Infringement Attacks [61.06621533874629]
拡散モデルは、攻撃者が戦略的に修正された非侵害画像をトレーニングセットに注入する著作権侵害攻撃に弱い。まず、上記の攻撃に対して防御するための防御フレームワーク、PhiliptyShieldを提案する。実験により,PhiliptyShieldは2つの攻撃シナリオで有毒なサンプル検出性能を著しく向上することが示された。
論文参考訳（メタデータ） (2024-12-02T14:19:44Z)
Indiscriminate Disruption of Conditional Inference on Multivariate Gaussians [60.22542847840578]
敵対的機械学習の進歩にもかかわらず、敵対者の存在下でのガウスモデルに対する推論は特に過小評価されている。我々は,意思決定者の条件推論とその後の行動の妨害を希望する自己関心のある攻撃者について,一組の明らかな変数を乱すことで検討する。検出を避けるため、攻撃者は、破損した証拠の密度によって可否が決定される場合に、攻撃が可否を示すことを望んでいる。
論文参考訳（メタデータ） (2024-11-21T17:46:55Z)
Unraveling Adversarial Examples against Speaker Identification -- Techniques for Attack Detection and Victim Model Classification [24.501269108193412]
敵対的な例は話者識別システムを脅かすことが証明されている。本稿では,敵対的事例の存在を検出する手法を提案する。また、敵攻撃を行う被害者モデルを特定する方法についても紹介する。
論文参考訳（メタデータ） (2024-02-29T17:06:52Z)
Federated Causal Discovery from Heterogeneous Data [70.31070224690399]
任意の因果モデルと異種データに対応する新しいFCD法を提案する。これらのアプローチには、データのプライバシを保護するために、生データのプロキシとして要約統計を構築することが含まれる。提案手法の有効性を示すために, 合成および実データを用いた広範囲な実験を行った。
論文参考訳（メタデータ） (2024-02-20T18:53:53Z)
FreqFed: A Frequency Analysis-Based Approach for Mitigating Poisoning Attacks in Federated Learning [98.43475653490219]
フェデレート・ラーニング(Federated Learning, FL)は、毒素による攻撃を受けやすい。 FreqFedは、モデルの更新を周波数領域に変換する新しいアグリゲーションメカニズムである。 FreqFedは, 凝集モデルの有用性に悪影響を及ぼすことなく, 毒性攻撃を効果的に軽減できることを実証した。
論文参考訳（メタデータ） (2023-12-07T16:56:24Z)
Advancing Adversarial Robustness Through Adversarial Logit Update [10.041289551532804]
敵の訓練と敵の浄化は最も広く認知されている防衛戦略の一つである。そこで本稿では,新たな原則であるALU(Adversarial Logit Update)を提案する。本手法は,幅広い敵攻撃に対する最先端手法と比較して,優れた性能を実現する。
論文参考訳（メタデータ） (2023-08-29T07:13:31Z)
Diffusion-Based Adversarial Sample Generation for Improved Stealthiness and Controllability [62.105715985563656]
そこで本研究では,現実的な対向サンプルを生成するための拡散型射影勾配 Descent (Diff-PGD) という新しいフレームワークを提案する。我々のフレームワークは、デジタルアタック、物理世界アタック、スタイルベースのアタックなど、特定のタスクに簡単にカスタマイズできる。
論文参考訳（メタデータ） (2023-05-25T21:51:23Z)
Defending against the Label-flipping Attack in Federated Learning [5.769445676575767]
フェデレーテッド・ラーニング(FL)は、参加する仲間にデザインによる自律性とプライバシを提供する。ラベルフリッピング(LF)攻撃(英: label-flipping, LF)は、攻撃者がラベルをめくってトレーニングデータに毒を盛る攻撃である。本稿では、まず、ピアのローカル更新からこれらの勾配を動的に抽出する新しいディフェンスを提案する。
論文参考訳（メタデータ） (2022-07-05T12:02:54Z)
Semi-Targeted Model Poisoning Attack on Federated Learning via Backward Error Analysis [15.172954465350667]
フェデレートラーニング(FL)に対するモデル中毒は、エッジモデルを妥協することでシステム全体に侵入する。本稿では,特徴空間に最適化された標的クラスを見出すことにより,アタック・ディスタンス・アウェア・アタック(ADA)の攻撃性を高めることを提案する。 ADAは攻撃頻度0.01の最も困難な場合において、攻撃性能を1.8倍に向上させることに成功した。
論文参考訳（メタデータ） (2022-03-22T11:40:07Z)
Feature Importance-aware Transferable Adversarial Attacks [46.12026564065764]
既存の移動可能な攻撃は、特徴を無差別に歪ませることで敵の例を作る傾向がある。このようなブルート力の劣化は、モデル固有の局所最適化を敵の例に導入するであろうと論じる。対照的に、重要なオブジェクト認識機能を妨害する特徴重要度認識攻撃(FIA)を提案する。
論文参考訳（メタデータ） (2021-07-29T17:13:29Z)
Adversarial Robustness through the Lens of Causality [105.51753064807014]
ディープニューラルネットワークの敵対的脆弱性は、機械学習において大きな注目を集めている。我々は、因果関係を敵対的脆弱性の軽減に組み込むことを提案する。我々の手法は、敵の脆弱性を緩和するために因果性を利用する最初の試みと見なすことができる。
論文参考訳（メタデータ） (2021-06-11T06:55:02Z)
How Robust are Randomized Smoothing based Defenses to Data Poisoning? [66.80663779176979]
我々は、トレーニングデータの品質の重要性を強調する堅牢な機械学習モデルに対して、これまで認識されていなかった脅威を提示します。本稿では,二段階最適化に基づく新たなデータ中毒攻撃法を提案し,ロバストな分類器のロバスト性を保証する。我々の攻撃は、被害者が最先端のロバストな訓練方法を用いて、ゼロからモデルを訓練しても効果的である。
論文参考訳（メタデータ） (2020-12-02T15:30:21Z)
Fundamental Tradeoffs between Invariance and Sensitivity to Adversarial Perturbations [65.05561023880351]
敵の例は誤分類を引き起こすために作られた悪意のある入力である。本稿では, 相補的障害モード, 不変性に基づく逆数例について検討する。感度に基づく攻撃に対する防御は、不変性に基づく攻撃に対するモデルの精度を積極的に損なうことを示す。
論文参考訳（メタデータ） (2020-02-11T18:50:23Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。