論文の概要: SNEAKDOOR: Stealthy Backdoor Attacks against Distribution Matching-based Dataset Condensation
- arxiv url: http://arxiv.org/abs/2603.28824v1
- Date: Sun, 29 Mar 2026 09:00:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-01 15:25:02.561779
- Title: SNEAKDOOR: Stealthy Backdoor Attacks against Distribution Matching-based Dataset Condensation
- Title(参考訳): SNEAKDOOR:分散マッチングに基づくデータセット凝縮に対するステルスバックドアアタック
- Authors: He Yang, Dongyi Lv, Song Ma, Wei Xi, Jizhong Zhao,
- Abstract要約: 凝縮は、本格的なデータのトレーニング効果を維持するコンパクトだが情報的なデータセットを合成することを目的としている。
最近の研究では、凝縮過程がバックドア攻撃に弱いことが示されている。
Sneakdoorを導入し、攻撃効果を損なうことなくステルスネスを高める。
- 参考スコア(独自算出の注目度): 16.225463050971065
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dataset condensation aims to synthesize compact yet informative datasets that retain the training efficacy of full-scale data, offering substantial gains in efficiency. Recent studies reveal that the condensation process can be vulnerable to backdoor attacks, where malicious triggers are injected into the condensation dataset, manipulating model behavior during inference. While prior approaches have made progress in balancing attack success rate and clean test accuracy, they often fall short in preserving stealthiness, especially in concealing the visual artifacts of condensed data or the perturbations introduced during inference. To address this challenge, we introduce Sneakdoor, which enhances stealthiness without compromising attack effectiveness. Sneakdoor exploits the inherent vulnerability of class decision boundaries and incorporates a generative module that constructs input-aware triggers aligned with local feature geometry, thereby minimizing detectability. This joint design enables the attack to remain imperceptible to both human inspection and statistical detection. Extensive experiments across multiple datasets demonstrate that Sneakdoor achieves a compelling balance among attack success rate, clean test accuracy, and stealthiness, substantially improving the invisibility of both the synthetic data and triggered samples while maintaining high attack efficacy. The code is available at https://github.com/XJTU-AI-Lab/SneakDoor.
- Abstract(参考訳): Dataset Condensationは、フルスケールデータのトレーニング効率を維持するコンパクトで情報のあるデータセットを合成し、効率を大幅に向上させることを目的としている。
最近の研究では、凝縮過程がバックドア攻撃に対して脆弱であり、そこでは悪意のあるトリガーが凝縮データセットに注入され、推論中のモデル挙動を操作することが示されている。
以前のアプローチでは、攻撃の成功率とクリーンなテストの正確さのバランスが進んでいるが、特に凝縮したデータの視覚的アーティファクトや推論時に導入された摂動を隠蔽する場合、ステルス性を維持するには不足することが多い。
この課題に対処するために,攻撃効果を損なうことなくステルスネスを高めるSneakdoorを導入する。
Sneakdoorはクラス決定境界の固有の脆弱性を悪用し、局所的な特徴幾何学と整合した入力認識トリガを構成する生成モジュールを組み込んで、検出可能性を最小限にする。
この共同設計により、攻撃は人間の検査と統計的検出の両方に影響を受けないままである。
複数のデータセットにわたる大規模な実験により、スニークドアは攻撃成功率、クリーンテスト精度、ステルスネスのバランスを保ち、高い攻撃効果を維持しながら、合成データとトリガーサンプルの両方の可視性を著しく改善することを示した。
コードはhttps://github.com/XJTU-AI-Lab/SneakDoor.comで公開されている。
関連論文リスト
- InkDrop: Invisible Backdoor Attacks Against Dataset Condensation [20.901037752471876]
InkDropは、モデルユーティリティを劣化させることなく悪質な操作を検知しにくくする。
InkDropは、まずターゲット決定境界付近の候補サンプルを選択し、ターゲットクラスに潜在的なセマンティック親和性を示す。
実験では、InkDropの全体的な有効性を検証するとともに、敵の意図を凝縮したデータセットに統合する能力を示す。
論文 参考訳(メタデータ) (2026-03-30T06:49:08Z) - Hide in Plain Sight: Clean-Label Backdoor for Auditing Membership Inference [16.893873979953593]
本研究では,ステルスデータ監査のための新しいクリーンラベルバックドア方式を提案する。
我々のアプローチでは、ターゲットモデルの振る舞いを模倣するシャドウモデルによって生成される最適なトリガを用いる。
提案手法は,ブラックボックスアクセスによるロバストなデータ監査を可能にし,多様なデータセット間で高い攻撃成功率を達成する。
論文 参考訳(メタデータ) (2024-11-24T20:56:18Z) - Long-Tailed Backdoor Attack Using Dynamic Data Augmentation Operations [50.1394620328318]
既存のバックドア攻撃は主にバランスの取れたデータセットに焦点を当てている。
動的データ拡張操作(D$2$AO)という効果的なバックドア攻撃を提案する。
本手法は,クリーンな精度を維持しつつ,最先端の攻撃性能を実現することができる。
論文 参考訳(メタデータ) (2024-10-16T18:44:22Z) - Leveraging Diffusion-Based Image Variations for Robust Training on
Poisoned Data [26.551317580666353]
バックドア攻撃は、ニューラルネットワークをトレーニングする上で深刻なセキュリティ上の脅威となる。
本稿では,近年の拡散モデルのパワーを生かして,潜在的に有毒なデータセットのモデルトレーニングを可能にする新しい手法を提案する。
論文 参考訳(メタデータ) (2023-10-10T07:25:06Z) - Stealthy Backdoor Attack via Confidence-driven Sampling [49.72680157684523]
バックドア攻撃は、悪質なトリガをDNNモデルに過剰に挿入することを目的としており、テストシナリオ中に不正な制御を許可している。
既存の方法では防衛戦略に対する堅牢性が欠如しており、主に無作為な試薬を無作為に選別しながら、引き金の盗難を強化することに重点を置いている。
信頼性スコアの低いサンプルを選別し、これらの攻撃を識別・対処する上で、守備側の課題を著しく増大させる。
論文 参考訳(メタデータ) (2023-10-08T18:57:36Z) - How adversarial attacks can disrupt seemingly stable accurate classifiers [76.95145661711514]
敵攻撃は、入力データに不連続な修正を加えることで、非正確な学習システムの出力を劇的に変化させる。
ここでは,これは高次元入力データを扱う分類器の基本的特徴であると考えられる。
実用システムで観測される重要な振る舞いを高い確率で発生させる、単純で汎用的なフレームワークを導入する。
論文 参考訳(メタデータ) (2023-09-07T12:02:00Z) - Curse or Redemption? How Data Heterogeneity Affects the Robustness of
Federated Learning [51.15273664903583]
データの不均一性は、フェデレートラーニングにおける重要な特徴の1つとして認識されているが、しばしば敵対的攻撃に対する堅牢性のレンズで見過ごされる。
本稿では, 複合学習におけるバックドア攻撃の影響を, 総合的な実験を通じて評価し, 理解することを目的とした。
論文 参考訳(メタデータ) (2021-02-01T06:06:21Z) - Mitigating the Impact of Adversarial Attacks in Very Deep Networks [10.555822166916705]
Deep Neural Network (DNN)モデルにはセキュリティに関する脆弱性がある。
データ中毒による摂動攻撃は、モデルに偽データを注入する複雑な敵対攻撃である。
そこで本研究では,攻撃に依存しない防御手法を提案する。
論文 参考訳(メタデータ) (2020-12-08T21:25:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。