論文の概要: FlowPure: Continuous Normalizing Flows for Adversarial Purification
- arxiv url: http://arxiv.org/abs/2505.13280v1
- Date: Mon, 19 May 2025 16:04:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:11.717301
- Title: FlowPure: Continuous Normalizing Flows for Adversarial Purification
- Title(参考訳): FlowPure: 逆流浄化のための継続的正規化フロー
- Authors: Elias Collaert, Abel Rodríguez, Sander Joos, Lieven Desmet, Vera Rimmer,
- Abstract要約: 敵の浄化は 有望な防衛戦略として浮上した
条件付きフローマッチング(CFM)を訓練した連続正規化フロー(CNF)に基づく新しい浄化法であるFlowPureを提案する。
以上の結果から,FlowPureは高効率な浄化剤であるが,対向検出に強い可能性を秘めていることが明らかとなった。
- 参考スコア(独自算出の注目度): 1.4898667360408233
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite significant advancements in the area, adversarial robustness remains a critical challenge in systems employing machine learning models. The removal of adversarial perturbations at inference time, known as adversarial purification, has emerged as a promising defense strategy. To achieve this, state-of-the-art methods leverage diffusion models that inject Gaussian noise during a forward process to dilute adversarial perturbations, followed by a denoising step to restore clean samples before classification. In this work, we propose FlowPure, a novel purification method based on Continuous Normalizing Flows (CNFs) trained with Conditional Flow Matching (CFM) to learn mappings from adversarial examples to their clean counterparts. Unlike prior diffusion-based approaches that rely on fixed noise processes, FlowPure can leverage specific attack knowledge to improve robustness under known threats, while also supporting a more general stochastic variant trained on Gaussian perturbations for settings where such knowledge is unavailable. Experiments on CIFAR-10 and CIFAR-100 demonstrate that our method outperforms state-of-the-art purification-based defenses in preprocessor-blind and white-box scenarios, and can do so while fully preserving benign accuracy in the former. Moreover, our results show that not only is FlowPure a highly effective purifier but it also holds a strong potential for adversarial detection, identifying preprocessor-blind PGD samples with near-perfect accuracy.
- Abstract(参考訳): この分野の大幅な進歩にもかかわらず、機械学習モデルを採用するシステムにおいて、敵の堅牢性は依然として重要な課題である。
対人浄化として知られる推論時の対人摂動の除去は、有望な防衛戦略として浮上している。
これを達成するために、最先端の手法は、前処理中にガウスノイズを注入する拡散モデルを利用して、逆方向の摂動を減らし、続いて、分類の前にクリーンなサンプルを復元するデノイングステップを施す。
本研究では,条件付きフローマッチング(CFM)で学習した連続正規化フロー(CNF)に基づく新しい浄化手法であるFlowPureを提案する。
固定ノイズプロセスに依存する従来の拡散ベースのアプローチとは異なり、FlowPureは特定の攻撃知識を活用して既知の脅威下で堅牢性を向上させると同時に、そのような知識が利用できない設定のためにガウス摂動に基づいてトレーニングされたより一般的な確率的な変種をサポートする。
CIFAR-10 と CIFAR-100 の実験により,本手法はプリプロセッサ・ブラインドおよびホワイトボックスシナリオにおいて,最先端の純度に基づく防御よりも優れており,前者の良質な精度を十分に保ちながら実現可能であることが示された。
また, FlowPure は高効率な浄化装置であるだけでなく, 逆方向検出の可能性が強く, プリプロセッサ・ブラインドPGD サンプルをほぼ完全精度で同定した。
関連論文リスト
- Divide and Conquer: Heterogeneous Noise Integration for Diffusion-based Adversarial Purification [75.09791002021947]
既存の浄化法は,前向き拡散過程を通じて一定のノイズを発生させ,その後に逆の処理を行い,クリーンな例を回復させることによって,対向的摂動を妨害することを目的としている。
この方法は、前処理の均一な操作が、対向的摂動と闘いながら通常のピクセルを損なうため、根本的な欠陥がある。
ニューラルネットワークの解釈可能性に基づく異種浄化戦略を提案する。
本手法は,被写体モデルが注目する特定の画素に対して高強度雑音を決定的に印加する一方,残りの画素は低強度雑音のみを被写体とする。
論文 参考訳(メタデータ) (2025-03-03T11:00:25Z) - Instant Adversarial Purification with Adversarial Consistency Distillation [1.3165428727965363]
One Step Control Purification (OSCP) は、単一の神経機能評価において頑健な敵の浄化を実現する新しい防御フレームワークである。
ImageNetの実験結果はOSCPの優れた性能を示し、74.19%の防衛成功率を達成し、純度は0.1秒に過ぎなかった。
論文 参考訳(メタデータ) (2024-08-30T07:49:35Z) - Classifier Guidance Enhances Diffusion-based Adversarial Purification by Preserving Predictive Information [75.36597470578724]
敵の浄化は、敵の攻撃からニューラルネットワークを守るための有望なアプローチの1つである。
分類器決定境界から遠ざかって, 清浄するgUided Purification (COUP)アルゴリズムを提案する。
実験結果から, COUPは強力な攻撃法でより優れた対向的堅牢性が得られることが示された。
論文 参考訳(メタデータ) (2024-08-12T02:48:00Z) - Purify Unlearnable Examples via Rate-Constrained Variational Autoencoders [101.42201747763178]
未学習例(UE)は、正しくラベル付けされたトレーニング例に微妙な修正を加えることで、テストエラーの最大化を目指している。
我々の研究は、効率的な事前学習浄化法を構築するための、新しいゆがみ機構を提供する。
論文 参考訳(メタデータ) (2024-05-02T16:49:25Z) - Scalable Ensemble-based Detection Method against Adversarial Attacks for
speaker verification [73.30974350776636]
本稿では,一貫した枠組みにおける主流浄化手法を包括的に比較する。
本稿では, 検出のための高度浄化モジュールを組み込んだ, 簡単に追従できるアンサンブル手法を提案する。
論文 参考訳(メタデータ) (2023-12-14T03:04:05Z) - Diffusion Models for Adversarial Purification [69.1882221038846]
対人浄化(Adrial purification)とは、生成モデルを用いて敵の摂動を除去する防衛方法の分類である。
そこで我々は,拡散モデルを用いたDiffPureを提案する。
提案手法は,現在の対人訓練および対人浄化方法よりも優れ,最先端の成果を達成する。
論文 参考訳(メタデータ) (2022-05-16T06:03:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。