Fugu-MT 論文翻訳(概要): Enhancing Fine-Tuning Based Backdoor Defense with Sharpness-Aware Minimization

論文の概要: Enhancing Fine-Tuning Based Backdoor Defense with Sharpness-Aware Minimization

arxiv url: http://arxiv.org/abs/2304.11823v1
Date: Mon, 24 Apr 2023 05:13:52 GMT
ステータス: 翻訳完了
システム内更新日: 2023-04-25 16:07:30.262004
Title: Enhancing Fine-Tuning Based Backdoor Defense with Sharpness-Aware Minimization
Title（参考訳）: シャープネス最小化によるファインチューニング型バックドアディフェンスの強化
Authors: Mingli Zhu, Shaokui Wei, Li Shen, Yanbo Fan, Baoyuan Wu
Abstract要約: 良性データに基づく微調整は、バックドアモデルにおけるバックドア効果を消去するための自然な防御である。本研究では, バックドア関連ニューロンのノルムを小さくするために, 微調整によるシャープネス認識最小化を取り入れた新しいバックドア防御パラダイムFTSAMを提案する。
参考スコア（独自算出の注目度）: 27.964431092997504
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Backdoor defense, which aims to detect or mitigate the effect of malicious triggers introduced by attackers, is becoming increasingly critical for machine learning security and integrity. Fine-tuning based on benign data is a natural defense to erase the backdoor effect in a backdoored model. However, recent studies show that, given limited benign data, vanilla fine-tuning has poor defense performance. In this work, we provide a deep study of fine-tuning the backdoored model from the neuron perspective and find that backdoorrelated neurons fail to escape the local minimum in the fine-tuning process. Inspired by observing that the backdoorrelated neurons often have larger norms, we propose FTSAM, a novel backdoor defense paradigm that aims to shrink the norms of backdoor-related neurons by incorporating sharpness-aware minimization with fine-tuning. We demonstrate the effectiveness of our method on several benchmark datasets and network architectures, where it achieves state-of-the-art defense performance. Overall, our work provides a promising avenue for improving the robustness of machine learning models against backdoor attacks.
Abstract（参考訳）: 攻撃者が引き起こす悪質なトリガーを検知または緩和することを目的としたバックドアディフェンスは、機械学習のセキュリティと整合性にとってますます重要になっている。良性データに基づく微調整は、バックドアモデルにおけるバックドア効果を削除する自然な防御である。しかし,近年の研究では,バニラ微調整による防御性能の低下が報告されている。本研究では、ニューロンの観点からバックドアモデルの微調整に関する深い研究を行い、その微調整過程においてバックドア関連ニューロンが局所的な極小さから逃れられていないことを発見した。バックドア関連ニューロンは、しばしばより大きなノルムを持つという観察に触発されて、我々は、シャープネスを認識できる最小化と微調整を組み込むことでバックドア関連ニューロンのノルムを縮小することを目的とした新しいバックドア防御パラダイムであるftsamを提案する。いくつかのベンチマークデータセットとネットワークアーキテクチャにおいて,本手法の有効性を実証し,現状の防御性能を実現する。全体として、我々の研究は、バックドア攻撃に対する機械学習モデルの堅牢性を改善するための有望な道を提供する。

関連論文リスト

Neural Antidote: Class-Wise Prompt Tuning for Purifying Backdoors in Pre-trained Vision-Language Models [42.81731204702258]
CBPT(Class-wise Backdoor Prompt Tuning)は、テキストプロンプトによって間接的に汚染された視覚言語モデル(VLM)を浄化する効率的な方法である。 CBPTは、7つの主要なバックドア攻撃に対して平均的クリーン精度(CA)58.86%、アタック成功率(ASR)0.39%のモデルユーティリティを維持しながら、バックドアの脅威を著しく軽減する。
論文参考訳（メタデータ） (2025-02-26T16:25:15Z)
REFINE: Inversion-Free Backdoor Defense via Model Reprogramming [60.554146386198376]
ディープニューラルネットワーク(DNN)に対するバックドア攻撃は、重大なセキュリティ脅威として浮上している。モデル再プログラミングに基づく逆フリーバックドア防御手法であるREFINEを提案する。
論文参考訳（メタデータ） (2025-02-22T07:29:12Z)
Gradient Norm-based Fine-Tuning for Backdoor Defense in Automatic Speech Recognition [5.698274162994769]
本稿では,音声領域における攻撃に対する新たな防御戦略を提案する。傾斜ノルム正規化を組み込むことでバックドアモデルの微調整を行い、バックドアニューロンの弱化と縮小を図る。この研究は、オーディオ領域におけるバックドア攻撃に対して、初めて専門的で効果的な防御である。
論文参考訳（メタデータ） (2025-02-03T08:42:46Z)
Behavior Backdoor for Deep Learning Models [95.50787731231063]
我々は,行動訓練されたバックドアモデルトレーニング手順として定義された行動バックドアアタックに向けた第一歩を踏み出す。本稿では,行動バックドアを実装する最初のパイプライン,すなわち量子バックドア(QB)攻撃を提案する。さまざまなモデル、データセット、タスクで実験が行われ、この新たなバックドア攻撃の有効性が実証された。
論文参考訳（メタデータ） (2024-12-02T10:54:02Z)
Expose Before You Defend: Unifying and Enhancing Backdoor Defenses via Exposed Models [68.40324627475499]
本稿では,Expose Before You Defendという新しい2段階防衛フレームワークを紹介する。 EBYDは既存のバックドア防御手法を総合防衛システムに統合し、性能を向上する。 2つの視覚データセットと4つの言語データセットにまたがる10のイメージアタックと6つのテキストアタックに関する広範な実験を行います。
論文参考訳（メタデータ） (2024-10-25T09:36:04Z)
Efficient Backdoor Defense in Multimodal Contrastive Learning: A Token-Level Unlearning Method for Mitigating Threats [52.94388672185062]
本稿では,機械学習という概念を用いて,バックドアの脅威に対する効果的な防御機構を提案する。これは、モデルがバックドアの脆弱性を迅速に学習するのを助けるために、小さな毒のサンプルを戦略的に作成することを必要とする。バックドア・アンラーニング・プロセスでは,新しいトークン・ベースの非ラーニング・トレーニング・システムを提案する。
論文参考訳（メタデータ） (2024-09-29T02:55:38Z)
Fusing Pruned and Backdoored Models: Optimal Transport-based Data-free Backdoor Mitigation [22.698855006036748]
バックドア攻撃はディープニューロンネットワーク(DNN)に深刻な脅威をもたらす本研究は,OTBR(Optimal Transport-based Backdoor repairing)と呼ばれる新しいデータ自由防衛手法を提案する。私たちの知る限りでは、OTとモデル融合技術をバックドアディフェンスに適用するのはこれが初めてです。
論文参考訳（メタデータ） (2024-08-28T15:21:10Z)
Unveiling and Mitigating Backdoor Vulnerabilities based on Unlearning Weight Changes and Backdoor Activeness [23.822040810285717]
クリーンなデータを学習し、プルーニングマスクを学習するアンラーニングモデルは、バックドアディフェンスに寄与している。本研究では,重み変化と勾配ノルムの観点から,モデルアンラーニングについて検討する。最初の段階では、観測1に基づいて、効率的なニューロン量変化(NWC)に基づくバックドア再初期化を提案する。第2段階では、観測2に基づいて、バニラファインチューニングに代わるアクティブネス対応ファインチューニングを設計する。
論文参考訳（メタデータ） (2024-05-30T17:41:32Z)
Unified Neural Backdoor Removal with Only Few Clean Samples through Unlearning and Relearning [4.623498459985644]
ニューラルネットワークのバックドアは、攻撃者がモデル動作を悪意を持って変更できるようにするため、深刻なセキュリティ上の脅威となる。本研究では,ULRLと呼ばれるバックドアの包括的かつ効果的な除去方法を提案する。
論文参考訳（メタデータ） (2024-05-23T16:49:09Z)
Reconstructive Neuron Pruning for Backdoor Defense [96.21882565556072]
本稿では, バックドアニューロンの露出とプルーンの抑制を目的とした, emphReconstructive Neuron Pruning (RNP) という新しい防御法を提案する。 RNPでは、アンラーニングはニューロンレベルで行われ、リカバリはフィルタレベルで行われ、非対称再構成学習手順を形成する。このような非対称なプロセスは、少数のクリーンサンプルだけが、広範囲の攻撃によって移植されたバックドアニューロンを効果的に露出し、刺激することができることを示す。
論文参考訳（メタデータ） (2023-05-24T08:29:30Z)
Untargeted Backdoor Attack against Object Detection [69.63097724439886]
我々は,タスク特性に基づいて,無目標で毒のみのバックドア攻撃を設計する。攻撃によって、バックドアがターゲットモデルに埋め込まれると、トリガーパターンでスタンプされたオブジェクトの検出を失う可能性があることを示す。
論文参考訳（メタデータ） (2022-11-02T17:05:45Z)
Backdoor Defense via Suppressing Model Shortcuts [91.30995749139012]
本稿では,モデル構造の角度からバックドア機構を探索する。攻撃成功率 (ASR) は, キースキップ接続の出力を減少させると著しく低下することを示した。
論文参考訳（メタデータ） (2022-11-02T15:39:19Z)
Confidence Matters: Inspecting Backdoors in Deep Neural Networks via Distribution Transfer [27.631616436623588]
本稿では,新しい観測結果を基にしたバックドアディフェンスDTInspectorを提案する。 DTInspectorは、ほとんどの高信頼データの予測を変える可能性のあるパッチを学び、それからバックドアの存在を決定する。
論文参考訳（メタデータ） (2022-08-13T08:16:28Z)
Few-shot Backdoor Defense Using Shapley Estimation [123.56934991060788]
我々は、深層ニューラルネットワークに対するバックドア攻撃を軽減するために、Shapley Pruningと呼ばれる新しいアプローチを開発した。 ShapPruningは、感染した数少ないニューロン(全ニューロンの1%以下)を特定し、モデルの構造と正確性を保護する。様々な攻撃やタスクに対して,本手法の有効性とロバスト性を示す実験を行った。
論文参考訳（メタデータ） (2021-12-30T02:27:03Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。