論文の概要: Backdoor Mitigation in Object Detection via Adversarial Fine-Tuning
- arxiv url: http://arxiv.org/abs/2605.05928v1
- Date: Thu, 07 May 2026 09:33:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.668929
- Title: Backdoor Mitigation in Object Detection via Adversarial Fine-Tuning
- Title(参考訳): 逆調整による物体検出におけるバックドア緩和
- Authors: Kealan Dunnett, Reza Arablouei, Dimity Miller, Volkan Dedeoglu, Raja Jurdak,
- Abstract要約: バックドア攻撃は、安全クリティカルな視覚システムに深刻な脅威をもたらす。
適応微調整は、分類において一般的なバックドア緩和手法である。
物体検出バックドアの軽減のための検出対応逆調整フレームワークを提案する。
- 参考スコア(独自算出の注目度): 10.393154496941527
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Backdoor attacks can implant malicious behaviours into deep models while preserving performance on clean data, posing a serious threat to safety-critical vision systems. Although backdoor mitigation has been studied extensively for image classification, defenses for object detection remain comparatively underdeveloped. Adversarial fine-tuning is a common backdoor mitigation approach in classification, but adapting it to detection is nontrivial as classification-oriented adversarial generation does not match the detection attack space, where attacks may cause object misclassification or disappearance, and standard detection losses can dilute the repair signal across many predictions. We address these challenges through a detection-aware adversarial fine-tuning framework for mitigating object-detection backdoors when the defender has access only to a compromised detector and a small clean dataset, without knowing the attack objective. For adversarial generation that does not require knowledge of the attack objective, we introduce soft-branch minimisation, which uses a soft gate to combine objectives aligned with misclassification and disappearance attacks, together with a detection-aware classification-loss maximisation. For targeted repair, we introduce a dual-objective fine-tuning loss applied to target-matched predictions, concentrating the defensive update on predictions most relevant to the backdoor behaviour. Experiments across CNN- and Transformer-based detectors show that our approach more effectively reduces attack success while preserving true detections, compared with classification-oriented baselines, and maintains competitive clean detection performance.
- Abstract(参考訳): バックドア攻撃は、悪質な振る舞いを深いモデルに埋め込むことができ、クリーンなデータのパフォーマンスを保ち、安全クリティカルな視覚システムに深刻な脅威を与える。
画像分類のためのバックドア緩和は広く研究されているが、物体検出のための防御はいまだに未開発である。
逆方向の微調整は、分類における一般的なバックドア緩和アプローチであるが、分類指向の逆方向生成は、対象の誤分類や消失を引き起こす可能性のある検出攻撃空間と一致しないため、検出への適応は容易ではない。
攻撃対象を知らずに、ディフェンダーが妥協された検出器と小さなクリーンデータセットにしかアクセスできない場合、対象検出バックドアを緩和するための検出対応逆調整フレームワークにより、これらの課題に対処する。
攻撃対象の知識を必要としない敵生成に対しては,ソフト・ブランチ・最小化を導入する。ソフト・ゲートを用いて,誤分類と消失攻撃に対応する目的と,検出対応の分類損失最大化を組み合わせ,ソフト・ブランチ・最小化を導入する。
対象修復のために,ターゲットマッチング予測に適用した2目的微調整損失を導入し,バックドアの挙動に最も関係のある予測に対する防御的更新に集中する。
CNNおよびTransformerベースの検出器を用いた実験により,本手法は,分類指向のベースラインと比較して,真の検出を保ちながら攻撃成功をより効果的に低減し,競合するクリーン検出性能を維持することを示す。
関連論文リスト
- Fragile Reconstruction: Adversarial Vulnerability of Reconstruction-Based Detectors for Diffusion-Generated Images [32.470971087318695]
本研究は,4つの異なる生成バックボーンモデルにおける3つの代表検出器の対向ロバスト性について,系統的評価を行った。
我々は、ホワイトボックスシナリオにおける敵攻撃を構築し、十分に訓練された全ての検出器の性能を低下させる。
また、ある検出器に対する攻撃を他の検出器に転送することもでき、検出器に対する敵攻撃もブラックボックスの設定で構築できることを示す。
論文 参考訳(メタデータ) (2026-04-14T14:17:51Z) - AnywhereDoor: Multi-Target Backdoor Attacks on Object Detection [9.539021752700823]
AnywhereDoorは、オブジェクト検出のためのマルチターゲットバックドアアタックである。
敵は、すべてのオブジェクトクラスまたは特定のオブジェクトクラスをまたいで、オブジェクトを消したり、新しいオブジェクトを作ったり、ラベルを間違えたりすることができる。
このような柔軟な制御のための既存の手法の適応と比較して、攻撃成功率を26%向上させる。
論文 参考訳(メタデータ) (2025-03-09T09:24:24Z) - AnywhereDoor: Multi-Target Backdoor Attacks on Object Detection [9.539021752700823]
AnywhereDoorは、オブジェクト検出のためのマルチターゲットバックドアアタックである。
敵は、すべてのオブジェクトクラスまたは特定のオブジェクトクラスをまたいで、オブジェクトを消したり、新しいオブジェクトを作ったり、ラベルを間違えたりすることができる。
このような柔軟な制御のための既存の手法の適応と比較して、攻撃成功率を26%向上させる。
論文 参考訳(メタデータ) (2024-11-21T15:50:59Z) - Spatial-Frequency Discriminability for Revealing Adversarial Perturbations [53.279716307171604]
敵の摂動に対するディープニューラルネットワークの脆弱性は、コンピュータビジョンコミュニティで広く認識されている。
現在のアルゴリズムは、通常、自然および敵対的なデータの識別的分解を通じて、敵のパターンを検出する。
空間周波数Krawtchouk分解に基づく識別検出器を提案する。
論文 参考訳(メタデータ) (2023-05-18T10:18:59Z) - Object-fabrication Targeted Attack for Object Detection [54.10697546734503]
物体検出の敵攻撃は 標的攻撃と未標的攻撃を含む。
新たなオブジェクトファブリケーションターゲット攻撃モードは、特定のターゲットラベルを持つ追加の偽オブジェクトをファブリケートする検出器を誤解させる可能性がある。
論文 参考訳(メタデータ) (2022-12-13T08:42:39Z) - Untargeted Backdoor Attack against Object Detection [69.63097724439886]
我々は,タスク特性に基づいて,無目標で毒のみのバックドア攻撃を設計する。
攻撃によって、バックドアがターゲットモデルに埋め込まれると、トリガーパターンでスタンプされたオブジェクトの検出を失う可能性があることを示す。
論文 参考訳(メタデータ) (2022-11-02T17:05:45Z) - Investigating Robustness of Adversarial Samples Detection for Automatic
Speaker Verification [78.51092318750102]
本研究は,ASVシステムに対して,別個の検出ネットワークによる敵攻撃から防御することを提案する。
VGGライクな二分分類検出器を導入し、対向サンプルの検出に有効であることが実証された。
論文 参考訳(メタデータ) (2020-06-11T04:31:56Z) - A Self-supervised Approach for Adversarial Robustness [105.88250594033053]
敵対的な例は、ディープニューラルネットワーク(DNN)ベースの視覚システムにおいて破滅的な誤りを引き起こす可能性がある。
本稿では,入力空間における自己教師型対向学習機構を提案する。
これは、反逆攻撃に対する強力な堅牢性を提供する。
論文 参考訳(メタデータ) (2020-06-08T20:42:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。