論文の概要: Provable Robustness against Backdoor Attacks via the Primal-Dual Perspective on Differential Privacy
- arxiv url: http://arxiv.org/abs/2605.21780v1
- Date: Wed, 20 May 2026 22:17:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:42.00828
- Title: Provable Robustness against Backdoor Attacks via the Primal-Dual Perspective on Differential Privacy
- Title(参考訳): 識別プライバシの最小二次元的視点によるバックドアアタックに対する確率的ロバスト性
- Authors: Aman Saxena, Jan Schuchardt, Yan Scholten, Stephan Günnemann,
- Abstract要約: ランダムな平滑化は、敵の摂動に対する堅牢性を証明するための強力なツールである。
本稿では,複雑な構成機構の認証のためのフレームワークを提案する。
複雑な脅威モデル下での堅牢性を証明するために複合メカニズムを使用するための原則的で一般的なフレームワークを提供する。
- 参考スコア(独自算出の注目度): 51.758416625168
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Randomized smoothing is a powerful tool for certifying robustness to adversarial perturbations, including poisoning attacks via randomized training and evasion attacks via randomized inference. Extending these guarantees to backdoor attacks, where training and test data are jointly perturbed, remains challenging because training- and test-time randomized mechanisms must be analyzed within a single robustness certificate. We address this by connecting randomized smoothing to the dual view of differential privacy through privacy profiles, which provide a numerical procedure for composing heterogeneous mechanisms. The resulting framework enables tight, modular, end-to-end certification of complex, composed mechanisms while leveraging existing analyses of differentially private mechanisms. We instantiate the framework for DP-SGD and Deep Partition Aggregation with inference-time smoothing, deriving joint robustness guarantees against both training-time and inference-time attacks. Experiments on MNIST and CIFAR-10 demonstrate the effectiveness of our framework. Overall, we provide a principled and general framework for using composite mechanisms to certify robustness under complex threat models that better capture the capabilities of real-world adversaries.
- Abstract(参考訳): ランダム化平滑化は、ランダム化トレーニングによる中毒攻撃やランダム化推論による回避攻撃など、敵の摂動に対する堅牢性を証明する強力なツールである。
これらの保証をトレーニングとテストデータが共同で摂動するバックドア攻撃に拡張することは、トレーニングとテスト時のランダム化メカニズムを単一の堅牢性証明書内で分析する必要があるため、依然として難しい。
ランダム化されたスムーシングを、プライバシープロファイルを通じて微分プライバシーの二重ビューに接続することにより、不均一なメカニズムを構成するための数値的な手順を提供する。
結果として得られるフレームワークは、複雑な構成されたメカニズムの厳密でモジュール化されたエンドツーエンドの認証を可能にすると同時に、微分プライベートなメカニズムの既存の分析を活用する。
DP-SGDとDeep Partition Aggregationのフレームワークを推論時平滑化によりインスタンス化し、トレーニング時と推論時の両方の攻撃に対して関節の堅牢性を保証する。
MNISTとCIFAR-10の実験により,本フレームワークの有効性が示された。
全体として、我々は、現実世界の敵の能力をよりよくとらえる複雑な脅威モデルの下で、堅牢性を証明するために複合メカニズムを使用するための原則的で一般的なフレームワークを提供する。
関連論文リスト
- Quantifiable Uncertainty: A Stochastic Consensus Multi-Agent RAG Framework for Robust Malware Detection [1.2183405753834562]
本稿では,マルウェア解析をセマンティックコード検索と確率的検証に分離するフレームワークMAGMAを提案する。
MAGMAは98.4%の検知率を示し,既存の解よりもかなり高い値を示した。
論文 参考訳(メタデータ) (2026-05-08T18:46:24Z) - Multimodal Learning on Low-Quality Data with Conformal Predictive Self-Calibration [72.0672328514289]
マルチモーダル学習は、しばしば低品質データの課題に悩まされる。
コンフォーマル予測自己校正(Conformal Predictive Self-Calibration)と呼ばれる統合フレームワークを提案する。
私たちのフレームワークは、既存の最先端メソッドを一貫して上回ります。
論文 参考訳(メタデータ) (2026-05-05T14:48:52Z) - GuardFed: A Trustworthy Federated Learning Framework Against Dual-Facet Attacks [56.983319121358555]
フェデレートラーニング(FL)は、プライバシ保護のための協調モデルトレーニングを可能にするが、敵の行動に弱いままである。
本稿では,予測精度とグループフェアネスを同時に損なう新たな脅威モデルであるデュアル顔攻撃(DFA)を紹介する。
本稿では,少量のクリーンサーバデータを用いて,公正な参照モデルを維持する自己適応型防衛フレームワークであるGuardFedを提案する。
論文 参考訳(メタデータ) (2025-11-12T13:02:45Z) - Kick Bad Guys Out! Conditionally Activated Anomaly Detection in Federated Learning with Zero-Knowledge Proof Verification [31.38942054994932]
フェデレーテッド・ラーニング(FL)システムは敵の攻撃を受けやすい。
RedJasperは、現実世界のFLデプロイメント用に特別に設計された2段階の異常検出手法である。
第1段階で不審な活動を特定し、第2段階を条件付きで活性化し、不審な局所モデルをさらに精査する。
論文 参考訳(メタデータ) (2023-10-06T07:09:05Z) - Augment then Smooth: Reconciling Differential Privacy with Certified Robustness [32.49465965847842]
標準偏差プライベートモデルトレーニングは,信頼性の高いロバスト性保証を提供するには不十分であることを示す。
本稿では,プライバシとロバスト性の両方を同時に実現する,シンプルで効果的なDP-CERTを提案する。
論文 参考訳(メタデータ) (2023-06-14T17:52:02Z) - Combating Exacerbated Heterogeneity for Robust Models in Federated
Learning [91.88122934924435]
対人訓練と連合学習の組み合わせは、望ましくない頑丈さの劣化につながる可能性がある。
我々は、Slack Federated Adversarial Training (SFAT)と呼ばれる新しいフレームワークを提案する。
各種ベンチマークおよび実世界のデータセットに対するSFATの合理性と有効性を検証する。
論文 参考訳(メタデータ) (2023-03-01T06:16:15Z) - FLIP: A Provable Defense Framework for Backdoor Mitigation in Federated
Learning [66.56240101249803]
我々は,クライアントの強固化がグローバルモデル(および悪意のあるクライアント)に与える影響について検討する。
本稿では, 逆エンジニアリングによる防御手法を提案するとともに, 堅牢性を保証して, 改良を実現できることを示す。
競合する8つのSOTA防御法について, 単発および連続のFLバックドア攻撃に対して, 提案手法の実証的優位性を示した。
論文 参考訳(メタデータ) (2022-10-23T22:24:03Z) - Certifiably-Robust Federated Adversarial Learning via Randomized
Smoothing [16.528628447356496]
本稿では,データプライベートな分散学習を実現するために,スムーズな手法を連携型対人訓練に取り入れる。
実験の結果,このような先進的な対人学習フレームワークは,集中的な訓練によって訓練されたモデルと同じくらい頑健なモデルを提供できることがわかった。
論文 参考訳(メタデータ) (2021-03-30T02:19:45Z) - Trust but Verify: Assigning Prediction Credibility by Counterfactual
Constrained Learning [123.3472310767721]
予測信頼性尺度は統計学と機械学習において基本的なものである。
これらの措置は、実際に使用される多種多様なモデルを考慮に入れるべきである。
この研究で開発されたフレームワークは、リスクフィットのトレードオフとして信頼性を表現している。
論文 参考訳(メタデータ) (2020-11-24T19:52:38Z) - Towards Robust Deep Learning with Ensemble Networks and Noisy Layers [2.2843885788439793]
画像分類型ネットワークにおける敵対的事例から保護する深層学習のためのアプローチを提案する。
1) 精度を犠牲にしてロバスト性を高めるメカニズム,2) 精度を向上するが、常にロバスト性を高めるわけではないメカニズムである。
論文 参考訳(メタデータ) (2020-07-03T06:04:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。