論文の概要: Exact Certification of Neural Networks and Partition Aggregation Ensembles against Label Poisoning
- arxiv url: http://arxiv.org/abs/2604.11416v1
- Date: Mon, 13 Apr 2026 13:01:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:16.545938
- Title: Exact Certification of Neural Networks and Partition Aggregation Ensembles against Label Poisoning
- Title(参考訳): ニューラルネットワークの厳密な認証とラベル中毒対策のための分割集約
- Authors: Ajinkya Mohgaonkar, Lukas Gosch, Mahalakshmi Sabanayagam, Debarghya Ghoshdastidar, Stephan Günnemann,
- Abstract要約: ラベルフライング攻撃は教師付き学習モデルにとって大きな脅威である。
既存の認証フレームワークはスムーズ化やパーティション集約といったアンサンブル技術に依存している。
パーティション・アグリゲーション・アンサンブルの最初の認証フレームワークであるEnsembleCertを紹介します。
- 参考スコア(独自算出の注目度): 48.86044009211734
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Label-flipping attacks, which corrupt training labels to induce misclassifications at inference, remain a major threat to supervised learning models. This drives the need for robustness certificates that provide formal guarantees about a model's robustness under adversarially corrupted labels. Existing certification frameworks rely on ensemble techniques such as smoothing or partition-aggregation, but treat the corresponding base classifiers as black boxes, yielding overly conservative guarantees. We introduce EnsembleCert, the first certification framework for partition-aggregation ensembles that utilizes white-box knowledge of the base classifiers. Concretely, EnsembleCert yields tighter guarantees than black-box approaches by aggregating per-partition white-box certificates to compute ensemble-level guarantees in polynomial time. To extract white-box knowledge from the base classifiers efficiently, we develop ScaLabelCert, a method that leverages the equivalence between sufficiently wide neural networks and kernel methods using the neural tangent kernel. ScaLabelCert yields the first exact, polynomial-time calculable certificate for neural networks against label-flipping attacks. EnsembleCert is either on par, or significantly outperforms the existing partition-based black box certificates. Exemplary, on CIFAR-10, our method can certify upto +26.5% more label flips in median over the test set compared to the existing black-box approach while requiring 100 times fewer partitions, thus, challenging the prevailing notion that heavy partitioning is a necessity for strong certified robustness.
- Abstract(参考訳): ラベルフリッピング攻撃は、推論時に誤分類を誘発するためにトレーニングラベルを破損させるが、教師付き学習モデルにとって大きな脅威である。
これにより、逆向きに破損したラベルの下で、モデルの堅牢性に関する公式な保証を提供する堅牢性証明書の必要性が促進される。
既存の認証フレームワークはスムーズ化や分割集約といったアンサンブル技術に依存しているが、対応する基本分類器をブラックボックスとして扱い、過度に保守的な保証をもたらす。
本稿では,基本分類器のホワイトボックス知識を利用した分割集約アンサンブルの最初の認証フレームワークであるEnsembleCertを紹介する。
具体的には、EnsembleCertは、多項式時間でアンサンブルレベルの保証を計算するために、パーティションごとのホワイトボックス証明書を集約することで、ブラックボックスアプローチよりも厳密な保証を得る。
ベース分類器からホワイトボックス知識を効率的に抽出するために,十分に広いニューラルネットワークとニューラルネットワークを用いたカーネル手法の等価性を活用する手法であるScaLabelCertを開発した。
ScaLabelCertは、ラベルフライング攻撃に対するニューラルネットワークのための、最初の正確な多項式時間計算可能な証明書を提供する。
EnsembleCertは同等か、既存のパーティションベースのブラックボックス証明書よりもはるかに優れている。
例えば、CIFAR-10では、既存のブラックボックスアプローチと比較してテストセットの中央値に対して、最大で26.5%以上のラベルフリップを証明できるが、100倍のパーティショニングを必要とするため、高いパーティショニングが強力な信頼性のロバスト性に欠かせないという一般的な考え方に挑戦する。
関連論文リスト
- Fast and Flexible Robustness Certificates for Semantic Segmentation [6.1903263165298945]
そこで我々は,リプシッツ制約を組み込んだ,比較的堅牢なセマンティックネットワークを新たに導入する。
我々のアプローチは、初めて、リアルタイム互換の堅牢なセマンティックセマンティックセグメンテーションを解放する。
当社のアプローチはNVIDIA A100 GPUの同等の証明書を推論してランダムにスムースにする方法よりも約600倍高速であることがわかった。
論文 参考訳(メタデータ) (2025-12-03T10:10:16Z) - PatchDEMUX: A Certifiably Robust Framework for Multi-label Classifiers Against Adversarial Patches [37.33690151547147]
敵パッチに対するマルチラベル分類のための,堅牢なフレームワークであるPatchDEMUXを提案する。
本手法は,単一ラベル分類のための既存の認証防御を拡張可能な一般化可能な手法である。
PatchDEMUXはMS-COCOとPASCALのVOCデータセット上で非自明なロバスト性を実現することができる。
論文 参考訳(メタデータ) (2025-05-30T15:25:51Z) - Exact Certification of (Graph) Neural Networks Against Label Poisoning [50.87615167799367]
グラフニューラルネットワーク(GNN)におけるラベルフリップの正確な認証手法を提案する。
本稿では,ノード分類タスクにおける広範囲なGNNアーキテクチャの認証に本手法を適用した。
私たちの研究は、ニューラルネットワークによって引き起こされた毒殺攻撃に対する最初の正確な認証を提示します。
論文 参考訳(メタデータ) (2024-11-30T17:05:12Z) - Adaptive Hierarchical Certification for Segmentation using Randomized Smoothing [87.48628403354351]
機械学習の認証は、特定の条件下では、敵対的なサンプルが特定の範囲内でモデルを回避できないことを証明している。
セグメンテーションの一般的な認証方法は、平らな粒度のクラスを使い、モデルの不確実性による高い断続率をもたらす。
本稿では,複数レベルの階層内で画素を認証し,不安定なコンポーネントに対して粗いレベルに適応的に認証を緩和する,新しい,より実用的な設定を提案する。
論文 参考訳(メタデータ) (2024-02-13T11:59:43Z) - On the Perils of Cascading Robust Classifiers [32.76147960792804]
確実に堅牢なニューラルネットワークを組み込むことは、ニューラルネットワークの認識された堅牢な精度を改善するための有望なアプローチであることが示されている。
重み付け投票に基づく代替的なブラックボックスのアンサンブル機構を提案し、ロバストネス認証の健全さを証明した。
論文 参考訳(メタデータ) (2022-06-01T07:15:58Z) - Smooth-Reduce: Leveraging Patches for Improved Certified Robustness [100.28947222215463]
本研究では,Smooth-Reduce の学習自由な修正スムース化手法を提案する。
提案アルゴリズムは,入力画像から抽出した重なり合うパッチを分類し,予測ロジットを集約して,入力周辺の半径が大きいことを証明する。
我々は,このような証明書の理論的保証を提供し,他のランダムな平滑化手法に対する顕著な改善を実証的に示す。
論文 参考訳(メタデータ) (2022-05-12T15:26:20Z) - Certified Distributional Robustness on Smoothed Classifiers [27.006844966157317]
本稿では,ロバスト性証明として,入力分布に対する最悪の逆損失を提案する。
双対性と滑らか性を利用して、証明書のサロゲートとして容易に計算できる上限を与える。
論文 参考訳(メタデータ) (2020-10-21T13:22:25Z) - Certified Robustness to Label-Flipping Attacks via Randomized Smoothing [105.91827623768724]
機械学習アルゴリズムは、データ中毒攻撃の影響を受けやすい。
任意の関数に対するランダム化スムージングの統一的なビューを示す。
本稿では,一般的なデータ中毒攻撃に対して,ポイントワイズで確実に堅牢な分類器を構築するための新しい戦略を提案する。
論文 参考訳(メタデータ) (2020-02-07T21:28:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。