論文の概要: Your Neighbors Know: Leveraging Local Neighborhoods for Backdoor Detection in Decentralized Learning
- arxiv url: http://arxiv.org/abs/2605.19969v2
- Date: Tue, 26 May 2026 08:26:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:40.772344
- Title: Your Neighbors Know: Leveraging Local Neighborhoods for Backdoor Detection in Decentralized Learning
- Title(参考訳): 近所の人が知っている:分散学習におけるバックドア検出のための地域住民の活用
- Authors: Sayan Biswas, Antoine Boutet, Davide Frey, Romaric Gaudel, Rachid Guerraoui, Maxime Jacovella, Anne-Marie Kermarrec, Dimitri Lerévérend, François Taïani, Martijn de Vos,
- Abstract要約: 分散学習(DL)に固有の新しいバックドア検出フレームワークArgusを紹介する。
Argusでは、正直なノードが受信したモデル更新をローカルに分析し、潜在的バックドアトリガーを特定する。
その結果,Argusは攻撃成功率を90ポイントまで下げることができた。
- 参考スコア(独自算出の注目度): 11.324089946683204
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Decentralized learning (DL) is an emerging machine learning paradigm where nodes collaboratively train models without a central server. However, the collaborative nature of DL makes it vulnerable to backdoor attacks, where a model is taught to behave normally on standard inputs while executing hidden, malicious actions when encountering data with specific triggers. Backdoor attacks in DL remain understudied and existing defenses often overlook DL constraints. We introduce Argus, a novel backdoor detection framework native to DL that requires neither a central coordinator nor prior knowledge of the trigger. In Argus, honest nodes locally analyze received model updates to identify potential backdoor triggers. Nodes then collectively share their triggers with their neighbors and use a structural similarity metric to separate true backdoors from false alarms induced by data heterogeneity. A key insight is that false positive triggers exhibit inconsistencies across participants while true positive ones show consistent patterns. Model updates that fail this collaborative test are rejected, and persistently malicious senders are eventually evicted. We provide the first theoretical convergence guarantees for a DL-specific backdoor detection mechanism, showing that filtering out suspicious model updates with high probability preserves a convergence rate comparable to standard DL. We implement and evaluate Argus on three standard datasets and against three state-of-the-art baselines. Across settings, Argus reduces attack success rates by up to 90 points compared to no defense, while preserving model utility within 5 percentage points of an omniscient oracle. Furthermore, the effectiveness of Argus compared to baselines improves as data heterogeneity increases.
- Abstract(参考訳): 分散学習(DL)は、ノードが中央サーバーなしでモデルを協調的にトレーニングする、新たな機械学習パラダイムである。
しかし、DLのコラボレーティブな性質は、特定のトリガでデータに遭遇した時に隠れた悪意のあるアクションを実行しながら、標準入力で正常に振る舞うようにモデルに教えられるバックドアアタックに対して脆弱である。
DLのバックドア攻撃は未調査のままであり、既存の防御はDLの制約を見落としていることが多い。
我々は、中央コーディネータもトリガーの事前知識も必要としない、DLに固有の新しいバックドア検出フレームワークであるArgusを紹介した。
Argusでは、正直なノードが受信したモデル更新をローカルに分析し、潜在的バックドアトリガーを特定する。
ノードは、そのトリガを隣人とまとめて共有し、構造的類似度メトリクスを使用して、データの不均一性によって引き起こされた偽のアラームから真のバックドアを分離する。
重要な洞察は、偽陽性トリガーは参加者間で矛盾を示し、真のポジティブトリガーは一貫性のあるパターンを示すことである。
この協調テストに失敗するモデル更新は拒否され、永続的に悪意のある送信者は最終的に排除される。
本稿では,DL固有のバックドア検出機構に対する最初の理論的収束保証を行い,不審なモデル更新を高い確率でフィルタリングすることで,標準DLに匹敵する収束率を維持することを示す。
3つの標準データセットと3つの最先端ベースラインに対してArgusを実装し,評価する。
設定全体では、Argusは攻撃の成功率を防御のないものと比べて最大90ポイント削減する一方、モデルユーティリティーは全知のオラクルの5ポイント以内に保持する。
さらに、データの不均一性の増加に伴い、ベースラインと比較してArgusの有効性が向上する。
関連論文リスト
- Detecting and Mitigating Backdoor Attacks in OTA-FL Systems: A Two-Stage Robust Aggregation Scheme [27.75838619796163]
オーバー・ザ・エア・フェデレーション・ラーニング (OTA-FL) は無線チャネルの重ね合わせ特性を利用して通信効率を向上させる。
パラメータサーバは個々のローカル更新にアクセスできない。
OTA-FLにおけるバックドア攻撃に対する防御のための2段階のロバストアグリゲーションフレームワークを提案する。
論文 参考訳(メタデータ) (2026-05-19T01:57:31Z) - Towards Effective, Stealthy, and Persistent Backdoor Attacks Targeting Graph Foundation Models [62.87838888016534]
Graph Foundation Models(GFM)は、さまざまなソースドメインで事前トレーニングされ、目に見えないターゲットに適応する。
GFMに対するバックドア攻撃は、3つの主要な課題のために簡単ではない。
グラフ基礎モデルに対する新たなバックドア攻撃モデルであるGFM-BAを提案する。
論文 参考訳(メタデータ) (2025-11-22T08:52:09Z) - Backdoor Collapse: Eliminating Unknown Threats via Known Backdoor Aggregation in Language Models [75.29749026964154]
Ourmethodは、複数のベンチマークで平均的な攻撃成功率を4.41%に下げる。
クリーンな精度と実用性はオリジナルのモデルの0.5%以内に保存される。
防衛はさまざまな種類のバックドアをまたいで一般化し、実際のデプロイメントシナリオにおける堅牢性を確認します。
論文 参考訳(メタデータ) (2025-10-11T15:47:35Z) - MARS: A Malignity-Aware Backdoor Defense in Federated Learning [51.77354308287098]
最近提案されたSOTA攻撃(3DFed)は、ディフェンダーがバックドアモデルを受け入れたかどうかを判断するためにインジケータ機構を使用する。
本稿では,各ニューロンの有害な範囲を示すためにバックドアエネルギーを利用するMARS(Maignity-Aware backdooR defenSe)を提案する。
実験により、MARSはSOTAのバックドア攻撃に対して防御でき、既存の防御を著しく上回っていることが示された。
論文 参考訳(メタデータ) (2025-09-21T14:50:02Z) - Lie Detector: Unified Backdoor Detection via Cross-Examination Framework [68.45399098884364]
半正直な設定で一貫したバックドア検出フレームワークを提案する。
本手法は,SoTAベースラインよりも5.4%,1.6%,11.9%の精度で検出性能が向上する。
特に、マルチモーダルな大規模言語モデルにおいて、バックドアを効果的に検出するのは、これが初めてである。
論文 参考訳(メタデータ) (2025-03-21T06:12:06Z) - Neutralizing Backdoors through Information Conflicts for Large Language Models [20.6331157117675]
大規模言語モデル(LLM)からバックドアの挙動を除去する新しい手法を提案する。
軽量なデータセットを使用してコンフリクトモデルをトレーニングし、バックドアモデルとマージして悪意のある振る舞いを中和します。
我々は、90%以上のクリーンデータ精度を維持しながら、高度なバックドア攻撃の攻撃成功率を最大98%削減することができる。
論文 参考訳(メタデータ) (2024-11-27T12:15:22Z) - Concealing Backdoor Model Updates in Federated Learning by Trigger-Optimized Data Poisoning [20.69655306650485]
Federated Learning(FL)は、参加者がプライベートデータを共有せずに、協力的にモデルをトレーニングできる分散型機械学習手法である。
プライバシーとスケーラビリティの利点にもかかわらず、FLはバックドア攻撃の影響を受けやすい。
本稿では,バックドアトリガの最適化によりバックドア目標を動的に構築する,FLのバックドア攻撃戦略であるDPOTを提案する。
論文 参考訳(メタデータ) (2024-05-10T02:44:25Z) - Avoid Adversarial Adaption in Federated Learning by Multi-Metric
Investigations [55.2480439325792]
Federated Learning(FL)は、分散機械学習モデルのトレーニング、データのプライバシの保護、通信コストの低減、多様化したデータソースによるモデルパフォーマンスの向上を支援する。
FLは、中毒攻撃、標的外のパフォーマンス劣化とターゲットのバックドア攻撃の両方でモデルの整合性を損なうような脆弱性に直面している。
我々は、複数の目的に同時に適応できる、強い適応的敵の概念を新たに定義する。
MESASは、実際のデータシナリオで有効であり、平均オーバーヘッドは24.37秒である。
論文 参考訳(メタデータ) (2023-06-06T11:44:42Z) - On Provable Backdoor Defense in Collaborative Learning [35.22450536986004]
悪意のあるユーザは、モデルの収束を防ぐためにデータをアップロードしたり、隠れたバックドアを注入したりできる。
標準的なテストデータではモデルが正常に動作するため、バックドア攻撃は特に検出が難しいが、特定のバックドアキーによってトリガーされた場合、間違ったアウトプットが与えられる。
既存のサブセット集約メソッドを一般化する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-01-19T14:39:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。