論文の概要: FL-PBM: Pre-Training Backdoor Mitigation for Federated Learning
- arxiv url: http://arxiv.org/abs/2603.28673v1
- Date: Mon, 30 Mar 2026 16:56:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:45.522432
- Title: FL-PBM: Pre-Training Backdoor Mitigation for Federated Learning
- Title(参考訳): FL-PBM:フェデレートラーニングのための事前トレーニングバックドア緩和
- Authors: Osama Wehbi, Sarhad Arisdakessian, Omar Abdel Wahab, Azzam Mourad, Hadi Otrok, Jamal Bentahar,
- Abstract要約: バックドア攻撃は、人工知能(AI)モデルの完全性と信頼性に重大な脅威をもたらす。
本稿では,フェデレートラーニングのための事前学習バックドア緩和を提案する。
フェデレートされた学習環境において、モデルトレーニングの前に、クライアント側の有毒データを積極的にフィルタリングする。
- 参考スコア(独自算出の注目度): 15.911410230033816
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Backdoor attacks pose a significant threat to the integrity and reliability of Artificial Intelligence (AI) models, enabling adversaries to manipulate model behavior by injecting poisoned data with hidden triggers. These attacks can lead to severe consequences, especially in critical applications such as autonomous driving, healthcare, and finance. Detecting and mitigating backdoor attacks is crucial across the lifespan of model's phases, including pre-training, in-training, and post-training. In this paper, we propose Pre-Training Backdoor Mitigation for Federated Learning (FL-PBM), a novel defense mechanism that proactively filters poisoned data on the client side before model training in a federated learning (FL) environment. The approach consists of three stages: (1) inserting a benign trigger into the data to establish a controlled baseline, (2) applying Principal Component Analysis (PCA) to extract discriminative features and assess the separability of the data, (3) performing Gaussian Mixture Model (GMM) clustering to identify potentially malicious data samples based on their distribution in the PCA-transformed space, and (4) applying a targeted blurring technique to disrupt potential backdoor triggers. Together, these steps ensure that suspicious data is detected early and sanitized effectively, thereby minimizing the influence of backdoor triggers on the global model. Experimental evaluations on image-based datasets demonstrate that FL-PBM reduces attack success rates by up to 95% compared to baseline federated learning (FedAvg) and by 30 to 80% relative to state-of-the-art defenses (RDFL and LPSF). At the same time, it maintains over 90% clean model accuracy in most experiments, achieving better mitigation without degrading model performance.
- Abstract(参考訳): バックドア攻撃は人工知能(AI)モデルの完全性と信頼性に大きな脅威となり、敵は隠れたトリガーで有毒なデータを注入することでモデルの振る舞いを操作できる。
これらの攻撃は、特に自動運転、ヘルスケア、金融といった重要な応用において、深刻な結果をもたらす可能性がある。
バックドア攻撃の検出と緩和は、プレトレーニング、イントレーニング、ポストトレーニングを含むモデルフェーズの寿命において不可欠である。
本稿では,フェデレートラーニング(FL)環境でモデルトレーニングを行う前に,クライアント側で有毒データを積極的にフィルタリングする新しい防衛機構であるFL-PBMについて述べる。
本手法は,(1)データに良性トリガを挿入して制御ベースラインを確立すること,(2)主成分分析(PCA)を用いて識別特徴を抽出し,データの分離性を評価すること,(3)PCA変換空間における分布に基づいて潜在的に悪意のあるデータサンプルを識別するガウス混合モデル(GMM)クラスタリングを行うこと,(4)潜在的なバックドアトリガを妨害する標的ぼけ技術を適用すること,の3段階からなる。
これらのステップにより、疑わしいデータが早期に検出され、効果的に衛生化され、グローバルモデルに対するバックドアトリガーの影響を最小限に抑えることができる。
画像ベースデータセットを用いた実験により、FL-PBMはベースラインフェデレーション学習(FedAvg)と比較して攻撃成功率を最大95%、最先端防御(RDFL、LPSF)に対して30~80%削減することが示された。
同時に、ほとんどの実験では90%以上のクリーンモデル精度を維持し、モデル性能を劣化させることなく、より良い緩和を実現している。
関連論文リスト
- GShield: Mitigating Poisoning Attacks in Federated Learning [2.6260952524631787]
Federated Learning (FL) は、最近、機械学習モデルを協調訓練するための革命的なアプローチとして登場した。
データプライバシを保護しながら、分散モデルのトレーニングを可能にするが、その分散特性により、Data Poisoningとして知られる深刻な攻撃に対して、非常に脆弱である。
我々はGShieldと呼ばれる新しい防御機構を提案し、悪質で低品質な更新を検知・緩和する。
論文 参考訳(メタデータ) (2025-12-22T11:29:28Z) - Evaluating Query Efficiency and Accuracy of Transfer Learning-based Model Extraction Attack in Federated Learning [4.275908952997288]
Federated Learning(FL)は、クライアントデータを保護するために設計された協調学習フレームワークである。
FLのプライバシ保護の目標にもかかわらず、その分散した性質は特に抽出攻撃のモデルに感受性がある。
本稿では,FLをベースとした2種類のモデル抽出攻撃に対する被害者モデルの脆弱性について検討する。
論文 参考訳(メタデータ) (2025-05-25T22:40:10Z) - Securing Genomic Data Against Inference Attacks in Federated Learning Environments [0.31570310818616687]
Federated Learning(FL)は、直接的なデータ共有なしに、分散されたゲノムデータセット間で機械学習モデルを協調的にトレーニングする、有望なフレームワークを提供する。
このアプローチはデータの局所性を保っているが、個人のプライバシーを侵害する可能性のある高度な推論攻撃の影響を受けやすい。
本研究では,合成ゲノムデータを用いてフェデレートされた学習環境をシミュレートし,その脆弱性を3つの攻撃ベクトルに評価する。
論文 参考訳(メタデータ) (2025-05-12T02:36:50Z) - Towards Robust Federated Learning via Logits Calibration on Non-IID Data [49.286558007937856]
Federated Learning(FL)は、エッジネットワークにおける分散デバイスの共同モデルトレーニングに基づく、プライバシ保護のための分散管理フレームワークである。
近年の研究では、FLは敵の例に弱いことが示されており、その性能は著しく低下している。
本研究では,対戦型訓練(AT)フレームワークを用いて,対戦型実例(AE)攻撃に対するFLモデルの堅牢性を向上させる。
論文 参考訳(メタデータ) (2024-03-05T09:18:29Z) - FreqFed: A Frequency Analysis-Based Approach for Mitigating Poisoning
Attacks in Federated Learning [98.43475653490219]
フェデレート・ラーニング(Federated Learning, FL)は、毒素による攻撃を受けやすい。
FreqFedは、モデルの更新を周波数領域に変換する新しいアグリゲーションメカニズムである。
FreqFedは, 凝集モデルの有用性に悪影響を及ぼすことなく, 毒性攻撃を効果的に軽減できることを実証した。
論文 参考訳(メタデータ) (2023-12-07T16:56:24Z) - Avoid Adversarial Adaption in Federated Learning by Multi-Metric
Investigations [55.2480439325792]
Federated Learning(FL)は、分散機械学習モデルのトレーニング、データのプライバシの保護、通信コストの低減、多様化したデータソースによるモデルパフォーマンスの向上を支援する。
FLは、中毒攻撃、標的外のパフォーマンス劣化とターゲットのバックドア攻撃の両方でモデルの整合性を損なうような脆弱性に直面している。
我々は、複数の目的に同時に適応できる、強い適応的敵の概念を新たに定義する。
MESASは、実際のデータシナリオで有効であり、平均オーバーヘッドは24.37秒である。
論文 参考訳(メタデータ) (2023-06-06T11:44:42Z) - FLIP: A Provable Defense Framework for Backdoor Mitigation in Federated
Learning [66.56240101249803]
我々は,クライアントの強固化がグローバルモデル(および悪意のあるクライアント)に与える影響について検討する。
本稿では, 逆エンジニアリングによる防御手法を提案するとともに, 堅牢性を保証して, 改良を実現できることを示す。
競合する8つのSOTA防御法について, 単発および連続のFLバックドア攻撃に対して, 提案手法の実証的優位性を示した。
論文 参考訳(メタデータ) (2022-10-23T22:24:03Z) - FL-Defender: Combating Targeted Attacks in Federated Learning [7.152674461313707]
フェデレートラーニング(FL)は、グローバル機械学習モデルを、参加する労働者のセット間で分散されたローカルデータから学習することを可能にする。
FLは、学習モデルの完全性に悪影響を及ぼす標的の毒殺攻撃に対して脆弱である。
FL標的攻撃に対抗する手段として,textitFL-Defenderを提案する。
論文 参考訳(メタデータ) (2022-07-02T16:04:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。