論文の概要: Defending against adversarial attacks using mixture of experts
- arxiv url: http://arxiv.org/abs/2512.20821v1
- Date: Tue, 23 Dec 2025 22:46:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-25 19:43:21.622619
- Title: Defending against adversarial attacks using mixture of experts
- Title(参考訳): 専門家の混在による敵攻撃に対する防御
- Authors: Mohammad Meymani, Roozbeh Razavi-Far,
- Abstract要約: 敵対的脅威は、機械学習モデルがその目的を満たすのを妨げることを目的としている。
本稿では,エキスパートの混在するアーキテクチャにおいて,対戦型トレーニングモジュールを考案する防衛システムを提案する。
- 参考スコア(独自算出の注目度): 1.3578741464318356
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine learning is a powerful tool enabling full automation of a huge number of tasks without explicit programming. Despite recent progress of machine learning in different domains, these models have shown vulnerabilities when they are exposed to adversarial threats. Adversarial threats aim to hinder the machine learning models from satisfying their objectives. They can create adversarial perturbations, which are imperceptible to humans' eyes but have the ability to cause misclassification during inference. Moreover, they can poison the training data to harm the model's performance or they can query the model to steal its sensitive information. In this paper, we propose a defense system, which devises an adversarial training module within mixture-of-experts architecture to enhance its robustness against adversarial threats. In our proposed defense system, we use nine pre-trained experts with ResNet-18 as their backbone. During end-to-end training, the parameters of expert models and gating mechanism are jointly updated allowing further optimization of the experts. Our proposed defense system outperforms state-of-the-art defense systems and plain classifiers, which use a more complex architecture than our model's backbone.
- Abstract(参考訳): 機械学習は、明示的なプログラミングなしで膨大なタスクの完全な自動化を可能にする強力なツールである。
異なるドメインでの機械学習の最近の進歩にもかかわらず、これらのモデルは敵の脅威にさらされると脆弱性を示す。
敵対的脅威は、機械学習モデルがその目的を満たすのを妨げることを目的としている。
逆行性摂動は人間の目には知覚できないが、推論中に誤分類を引き起こす能力を持つ。
さらに、トレーニングデータを悪用してモデルのパフォーマンスを損なったり、モデルをクエリして機密情報を盗むこともできる。
本稿では,敵の脅威に対する堅牢性を高めるために,エキスパートの混在するアーキテクチャにおいて,敵の訓練モジュールを考案する防衛システムを提案する。
提案する防衛システムでは,ResNet-18をバックボーンとして使用する。
エンドツーエンドのトレーニングでは、エキスパートモデルのパラメータとゲーティングメカニズムが共同で更新され、専門家のさらなる最適化が可能になる。
提案するディフェンスシステムは,モデルバックボーンよりも複雑なアーキテクチャを用いて,最先端のディフェンスシステムや平易な分類器よりも優れている。
関連論文リスト
- Exploiting Edge Features for Transferable Adversarial Attacks in Distributed Machine Learning [54.26807397329468]
この研究は、分散ディープラーニングシステムにおいて、これまで見過ごされていた脆弱性を探究する。
中間的特徴をインターセプトする敵は、依然として深刻な脅威となる可能性がある。
本稿では,分散環境に特化して設計されたエクスプロイト戦略を提案する。
論文 参考訳(メタデータ) (2025-07-09T20:09:00Z) - DUMB and DUMBer: Is Adversarial Training Worth It in the Real World? [15.469010487781931]
敵の例は小さく、しばしば、愚かな機械学習モデルのために作られた、知覚不能な摂動である。
侵入攻撃(英語: Evasion attack)とは、入力がテスト時に誤分類を引き起こすように修正される敵攻撃の一種であり、その伝達性のために特に不快である。
本稿では,DUMB法の基礎の上に構築された攻撃フレームワークであるDUMBerを紹介し,敵の訓練したモデルの弾力性を評価する。
論文 参考訳(メタデータ) (2025-06-23T11:16:21Z) - Taking off the Rose-Tinted Glasses: A Critical Look at Adversarial ML Through the Lens of Evasion Attacks [11.830908033835728]
我々は、過度に寛容な攻撃と過度に制限された防衛脅威モデルが、MLドメインにおける防衛開発を妨げていると主張している。
我々は、AIの観点からではなく、システムセキュリティの観点から、敵対的機械学習を分析する。
論文 参考訳(メタデータ) (2024-10-15T21:33:23Z) - A Novel Approach to Guard from Adversarial Attacks using Stable Diffusion [0.0]
我々の提案は、AI Guardianフレームワークに対する別のアプローチを提案する。
トレーニングプロセスに敵対的な例を含める代わりに、AIシステムをトレーニングせずに行うことを提案する。
これは、より広い範囲の攻撃に対して本質的に回復力のあるシステムを構築することを目的としています。
論文 参考訳(メタデータ) (2024-05-03T04:08:15Z) - Isolation and Induction: Training Robust Deep Neural Networks against
Model Stealing Attacks [51.51023951695014]
既存のモデル盗難防衛は、被害者の後部確率に偽りの摂動を加え、攻撃者を誤解させる。
本稿では,モデルステルス防衛のための新規かつ効果的なトレーニングフレームワークである分離誘導(InI)を提案する。
モデルの精度を損なうモデル予測に摂動を加えるのとは対照的に、我々はモデルを訓練して、盗むクエリに対して非形式的なアウトプットを生成する。
論文 参考訳(メタデータ) (2023-08-02T05:54:01Z) - Self-Destructing Models: Increasing the Costs of Harmful Dual Uses of
Foundation Models [103.71308117592963]
本稿ではメタラーニングと逆学習の技法を活用した自己破壊モデルの学習アルゴリズムを提案する。
小規模な実験では、MLACは、BERTスタイルのモデルが性別識別を行うために再目的化されることをほとんど防ぐことができることを示す。
論文 参考訳(メタデータ) (2022-11-27T21:43:45Z) - A Framework for Understanding Model Extraction Attack and Defense [48.421636548746704]
我々は,モデルユーティリティとユーザとのトレードオフと,敵の視点によるプライバシについて検討する。
我々は,このようなトレードオフを定量化し,その理論的特性を分析し,最適な敵攻撃・防衛戦略を理解するための最適化問題を開発する。
論文 参考訳(メタデータ) (2022-06-23T05:24:52Z) - A Tutorial on Adversarial Learning Attacks and Countermeasures [0.0]
機械学習モデルは、それを明示的にプログラムすることなく、高精度な予測を行うことができる。
敵の学習攻撃は 深刻なセキュリティの脅威を 引き起こす
本稿では、敵対的学習の原理を詳細に解説し、異なる攻撃シナリオを説明し、この脅威に対する最先端の防御機構について深い洞察を与える。
論文 参考訳(メタデータ) (2022-02-21T17:14:45Z) - Automating Privilege Escalation with Deep Reinforcement Learning [71.87228372303453]
本研究では,エージェントの訓練に深層強化学習を用いることで,悪意あるアクターの潜在的な脅威を実証する。
本稿では,最先端の強化学習アルゴリズムを用いて,局所的な特権エスカレーションを行うエージェントを提案する。
我々のエージェントは、実際の攻撃センサーデータを生成し、侵入検知システムの訓練と評価に利用できる。
論文 参考訳(メタデータ) (2021-10-04T12:20:46Z) - Enhanced Adversarial Strategically-Timed Attacks against Deep
Reinforcement Learning [91.13113161754022]
本稿では,DRLに基づくナビゲーションシステムに対して,選択した時間フレーム上の物理ノイズパターンを妨害することにより,タイミングに基づく逆方向戦略を導入する。
実験結果から, 対向タイミング攻撃は性能低下を引き起こす可能性が示唆された。
論文 参考訳(メタデータ) (2020-02-20T21:39:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。