Fugu-MT 論文翻訳(概要): Knowledge Distillation-Based Model Extraction Attack using GAN-based Private Counterfactual Explanations

論文の概要: Knowledge Distillation-Based Model Extraction Attack using GAN-based Private Counterfactual Explanations

arxiv url: http://arxiv.org/abs/2404.03348v2
Date: Tue, 22 Oct 2024 09:31:49 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:31.69835
Title: Knowledge Distillation-Based Model Extraction Attack using GAN-based Private Counterfactual Explanations
Title（参考訳）: GANに基づく私的擬似説明を用いた知識蒸留モデル抽出攻撃
Authors: Fatima Ezzeddine, Omran Ayoub, Silvia Giordano,
Abstract要約: 本稿では,ML プラットフォーム内で MEA を実行する上で,モデル説明,特に非現実的説明をどのように活用できるかを検討することに注力する。本稿では,代替モデルの抽出効率を高めるため,知識蒸留(KD)に基づくMEAの新しいアプローチを提案する。また,差分プライバシー(DP)の有効性を緩和戦略として評価した。
参考スコア（独自算出の注目度）: 1.6576983459630268
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In recent years, there has been a notable increase in the deployment of machine learning (ML) models as services (MLaaS) across diverse production software applications. In parallel, explainable AI (XAI) continues to evolve, addressing the necessity for transparency and trustworthiness in ML models. XAI techniques aim to enhance the transparency of ML models by providing insights, in terms of model's explanations, into their decision-making process. Simultaneously, some MLaaS platforms now offer explanations alongside the ML prediction outputs. This setup has elevated concerns regarding vulnerabilities in MLaaS, particularly in relation to privacy leakage attacks such as model extraction attacks (MEA). This is due to the fact that explanations can unveil insights about the inner workings of the model which could be exploited by malicious users. In this work, we focus on investigating how model explanations, particularly counterfactual explanations (CFs), can be exploited for performing MEA within the MLaaS platform. We also delve into assessing the effectiveness of incorporating differential privacy (DP) as a mitigation strategy. To this end, we first propose a novel approach for MEA based on Knowledge Distillation (KD) to enhance the efficiency of extracting a substitute model of a target model exploiting CFs, without any knowledge about the training data distribution by the attacker. Then, we advise an approach for training CF generators incorporating DP to generate private CFs. We conduct thorough experimental evaluations on real-world datasets and demonstrate that our proposed KD-based MEA can yield a high-fidelity substitute model with a reduced number of queries with respect to baseline approaches. Furthermore, our findings reveal that including a privacy layer can allow mitigating the MEA. However, on the account of the quality of CFs, impacts the performance of the explanations.
Abstract（参考訳）: 近年、さまざまなプロダクションソフトウェアアプリケーションにまたがる機械学習(ML)モデルのサービス(MLaaS)への展開が顕著に増加している。並行して、説明可能なAI(XAI)は進化を続け、MLモデルにおける透明性と信頼性の必要性に対処する。 XAI技術は、モデルの説明の観点から、意思決定プロセスに洞察を提供することにより、MLモデルの透明性を高めることを目的としている。同時に、MLaaSプラットフォームの一部では、ML予測出力とともに説明が提供されている。このセットアップはMLaaSの脆弱性、特にモデル抽出攻撃(MEA)などのプライバシリーク攻撃に関する懸念を高める。これは、悪意のあるユーザによって悪用される可能性のあるモデルの内部動作に関する洞察を説明できるためである。本研究では,MLaaSプラットフォーム内でMEAを実行する上で,モデル説明,特に非現実的説明(CF)をどのように活用できるかを検討することに焦点を当てる。また,ディファレンシャルプライバシ(DP)を緩和戦略として組み込むことの有効性について検討した。そこで本研究では,まず知識蒸留(KD)に基づくMEAの新しいアプローチを提案し,攻撃者によるトレーニングデータ分布の知識を必要とせず,CFを利用した対象モデルの代用モデルを抽出する効率を向上する。そこで我々は,DPを取り入れたCFジェネレータを訓練してプライベートCFを生成する手法を提案する。実世界のデータセットについて徹底的な実験を行い、提案したKDベースのMEAが、ベースラインアプローチに対するクエリの少ない高忠実度代用モデルが得られることを示す。さらに,プライバシー層を組み込むことでMEAを緩和できることが明らかとなった。しかし、CFの品質を考慮すると、説明のパフォーマンスに影響を与えます。

関連論文リスト

Explanations Leak: Membership Inference with Differential Privacy and Active Learning Defense [0.5249805590164901]
対物的説明(CF)は、透明性を改善するために機械学習・アズ・ア・サービス(ML)システムに統合されつつある。我々は、メンバシップ推論攻撃(MIA)を強化することにより、CFがMLの攻撃面をどのように拡張するかという問題に焦点をあてる。本稿では,DPとアクティブラーニング(AL)を統合した防衛フレームワークを提案する。
論文参考訳（メタデータ） (2026-02-03T15:04:09Z)
Membership Inference Attack against Large Language Model-based Recommendation Systems: A New Distillation-based Paradigm [0.0]
メンバーシップ推論攻撃(MIA)は、特定のデータサンプルがターゲットモデルのトレーニングデータセットに含まれているかどうかを判断することを目的としている。本稿では,Large Language Model(LLM)に基づくレコメンデーションシステムに適した知識蒸留に基づくMIAパラダイムを提案する。
論文参考訳（メタデータ） (2025-09-16T09:36:43Z)
Vad-R1: Towards Video Anomaly Reasoning via Perception-to-Cognition Chain-of-Thought [58.321044666612174]
Vad-R1は、ビデオ異常推論のためのエンドツーエンドのMLLMベースのフレームワークである。我々は、異常を認識する人間の過程をシミュレートするパーセプション・トゥ・コグニション・チェーン・オブ・ワット(P2C-CoT)を設計する。また,MLLMの異常推論能力を明示的に動機付ける改良型強化学習アルゴリズムAVA-GRPOを提案する。
論文参考訳（メタデータ） (2025-05-26T12:05:16Z)
On the interplay of Explainability, Privacy and Predictive Performance with Explanation-assisted Model Extraction [2.654271808710367]
差分プライバシー(DP)を利用する場合のモデル性能、プライバシ、説明可能性のトレードオフについて検討する。モデル抽出(MEA)攻撃を緩和するための2つのDP戦略を評価する。
論文参考訳（メタデータ） (2025-05-13T15:27:06Z)
Verifying Machine Unlearning with Explainable AI [46.7583989202789]
港の前面監視における機械学習(MU)の検証における説明可能なAI(XAI)の有効性について検討する。私たちの概念実証は、従来のメトリクスを超えて拡張されたMUの革新的な検証ステップとして属性機能を導入しています。本稿では,これらの手法の有効性を評価するために,熱マップカバレッジ(HC)とアテンションシフト(AS)の2つの新しいXAI指標を提案する。
論文参考訳（メタデータ） (2024-11-20T13:57:32Z)
Influence Functions for Scalable Data Attribution in Diffusion Models [52.92223039302037]
拡散モデルは、生成的モデリングに大きな進歩をもたらした。しかし、彼らの普及はデータ属性と解釈可能性に関する課題を引き起こす。本稿では,テキスト・インフルエンス・ファンクション・フレームワークを開発することにより,このような課題に対処することを目的とする。
論文参考訳（メタデータ） (2024-10-17T17:59:02Z)
Privacy Implications of Explainable AI in Data-Driven Systems [0.0]
機械学習(ML)モデルは、解釈可能性の欠如に悩まされる。透明性の欠如は、しばしばMLモデルのブラックボックスの性質と呼ばれ、信頼を損なう。 XAI技術は、内部の意思決定プロセスを説明するためのフレームワークと方法を提供することによって、この問題に対処する。
論文参考訳（メタデータ） (2024-06-22T08:51:58Z)
MIA-BAD: An Approach for Enhancing Membership Inference Attack and its Mitigation with Federated Learning [6.510488168434277]
メンバシップ推論攻撃(MIA)は、機械学習(ML)モデルのプライバシを妥協するための一般的なパラダイムである。バッチ・ワイズ・アサート・データセット(MIA-BAD)を用いた強化されたメンバーシップ推論攻撃を提案する。 FLを用いたMLモデルのトレーニング方法を示すとともに,提案したMIA-BADアプローチによる脅威をFLアプローチで緩和する方法について検討する。
論文参考訳（メタデータ） (2023-11-28T06:51:26Z)
Faithful Explanations of Black-box NLP Models Using LLM-generated Counterfactuals [67.64770842323966]
NLPシステムの予測に関する因果的説明は、安全性を確保し、信頼を確立するために不可欠である。既存の手法は、しばしばモデル予測を効果的または効率的に説明できない。本稿では, 対物近似(CF)の2つの手法を提案する。
論文参考訳（メタデータ） (2023-10-01T07:31:04Z)
Evaluating and Explaining Large Language Models for Code Using Syntactic Structures [74.93762031957883]
本稿では,コード用大規模言語モデルに特有の説明可能性手法であるASTxplainerを紹介する。その中核にあるASTxplainerは、トークン予測をASTノードに整合させる自動メソッドを提供する。私たちは、最も人気のあるGitHubプロジェクトのキュレートデータセットを使用して、コード用の12の人気のあるLLMに対して、実証的な評価を行います。
論文参考訳（メタデータ） (2023-08-07T18:50:57Z)
DualCF: Efficient Model Extraction Attack from Counterfactual Explanations [57.46134660974256]
クラウドサービスプロバイダがMachine-Learning-as-a-Serviceプラットフォームをローンチした。このような余分な情報は、必然的にクラウドモデルが、抽出攻撃に対してより脆弱になる。本稿では,分類モデルを盗むためのクエリ効率を大幅に向上させる,新しい単純で効率的なクエリ手法を提案する。
論文参考訳（メタデータ） (2022-05-13T08:24:43Z)
ReLACE: Reinforcement Learning Agent for Counterfactual Explanations of Arbitrary Predictive Models [6.939617874336667]
本稿では,最適対実的説明を生成するためのモデルに依存しないアルゴリズムを提案する。本手法は,DRLエージェントが相互作用する環境に類似するため,任意のブラックボックスモデルに容易に適用できる。さらに,DRLエージェントのポリシーから説明可能な決定ルールを抽出し,CF自体を透過的に生成するアルゴリズムを開発した。
論文参考訳（メタデータ） (2021-10-22T17:08:49Z)
EG-Booster: Explanation-Guided Booster of ML Evasion Attacks [3.822543555265593]
本稿では,説明可能なMLの手法を活用して,敵対的事例作成をガイドするEG-Boosterという新しい手法を提案する。 EG-Boosterはアーキテクチャや脅威モデルをモデル化しておらず、以前文献で使われていた様々な距離メトリクスをサポートする。以上の結果から,EG-Boosterは回避率を著しく向上し,摂動回数の減少が示唆された。
論文参考訳（メタデータ） (2021-08-31T15:36:16Z)
Transfer Learning without Knowing: Reprogramming Black-box Machine Learning Models with Scarce Data and Limited Resources [78.72922528736011]
そこで我々は,ブラックボックス・アタベラル・リプログラミング (BAR) という新しい手法を提案する。ゼロオーダー最適化とマルチラベルマッピング技術を用いて、BARは入力出力応答のみに基づいてブラックボックスMLモデルをプログラムする。 BARは最先端の手法より優れ、バニラ対逆プログラミング法に匹敵する性能を得る。
論文参考訳（メタデータ） (2020-07-17T01:52:34Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。