Fugu-MT 論文翻訳(概要): A Framework for Understanding Model Extraction Attack and Defense

論文の概要: A Framework for Understanding Model Extraction Attack and Defense

arxiv url: http://arxiv.org/abs/2206.11480v1
Date: Thu, 23 Jun 2022 05:24:52 GMT
ステータス: 翻訳完了
システム内更新日: 2022-06-24 14:35:58.848983
Title: A Framework for Understanding Model Extraction Attack and Defense
Title（参考訳）: モデル抽出攻撃と防御の理解のための枠組み
Authors: Xun Xian, Mingyi Hong, Jie Ding
Abstract要約: 我々は,モデルユーティリティとユーザとのトレードオフと,敵の視点によるプライバシについて検討する。我々は,このようなトレードオフを定量化し,その理論的特性を分析し,最適な敵攻撃・防衛戦略を理解するための最適化問題を開発する。
参考スコア（独自算出の注目度）: 48.421636548746704
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The privacy of machine learning models has become a significant concern in many emerging Machine-Learning-as-a-Service applications, where prediction services based on well-trained models are offered to users via pay-per-query. The lack of a defense mechanism can impose a high risk on the privacy of the server's model since an adversary could efficiently steal the model by querying only a few `good' data points. The interplay between a server's defense and an adversary's attack inevitably leads to an arms race dilemma, as commonly seen in Adversarial Machine Learning. To study the fundamental tradeoffs between model utility from a benign user's view and privacy from an adversary's view, we develop new metrics to quantify such tradeoffs, analyze their theoretical properties, and develop an optimization problem to understand the optimal adversarial attack and defense strategies. The developed concepts and theory match the empirical findings on the `equilibrium' between privacy and utility. In terms of optimization, the key ingredient that enables our results is a unified representation of the attack-defense problem as a min-max bi-level problem. The developed results will be demonstrated by examples and experiments.
Abstract（参考訳）: 機械学習モデルのプライバシは、多くの新興のMachine-Learning-as-a-Serviceアプリケーションにおいて重要な関心事となっている。防御機構の欠如は、いくつかの「良い」データポイントのみをクエリすることで、敵が効率的にモデルを盗むことができるため、サーバモデルのプライバシに高いリスクを課す可能性がある。サーバーの防御と敵の攻撃の間の相互作用は必然的に武器競争のジレンマにつながり、敵の機械学習でよく見られる。敵の視点からモデルユーティリティとプライバシの基本的なトレードオフを研究するために,このようなトレードオフを定量化し,理論的特性を分析し,最適な敵攻撃・防衛戦略を理解するための最適化問題を開発する。開発された概念と理論は、プライバシとユーティリティの‘平衡’に関する経験的知見と一致する。最適化の面では,攻撃防御問題をmin-maxバイレベル問題として統一的に表現することが重要な要素である。開発結果は実例と実験によって実証される。

関連論文リスト

A Systematic Survey of Model Extraction Attacks and Defenses: State-of-the-Art and Perspectives [65.3369988566853]
近年の研究では、敵が対象モデルの機能を複製できることが示されている。モデル抽出攻撃は知的財産権、プライバシー、システムのセキュリティに脅威をもたらす。本稿では,攻撃機構,防衛手法,計算環境に応じてMEAを分類する新しい分類法を提案する。
論文参考訳（メタデータ） (2025-08-20T19:49:59Z)
MISLEADER: Defending against Model Extraction with Ensembles of Distilled Models [56.09354775405601]
モデル抽出攻撃は、クエリアクセスを通じてブラックボックスモデルの機能を複製することを目的としている。既存のディフェンスでは、アタッカークエリにはオフ・オブ・ディストリビューション(OOD)サンプルがあることを前提としており、不審な入力を検出し破壊することができる。 OOD仮定に依存しない新しい防衛戦略であるMISLEADERを提案する。
論文参考訳（メタデータ） (2025-06-03T01:37:09Z)
Model Privacy: A Unified Framework to Understand Model Stealing Attacks and Defenses [11.939472526374246]
この研究は、モデルプライバシ(Model Privacy)と呼ばれるフレームワークを提示し、モデル盗難攻撃と防御を包括的に分析する基盤を提供する。本稿では,攻撃戦略と防衛戦略の妥当性を定量化する手法を提案し,MLモデルにおけるユーティリティとプライバシの基本的なトレードオフを分析する。
論文参考訳（メタデータ） (2025-02-21T16:29:11Z)
Privacy Backdoors: Enhancing Membership Inference through Poisoning Pre-trained Models [112.48136829374741]
本稿では、プライバシーバックドア攻撃という新たな脆弱性を明らかにします。被害者がバックドアモデルに微調整を行った場合、トレーニングデータは通常のモデルに微調整された場合よりも大幅に高い速度でリークされる。我々の発見は、機械学習コミュニティにおける重要なプライバシー上の懸念を浮き彫りにし、オープンソースの事前訓練モデルの使用における安全性プロトコルの再評価を求めている。
論文参考訳（メタデータ） (2024-04-01T16:50:54Z)
Designing an attack-defense game: how to increase robustness of financial transaction models via a competition [69.08339915577206]
金融セクターにおける悪意ある攻撃のエスカレートリスクを考えると、機械学習モデルの敵戦略と堅牢な防御メカニズムを理解することが重要である。本研究の目的は、逐次的な財務データを入力として使用するニューラルネットワークモデルに対する敵攻撃と防御の現状とダイナミクスを調査することである。我々は、現代の金融取引データにおける問題の現実的かつ詳細な調査を可能にする競争を設計した。参加者は直接対決するので、実生活に近い環境で攻撃や防御が検討される。
論文参考訳（メタデータ） (2023-08-22T12:53:09Z)
Avoid Adversarial Adaption in Federated Learning by Multi-Metric Investigations [55.2480439325792]
Federated Learning(FL)は、分散機械学習モデルのトレーニング、データのプライバシの保護、通信コストの低減、多様化したデータソースによるモデルパフォーマンスの向上を支援する。 FLは、中毒攻撃、標的外のパフォーマンス劣化とターゲットのバックドア攻撃の両方でモデルの整合性を損なうような脆弱性に直面している。我々は、複数の目的に同時に適応できる、強い適応的敵の概念を新たに定義する。 MESASは、実際のデータシナリオで有効であり、平均オーバーヘッドは24.37秒である。
論文参考訳（メタデータ） (2023-06-06T11:44:42Z)
I Know What You Trained Last Summer: A Survey on Stealing Machine Learning Models and Defences [0.1031296820074812]
本研究では,モデル盗難攻撃について検討し,その性能を評価し,異なる環境で対応する防御技術を探究する。攻撃・防衛アプローチのための分類法を提案し,目標と利用可能な資源に基づいて適切な攻撃・防衛を選択する方法に関するガイドラインを提供する。
論文参考訳（メタデータ） (2022-06-16T21:16:41Z)
Self-Ensemble Adversarial Training for Improved Robustness [14.244311026737666]
敵の訓練は、あらゆる種類の防衛方法において、様々な敵の攻撃に対する最強の戦略である。最近の研究は主に新しい損失関数や正規化器の開発に重点を置いており、重み空間の特異な最適点を見つけようとしている。我々は,歴史モデルの重みを平均化し,頑健な分類器を生成するための,単純だが強力なemphSelf-Ensemble Adversarial Training (SEAT)法を考案した。
論文参考訳（メタデータ） (2022-03-18T01:12:18Z)
Federated Learning with Unreliable Clients: Performance Analysis and Mechanism Design [76.29738151117583]
Federated Learning(FL)は、分散クライアント間で効果的な機械学習モデルをトレーニングするための有望なツールとなっている。しかし、低品質のモデルは信頼性の低いクライアントによってアグリゲータサーバにアップロードすることができ、劣化やトレーニングの崩壊につながる。クライアントの信頼できない振る舞いをモデル化し、このようなセキュリティリスクを軽減するための防御メカニズムを提案する。
論文参考訳（メタデータ） (2021-05-10T08:02:27Z)
Adversarial Examples for Unsupervised Machine Learning Models [71.81480647638529]
回避予測を引き起こすアドリラルな例は、機械学習モデルの堅牢性を評価し改善するために広く利用されている。教師なしモデルに対する逆例生成の枠組みを提案し,データ拡張への新たな応用を実証する。
論文参考訳（メタデータ） (2021-03-02T17:47:58Z)
Improving Robustness to Model Inversion Attacks via Mutual Information Regularization [12.079281416410227]
本稿では,モデル逆転攻撃に対する防御機構について検討する。 MIは、ターゲット機械学習モデルへのアクセスからトレーニングデータ配布に関する情報を推測することを目的とした、プライバシ攻撃の一種である。我々はMI攻撃に対するMID(Multual Information Regularization based Defense)を提案する。
論文参考訳（メタデータ） (2020-09-11T06:02:44Z)
Learning to Learn from Mistakes: Robust Optimization for Adversarial Noise [1.976652238476722]
我々はメタ最適化器を訓練し、敵対的な例を使ってモデルを堅牢に最適化することを学び、学習した知識を新しいモデルに転送することができる。実験の結果、メタ最適化は異なるアーキテクチャやデータセット間で一貫性があることが示され、敵の脆弱性を自動的にパッチすることができることが示唆された。
論文参考訳（メタデータ） (2020-08-12T11:44:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。