Fugu-MT 論文翻訳(概要): Statistical Privacy Guarantees of Machine Learning Preprocessing Techniques

論文の概要: Statistical Privacy Guarantees of Machine Learning Preprocessing Techniques

arxiv url: http://arxiv.org/abs/2109.02496v1
Date: Mon, 6 Sep 2021 14:08:47 GMT
ステータス: 翻訳完了
システム内更新日: 2021-09-07 21:41:26.285295
Title: Statistical Privacy Guarantees of Machine Learning Preprocessing Techniques
Title（参考訳）: 機械学習前処理技術の統計的プライバシー保証
Authors: Ashly Lau and Jonathan Passerat-Palmbach
Abstract要約: 機械学習パイプラインのプライバシレベルを測定するために,統計的手法に基づくプライバシ違反検出フレームワークを適用した。新たに作成されたフレームワークを適用して、不均衡なデータセットを扱う際に使用される再サンプリング技術によって、結果のモデルがよりプライバシーを漏洩することを示す。
参考スコア（独自算出の注目度）: 1.198727138090351
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Differential privacy provides strong privacy guarantees for machine learning applications. Much recent work has been focused on developing differentially private models, however there has been a gap in other stages of the machine learning pipeline, in particular during the preprocessing phase. Our contributions are twofold: we adapt a privacy violation detection framework based on statistical methods to empirically measure privacy levels of machine learning pipelines, and apply the newly created framework to show that resampling techniques used when dealing with imbalanced datasets cause the resultant model to leak more privacy. These results highlight the need for developing private preprocessing techniques.
Abstract（参考訳）: 差分プライバシーは、機械学習アプリケーションに対して強力なプライバシー保証を提供する。最近の研究は、微分プライベートモデルの開発に重点を置いているが、機械学習パイプラインの他のステージ、特に前処理フェーズではギャップがあった。統計的手法に基づいたプライバシ侵害検出フレームワークを採用して、マシンラーニングパイプラインのプライバシレベルを実証的に測定し、新たに作成されたフレームワークを適用して、不均衡なデータセットを扱う際に使用されるサンプルテクニックが、結果としてプライバシを漏洩させることを示したのです。これらの結果は、プライベートな前処理技術を開発する必要性を強調している。

関連論文リスト

Differential Privacy in Machine Learning: From Symbolic AI to LLMs [49.1574468325115]
差別化プライバシは、プライバシーリスクを軽減するための正式なフレームワークを提供する。単一のデータポイントの包含や除外がアルゴリズムの出力を著しく変更しないことを保証する。
論文参考訳（メタデータ） (2025-06-13T11:30:35Z)
Differentially Private Random Feature Model [52.468511541184895]
プライバシを保存するカーネルマシンに対して,差分的にプライベートな特徴モデルを作成する。本手法は,プライバシを保護し,一般化誤差を導出する。
論文参考訳（メタデータ） (2024-12-06T05:31:08Z)
Masked Differential Privacy [64.32494202656801]
本稿では,差分プライバシーを適用した機密領域を制御できる「マスク型差分プライバシー(DP)」という効果的なアプローチを提案する。提案手法はデータに基づいて選択的に動作し,DPアプリケーションや差分プライバシーをデータサンプル内の他のプライバシー技術と組み合わせることなく,非感性時間領域を定義できる。
論文参考訳（メタデータ） (2024-10-22T15:22:53Z)
Scalable Differential Privacy Mechanisms for Real-Time Machine Learning Applications [0.0]
大規模言語モデル(LLM)は、ユーザのプライバシ保護が最重要であるリアルタイム機械学習アプリケーションに、ますます統合されている。従来の差分プライバシーメカニズムは、プライバシーと精度のバランスをとるのに苦労することが多い。当社では,堅牢なプライバシ保証とモデルパフォーマンスの向上を重視した,リアルタイム機械学習に適したフレームワークであるScalable Differential Privacy(SDP)を紹介した。
論文参考訳（メタデータ） (2024-09-16T20:52:04Z)
Provable Privacy with Non-Private Pre-Processing [56.770023668379615]
非プライベートなデータ依存前処理アルゴリズムによって生じる追加のプライバシーコストを評価するための一般的なフレームワークを提案する。当社のフレームワークは,2つの新しい技術的概念を活用することにより,全体的なプライバシー保証の上限を確立する。
論文参考訳（メタデータ） (2024-03-19T17:54:49Z)
A Unified View of Differentially Private Deep Generative Modeling [60.72161965018005]
プライバシー上の懸念のあるデータには、データアクセスとデータ共有を頻繁に禁止する厳格な規制が伴う。これらの障害を克服することは、プライバシーに敏感なデータを含む多くの現実世界のアプリケーションシナリオにおいて、技術的進歩の鍵となる。差分的プライベート(DP)データパブリッシングは、データの衛生化された形式のみを公開する、魅力的なソリューションを提供する。
論文参考訳（メタデータ） (2023-09-27T14:38:16Z)
Privacy Side Channels in Machine Learning Systems [87.53240071195168]
プライバシサイドチャネルは、システムレベルのコンポーネントを利用してプライベート情報を抽出する攻撃である。例えば、差分プライベートなトレーニングを適用する前にトレーニングデータを重複させることで、保証可能なプライバシ保証を完全に無効にするサイドチャネルが生成されることを示す。さらに,学習データセットに含まれる秘密鍵を抽出するために,言語モデルを学習データ再生からブロックするシステムを利用することを示す。
論文参考訳（メタデータ） (2023-09-11T16:49:05Z)
Approximate, Adapt, Anonymize (3A): a Framework for Privacy Preserving Training Data Release for Machine Learning [3.29354893777827]
データリリースフレームワークである3A(Approximate, Adapt, Anonymize)を導入し、機械学習のデータユーティリティを最大化する。本稿では,実データセットと民生データセットでトレーニングしたモデルの性能指標の相違が最小限に抑えられることを示す実験的な証拠を示す。
論文参考訳（メタデータ） (2023-07-04T18:37:11Z)
Tight Auditing of Differentially Private Machine Learning [77.38590306275877]
プライベート機械学習では、既存の監査メカニズムは厳格である。彼らは不確実な最悪の仮定の下でのみ厳密な見積もりを行う。我々は、自然(逆向きではない)データセットの厳密なプライバシー推定を得られる改善された監査スキームを設計する。
論文参考訳（メタデータ） (2023-02-15T21:40:33Z)
A Survey on Differential Privacy with Machine Learning and Future Outlook [0.0]
差分プライバシーは、あらゆる攻撃や脆弱性から機械学習モデルを保護するために使用される。本稿では,2つのカテゴリに分類される差分プライベート機械学習アルゴリズムについて述べる。
論文参考訳（メタデータ） (2022-11-19T14:20:53Z)
Private Set Generation with Discriminative Information [63.851085173614]
異なるプライベートなデータ生成は、データプライバシの課題に対する有望な解決策である。既存のプライベートな生成モデルは、合成サンプルの有用性に苦慮している。我々は,最先端アプローチのサンプルユーティリティを大幅に改善する,シンプルで効果的な手法を提案する。
論文参考訳（メタデータ） (2022-11-07T10:02:55Z)
A General Framework for Auditing Differentially Private Machine Learning [27.99806936918949]
本稿では,差分プライベートな学習者によって与えられるプライバシ保証を統計的に評価する枠組みを提案する。本研究は、微分プライベート機械学習実装のプライバシを実証的に評価する一般的な手法を開発する。
論文参考訳（メタデータ） (2022-10-16T21:34:18Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。