Fugu-MT 論文翻訳(概要): From Principle to Practice: Vertical Data Minimization for Machine Learning

論文の概要: From Principle to Practice: Vertical Data Minimization for Machine Learning

arxiv url: http://arxiv.org/abs/2311.10500v2
Date: Wed, 22 Nov 2023 14:42:12 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-23 17:46:26.927021
Title: From Principle to Practice: Vertical Data Minimization for Machine Learning
Title（参考訳）: 原則から実践へ: 機械学習のための垂直データ最小化
Authors: Robin Staab, Nikola Jovanovi\'c, Mislav Balunovi\'c, Martin Vechev
Abstract要約: 政策立案者はデータ最小化(DM)原則の遵守をますます要求している。規制圧力にもかかわらず、DMに従う機械学習モデルをデプロイする問題は、今のところほとんど注目されていない。データ一般化に基づく新しい垂直DM(vDM)ワークフローを提案する。
参考スコア（独自算出の注目度）: 15.880586296169687
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Aiming to train and deploy predictive models, organizations collect large amounts of detailed client data, risking the exposure of private information in the event of a breach. To mitigate this, policymakers increasingly demand compliance with the data minimization (DM) principle, restricting data collection to only that data which is relevant and necessary for the task. Despite regulatory pressure, the problem of deploying machine learning models that obey DM has so far received little attention. In this work, we address this challenge in a comprehensive manner. We propose a novel vertical DM (vDM) workflow based on data generalization, which by design ensures that no full-resolution client data is collected during training and deployment of models, benefiting client privacy by reducing the attack surface in case of a breach. We formalize and study the corresponding problem of finding generalizations that both maximize data utility and minimize empirical privacy risk, which we quantify by introducing a diverse set of policy-aligned adversarial scenarios. Finally, we propose a range of baseline vDM algorithms, as well as Privacy-aware Tree (PAT), an especially effective vDM algorithm that outperforms all baselines across several settings. We plan to release our code as a publicly available library, helping advance the standardization of DM for machine learning. Overall, we believe our work can help lay the foundation for further exploration and adoption of DM principles in real-world applications.
Abstract（参考訳）: 予測モデルをトレーニングし、デプロイすることを目指して、組織は大量の詳細なクライアントデータを収集し、侵害が発生した場合にプライベート情報を暴露するリスクを負う。これを軽減するため、政策立案者はデータ最小化(dm)の原則に準拠することをますます要求し、タスクに必要なデータのみにデータ収集を制限した。規制圧力にもかかわらず、DMに従う機械学習モデルをデプロイする問題は、今のところほとんど注目されていない。本研究では,この課題を包括的に解決する。本稿では,データ一般化に基づく新しい縦型dmワークフローを提案する。このワークフローでは,モデルのトレーニングやデプロイ中に,完全なクライアントデータが収集されないよう設計し,攻撃面の低減によるクライアントのプライバシのメリットを享受する。我々は、データの有用性を最大化し、経験的プライバシーリスクを最小化する一般化を見つけるという、対応する問題を定式化し、研究する。最後に,ベースラインvDMアルゴリズムおよびプライバシ・アウェア・ツリー(PAT)を提案する。我々は、我々のコードを公開ライブラリとしてリリースし、機械学習のためのDMの標準化を進めることを計画している。全体として、我々の研究は、現実世界のアプリケーションにおけるDM原則のさらなる探求と導入の基盤となると信じています。

関連論文リスト

RobustFSM: Submodular Maximization in Federated Setting with Malicious Clients [0.5194968784739241]
本稿では,様々なクライアント攻撃に対してロバストFSMを提案する。この改善の程度は、データセットとアタックシナリオに依存します。
論文参考訳（メタデータ） (2025-11-03T20:07:21Z)
SoK: Data Minimization in Machine Learning [49.60064304454055]
データ最小化(DM)は、与えられたタスクに必要なデータのみを収集する原則を記述している。データ最小化の関連性は特に機械学習(ML)アプリケーションで顕著である。他のMLプライバシおよびセキュリティトピックに関する既存の作業は、接続を明示的に認識することなく、DMMLに関連する問題に対処することが多い。この作業では、統合データパイプライン、敵、最小化ポイントなど、DMMLの包括的なフレームワークを導入している。
論文参考訳（メタデータ） (2025-08-14T17:00:13Z)
How Quantization Impacts Privacy Risk on LLMs for Code? [8.607910400111853]
LLMs4Codeにおいて、量子化がタスク性能とプライバシリスクにどのように影響するかについて、最初の実証的研究を行った。以上の結果から,量子化がプライバシリスクの低減に大きく影響していることが示唆された。また、タスクパフォーマンスとプライバシリスクの正の相関を見出した。
論文参考訳（メタデータ） (2025-07-31T19:28:31Z)
Unlearned but Not Forgotten: Data Extraction after Exact Unlearning in LLM [31.093224824043087]
学習前モデルからの信号を利用して学習後モデルを導く新しいデータ抽出攻撃を導入する。シミュレーションされた医療診断データセット上での攻撃の有効性を実証し、正確なアンラーニングに関連する現実世界のプライバシーリスクを明らかにする。
論文参考訳（メタデータ） (2025-05-30T09:09:33Z)
Pseudo-Probability Unlearning: Towards Efficient and Privacy-Preserving Machine Unlearning [59.29849532966454]
本稿では,PseudoProbability Unlearning (PPU)を提案する。提案手法は,最先端の手法に比べて20%以上の誤りを忘れる改善を実現している。
論文参考訳（メタデータ） (2024-11-04T21:27:06Z)
PriRoAgg: Achieving Robust Model Aggregation with Minimum Privacy Leakage for Federated Learning [49.916365792036636]
フェデレートラーニング(FL)は、大規模分散ユーザデータを活用する可能性から、最近大きな勢いを増している。送信されたモデル更新は、センシティブなユーザ情報をリークする可能性があり、ローカルなトレーニングプロセスの集中的な制御の欠如は、モデル更新に対する悪意のある操作の影響を受けやすいグローバルモデルを残します。我々は、Lagrange符号化計算と分散ゼロ知識証明を利用した汎用フレームワークPriRoAggを開発し、集約されたプライバシを満たすとともに、幅広いロバストな集約アルゴリズムを実行する。
論文参考訳（メタデータ） (2024-07-12T03:18:08Z)
The Data Minimization Principle in Machine Learning [61.17813282782266]
データ最小化は、収集、処理、保持されるデータの量を減らすことを目的としている。様々な国際データ保護規制によって支持されている。しかし、厳密な定式化が欠如しているため、その実践的な実装は依然として課題である。
論文参考訳（メタデータ） (2024-05-29T19:40:27Z)
Foundation Policies with Hilbert Representations [54.44869979017766]
ラベルなしオフラインデータから一般ポリシーを事前学習するための教師なしフレームワークを提案する。我々の重要な洞察は、基盤となる環境の時間的構造を保存する構造的表現を学習することである。実験の結果、教師なしのポリシーは、ゴール条件付きおよび一般のRLタスクをゼロショットで解決できることがわかった。
論文参考訳（メタデータ） (2024-02-23T19:09:10Z)
Differentially Private Deep Model-Based Reinforcement Learning [47.651861502104715]
形式的な差分プライバシー保証を備えたモデルベースRLアルゴリズムであるPriMORLを紹介する。 PriMORLはオフラインデータから環境の軌道レベルのDPモデルのアンサンブルを学習する。
論文参考訳（メタデータ） (2024-02-08T10:05:11Z)
Sample-Efficient Personalization: Modeling User Parameters as Low Rank Plus Sparse Components [30.32486162748558]
個人ユーザ/ドメイン/エンタプライズに対する機械学習(ML)予測のパーソナライズは,実践的なレコメンデーションシステムにおいて重要である。ネットワーク重みを低ランクおよびスパース成分の和としてモデル化するメタラーニング方式を提案する。 AMHT-LRSは、ほぼ最適なサンプル複雑さで効率よく問題を解く。
論文参考訳（メタデータ） (2022-10-07T12:50:34Z)
Privacy-Constrained Policies via Mutual Information Regularized Policy Gradients [54.98496284653234]
報酬を最大化しつつ、行動を通じて特定の機密状態変数の開示を最小限に抑えながら、報酬を最大化する政策を訓練する課題を考察する。本稿では, 感性状態と行動の相互情報に基づく正則化器を導入することで, この問題を解決する。プライバシ制約のあるポリシーを最適化するためのモデルベース推定器を開発した。
論文参考訳（メタデータ） (2020-12-30T03:22:35Z)
Knowledge-Enriched Distributional Model Inversion Attacks [49.43828150561947]
モデルインバージョン(MI)攻撃は、モデルパラメータからトレーニングデータを再構成することを目的としている。本稿では,パブリックデータからプライベートモデルに対する攻撃を行うのに役立つ知識を抽出する,新しい反転型GANを提案する。実験の結果,これらの手法を組み合わせることで,最先端MI攻撃の成功率を150%向上させることができることがわかった。
論文参考訳（メタデータ） (2020-10-08T16:20:48Z)
Data Minimization for GDPR Compliance in Machine Learning Models [0.0]
EUの一般データ保護規則は、収集される特定の目的を満たすために必要なデータのみを要求する。予測を行うのに必要な個人データの量を削減するための第一種手法を提案する。本手法では,モデルの精度にはほとんど影響を与えない一般化を実現するために,モデル内に符号化された知識を利用する。
論文参考訳（メタデータ） (2020-08-06T08:21:15Z)
SPEED: Secure, PrivatE, and Efficient Deep learning [2.283665431721732]
私たちは、強力なプライバシー制約に対処できるディープラーニングフレームワークを導入します。協調学習、差分プライバシー、同型暗号化に基づいて、提案手法は最先端技術に進化する。
論文参考訳（メタデータ） (2020-06-16T19:31:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。