Fugu-MT 論文翻訳(概要): Data Minimization for GDPR Compliance in Machine Learning Models

論文の概要: Data Minimization for GDPR Compliance in Machine Learning Models

arxiv url: http://arxiv.org/abs/2008.04113v1
Date: Thu, 6 Aug 2020 08:21:15 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-02 08:06:35.627000
Title: Data Minimization for GDPR Compliance in Machine Learning Models
Title（参考訳）: 機械学習モデルにおけるGDPRコンプライアンスのためのデータ最小化
Authors: Abigail Goldsteen, Gilad Ezov, Ron Shmelkin, Micha Moffie, Ariel Farkash
Abstract要約: EUの一般データ保護規則は、収集される特定の目的を満たすために必要なデータのみを要求する。予測を行うのに必要な個人データの量を削減するための第一種手法を提案する。本手法では,モデルの精度にはほとんど影響を与えない一般化を実現するために,モデル内に符号化された知識を利用する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The EU General Data Protection Regulation (GDPR) mandates the principle of data minimization, which requires that only data necessary to fulfill a certain purpose be collected. However, it can often be difficult to determine the minimal amount of data required, especially in complex machine learning models such as neural networks. We present a first-of-a-kind method to reduce the amount of personal data needed to perform predictions with a machine learning model, by removing or generalizing some of the input features. Our method makes use of the knowledge encoded within the model to produce a generalization that has little to no impact on its accuracy. This enables the creators and users of machine learning models to acheive data minimization, in a provable manner.
Abstract（参考訳）: EU一般データ保護規則(GDPR)は、データ最小化の原則を義務付けており、特定の目的を達成するために必要なデータのみを収集する必要がある。しかし、特にニューラルネットワークのような複雑な機械学習モデルにおいて、必要最小限のデータ量を決定することはしばしば困難である。本稿では,機械学習モデルを用いて予測を行うのに必要な個人データ量を削減し,入力機能の一部を削除または一般化する手法を提案する。本手法では,モデル内にエンコードされた知識を用いて,その精度にほとんど影響を与えない一般化を行う。これにより、機械学習モデルの作成者とユーザは、証明可能な方法でデータの最小化を達成できる。

関連論文リスト

Evolution without Large Models: Training Language Model with Task Principles [52.44569608690695]
言語モデルの一般的なトレーニングアプローチは、人間が提供したデータセットを拡張するために、大規模な言語モデルを使用することである。この方法は、広範囲な人的データアノテーションの必要性を排除し、トレーニングコストを大幅に削減する。しかし、データ拡張時の二酸化炭素排出量の増加や、データ漏洩のリスクなど、依然として課題に直面している。
論文参考訳（メタデータ） (2025-07-08T13:52:45Z)
Model Collapse Is Not a Bug but a Feature in Machine Unlearning for LLMs [54.167494079321465]
LLMの現在のアンラーニング方法は、それらを微調整データに組み込むことで、削除しようとしているプライベート情報に基づいて最適化されている。本研究では,未学習目標を学習対象に含まない新しい非学習手法-部分的モデル崩壊(PMC)を提案する。
論文参考訳（メタデータ） (2025-07-06T03:08:49Z)
Learning Accurate Models on Incomplete Data with Minimal Imputation [2.5586124684627274]
データの欠落は実世界のデータセットに存在することが多く、正確な機械学習(ML)モデルを学ぶのにかなりの時間と労力を要する。我々は、最小限のデータ計算の概念を導入し、命令されたデータセット上でトレーニングされた正確なMLモデルを保証する。
論文参考訳（メタデータ） (2025-03-18T05:36:59Z)
Algorithmic Data Minimization for Machine Learning over Internet-of-Things Data Streams [10.61303879393919]
機械学習は、IoTデバイスが生成する膨大なデータを分析してパターンを特定し、予測し、リアルタイムな意思決定を可能にする。 IoTシステムは、しばしば家庭やオフィスなどの機密性の高い環境にデプロイされ、不注意に識別可能な情報を公開することができる。本稿では,センサストリームの文脈におけるデータ最小化の技術的解釈を提供し,実践的な実装方法を探究し,課題に対処する。
論文参考訳（メタデータ） (2025-03-07T18:35:11Z)
Learn while Unlearn: An Iterative Unlearning Framework for Generative Language Models [52.03511469562013]
3つのコアコンポーネントで構成されるICU(Iterative Contrastive Unlearning)フレームワークを紹介する。知識未学習誘導モジュールは、未学習の損失を使用して、特定の知識を除去するためにターゲットとする。 Contrastive Learning Enhancementモジュールは、純粋な未学習の目標に対してモデルの表現力を保持する。イテレーティブ・アンラーニング・リファインメントモジュールは、進行中の評価と更新を通じて、アンラーニングプロセスを動的に調整する。
論文参考訳（メタデータ） (2024-07-25T07:09:35Z)
Partially Blinded Unlearning: Class Unlearning for Deep Networks a Bayesian Perspective [4.31734012105466]
マシン・アンラーニング(英: Machine Unlearning)とは、特定のデータセットやクラスに指定された情報を事前訓練されたモデルから選択的に破棄するプロセスである。本研究では,事前学習した分類ネットワークから,特定の種類のデータに関連付けられた情報の目的的除去に適した手法を提案する。本手法は,従来の最先端の未学習手法を超越し,優れた有効性を示す。
論文参考訳（メタデータ） (2024-03-24T17:33:22Z)
Certain and Approximately Certain Models for Statistical Learning [4.318959672085627]
特定のトレーニングデータや対象モデルに対して,不足値を持つデータから,正確なモデルを直接学習することが可能であることを示す。我々は、理論的に保証された効率的なアルゴリズムを構築し、この必要条件を確認し、計算が不要な場合に正確なモデルを返す。
論文参考訳（メタデータ） (2024-02-27T22:49:33Z)
An Information Theoretic Approach to Machine Unlearning [45.600917449314444]
学びの鍵となる課題は、モデルのパフォーマンスを保ちながら、必要なデータをタイムリーに忘れることである。この研究では、ゼロショットのアンラーニングシナリオに対処し、未学習のアルゴリズムは、トレーニングされたモデルと忘れられるデータだけが与えられたデータを削除できなければならない。モデルの幾何に基づいて、単純だが原則化されたゼロショットアンラーニング法を導出する。
論文参考訳（メタデータ） (2024-02-02T13:33:30Z)
STAR: Boosting Low-Resource Information Extraction by Structure-to-Text Data Generation with Large Language Models [56.27786433792638]
STARは大規模言語モデル(LLM)を利用してデータインスタンスを合成するデータ生成手法である。我々は、初期データインスタンスを取得するための詳細なステップバイステップ命令を設計する。実験の結果,STARが生成したデータは,低リソースイベント抽出および関係抽出タスクの性能を著しく向上させることがわかった。
論文参考訳（メタデータ） (2023-05-24T12:15:19Z)
AI Model Disgorgement: Methods and Choices [127.54319351058167]
本稿では,現代の機械学習システムに適用可能な分類法を紹介する。学習モデルにおけるデータ「効果の除去」の意味を,スクラッチからリトレーニングする必要のない方法で検討する。
論文参考訳（メタデータ） (2023-04-07T08:50:18Z)
Synthetic Model Combination: An Instance-wise Approach to Unsupervised Ensemble Learning [92.89846887298852]
ラベル付きデータのトレーニングセットから学ぶ機会のない、新しいテストデータに対する予測を検討する。専門家モデルのセットと予測へのアクセスと、トレーニングに使用するデータセットに関する制限された情報を提供すること。
論文参考訳（メタデータ） (2022-10-11T10:20:31Z)
Learnware: Small Models Do Big [69.88234743773113]
自然言語処理やコンピュータビジョンの応用で目覚ましい成果を上げてきた、一般的なビッグモデルパラダイムは、これらの問題にまだ対応していないが、炭素排出量の深刻な源となっている。この記事では、マシンラーニングモデルをスクラッチから構築する必要がないようにするための学習ソフトウェアパラダイムの概要を紹介します。
論文参考訳（メタデータ） (2022-10-07T15:55:52Z)
Sample-Efficient Personalization: Modeling User Parameters as Low Rank Plus Sparse Components [30.32486162748558]
個人ユーザ/ドメイン/エンタプライズに対する機械学習(ML)予測のパーソナライズは,実践的なレコメンデーションシステムにおいて重要である。ネットワーク重みを低ランクおよびスパース成分の和としてモデル化するメタラーニング方式を提案する。 AMHT-LRSは、ほぼ最適なサンプル複雑さで効率よく問題を解く。
論文参考訳（メタデータ） (2022-10-07T12:50:34Z)
A Survey of Machine Unlearning [56.017968863854186]
最近の規制では、要求に応じて、ユーザに関する個人情報をコンピュータシステムから削除する必要がある。 MLモデルは古いデータをよく記憶します。機械学習に関する最近の研究は、この問題を完全に解決することはできなかった。
論文参考訳（メタデータ） (2022-09-06T08:51:53Z)
Zero-shot meta-learning for small-scale data from human subjects [10.320654885121346]
我々は,サンプル外テストデータに対する限られたトレーニングデータを用いて,新しい予測タスクに迅速に適応するフレームワークを開発した。本モデルでは, 介入による遅延処理効果を学習し, 設計上はマルチタスク予測を自然に処理できる。我々のモデルは、より広い人口への小型人間研究の一般化を向上するために重要である。
論文参考訳（メタデータ） (2022-03-29T17:42:04Z)
ALT-MAS: A Data-Efficient Framework for Active Testing of Machine Learning Algorithms [58.684954492439424]
少量のラベル付きテストデータのみを用いて機械学習モデルを効率的にテストする新しいフレームワークを提案する。ベイズニューラルネットワーク(bnn)を用いたモデルアンダーテストの関心指標の推定が目的である。
論文参考訳（メタデータ） (2021-04-11T12:14:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。