Fugu-MT 論文翻訳(概要): Learning to Limit Data Collection via Scaling Laws: Data Minimization Compliance in Practice

論文の概要: Learning to Limit Data Collection via Scaling Laws: Data Minimization Compliance in Practice

arxiv url: http://arxiv.org/abs/2107.08096v1
Date: Fri, 16 Jul 2021 19:59:01 GMT
ステータス: 翻訳完了
システム内更新日: 2021-07-21 10:28:07.433213
Title: Learning to Limit Data Collection via Scaling Laws: Data Minimization Compliance in Practice
Title（参考訳）: スケーリング法則によるデータ収集の制限学習: 実践におけるデータ最小化コンプライアンス
Authors: Divya Shanmugam, Samira Shabanian, Fernando Diaz, Mich\`ele Finck, Asia Biega
Abstract要約: 我々は機械学習法における文献に基づいて、データとシステム性能を結びつけるデータ解釈に基づく収集を制限するフレームワークを提案する。我々は、性能曲線微分に基づくデータ最小化基準を定式化し、有効かつ解釈可能な分数法法技術を提供する。
参考スコア（独自算出の注目度）: 62.44110411199835
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Data minimization is a legal obligation defined in the European Union's General Data Protection Regulation (GDPR) as the responsibility to process an adequate, relevant, and limited amount of personal data in relation to a processing purpose. However, unlike fairness or transparency, the principle has not seen wide adoption for machine learning systems due to a lack of computational interpretation. In this paper, we build on literature in machine learning and law to propose the first learning framework for limiting data collection based on an interpretation that ties the data collection purpose to system performance. We formalize a data minimization criterion based on performance curve derivatives and provide an effective and interpretable piecewise power law technique that models distinct stages of an algorithm's performance throughout data collection. Results from our empirical investigation offer deeper insights into the relevant considerations when designing a data minimization framework, including the choice of feature acquisition algorithm, initialization conditions, as well as impacts on individuals that hint at tensions between data minimization and fairness.
Abstract（参考訳）: データ最小化(英: data minimization)とは、欧州連合(eu)の一般データ保護規則(gdpr)において、処理目的に関する適切な、関連する、限られた量の個人情報を処理する責任として定義される法的義務である。しかし、公平さや透明性とは異なり、この原理は計算解釈の欠如のために機械学習システムに広く採用されていない。本稿では,機械学習と法学の文献をもとに,データ収集目的とシステム性能を関連付けた解釈に基づくデータ収集を制限するための最初の学習フレームワークを提案する。性能曲線微分に基づくデータ最小化基準を定式化し、データ収集全体を通してアルゴリズムの性能の異なる段階をモデル化する効果的かつ解釈可能な分法手法を提供する。実験的な調査の結果は、特徴獲得アルゴリズムの選択、初期化条件、データ最小化と公正性の緊張を示唆する個人への影響など、データ最小化フレームワークを設計する際の関連する考慮事項に関する深い洞察を提供する。

関連論文リスト

Perplexity-Aware Data Scaling Law: Perplexity Landscapes Predict Performance for Continual Pre-training [46.54209378000497]
事前トレーニングのスケーリング法則は、データセットのサイズとLLMのテスト損失との間には、ゆるい関係がある。本稿では,ドメイン固有データの難易度景観とテスト損失との予測的関係を確立するために,新しいパープレキシティ対応データスケーリング法を提案する。本手法は, ほぼ最適トレーニングサブセットを一貫して同定し, 医用および一般のベンチマークにおいて優れた性能を発揮する。
論文参考訳（メタデータ） (2025-12-25T05:40:46Z)
What Data is Really Necessary? A Feasibility Study of Inference Data Minimization for Recommender Systems [0.0]
本稿では,レコメンデータシステムに対する暗黙的なフィードバック推測データの最小化の実現可能性について検討する。かなりの性能損失を伴わずに技術的に実現可能であることを示す。技術的実現可能性を確立する一方で、データの最小化は事実上困難である、と結論付けています。
論文参考訳（メタデータ） (2025-08-29T12:01:17Z)
SoK: Data Minimization in Machine Learning [49.60064304454055]
データ最小化(DM)は、与えられたタスクに必要なデータのみを収集する原則を記述している。データ最小化の関連性は特に機械学習(ML)アプリケーションで顕著である。他のMLプライバシおよびセキュリティトピックに関する既存の作業は、接続を明示的に認識することなく、DMMLに関連する問題に対処することが多い。この作業では、統合データパイプライン、敵、最小化ポイントなど、DMMLの包括的なフレームワークを導入している。
論文参考訳（メタデータ） (2025-08-14T17:00:13Z)
The trade-off between data minimization and fairness in collaborative filtering [1.8936798735951967]
一般データ保護規則は、個人個人の個人情報を害から保護することを目的としている。完全なコンプライアンスはEUでは必須だが、他の地域では必須ではない。本稿では,データ最小化の原理とレコメンダシステムにおける公平性の関係について検討する。
論文参考訳（メタデータ） (2024-09-21T02:32:26Z)
The Data Minimization Principle in Machine Learning [61.17813282782266]
データ最小化は、収集、処理、保持されるデータの量を減らすことを目的としている。様々な国際データ保護規制によって支持されている。しかし、厳密な定式化が欠如しているため、その実践的な実装は依然として課題である。
論文参考訳（メタデータ） (2024-05-29T19:40:27Z)
Reviving Purpose Limitation and Data Minimisation in Personalisation, Profiling and Decision-Making Systems [0.0]
本論文では、学際法則とコンピュータサイエンスレンズを通じて、データ駆動システムにおいてデータ最小化と目的制限を有意義に実装できるかどうかを決定する。分析の結果,この2つの法原則が個人データ処理のリスク軽減に重要な役割を担っていることが明らかとなった。これらの原則は検討中のシステムにおいて重要なセーフガードであるが、実用的な実装には重要な制限がある。
論文参考訳（メタデータ） (2021-01-15T16:36:29Z)
Provably Efficient Causal Reinforcement Learning with Confounded Observational Data [135.64775986546505]
オフラインで収集されたデータセット(観測データ)を組み込んで、オンライン環境でのサンプル効率を改善する方法について検討する。提案手法は,観測データを効率よく組み込んだ,分解された楽観的値反復 (DOVI) アルゴリズムを提案する。
論文参考訳（メタデータ） (2020-06-22T14:49:33Z)
Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文参考訳（メタデータ） (2020-06-10T20:20:10Z)
Operationalizing the Legal Principle of Data Minimization for Personalization [64.0027026050706]
データ最小化原理の同質な解釈が欠如していることを認識し、パーソナライゼーションの文脈に適用可能な2つの運用定義を探索する。データ最小化によるパフォーマンス低下はそれほど大きくないかもしれないが、異なるユーザに影響を与える可能性がある。
論文参考訳（メタデータ） (2020-05-28T00:43:06Z)
How Training Data Impacts Performance in Learning-based Control [67.7875109298865]
本稿では,トレーニングデータの密度と制御性能の関係を考察する。データセットの品質尺度を定式化し、$rho$-gap と呼ぶ。フィードバック線形化制御法に$rho$-gapを適用する方法を示す。
論文参考訳（メタデータ） (2020-05-25T12:13:49Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。