論文の概要: What Data is Really Necessary? A Feasibility Study of Inference Data Minimization for Recommender Systems
- arxiv url: http://arxiv.org/abs/2508.21547v1
- Date: Fri, 29 Aug 2025 12:01:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-01 19:45:11.027825
- Title: What Data is Really Necessary? A Feasibility Study of Inference Data Minimization for Recommender Systems
- Title(参考訳): 真の必要データとは何か? -レコメンダシステムにおける推論データ最小化の可能性-
- Authors: Jens Leysen, Marco Favier, Bart Goethals,
- Abstract要約: 本稿では,レコメンデータシステムに対する暗黙的なフィードバック推測データの最小化の実現可能性について検討する。
かなりの性能損失を伴わずに技術的に実現可能であることを示す。
技術的実現可能性を確立する一方で、データの最小化は事実上困難である、と結論付けています。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data minimization is a legal principle requiring personal data processing to be limited to what is necessary for a specified purpose. Operationalizing this principle for recommender systems, which rely on extensive personal data, remains a significant challenge. This paper conducts a feasibility study on minimizing implicit feedback inference data for such systems. We propose a novel problem formulation, analyze various minimization techniques, and investigate key factors influencing their effectiveness. We demonstrate that substantial inference data reduction is technically feasible without significant performance loss. However, its practicality is critically determined by two factors: the technical setting (e.g., performance targets, choice of model) and user characteristics (e.g., history size, preference complexity). Thus, while we establish its technical feasibility, we conclude that data minimization remains practically challenging and its dependence on the technical and user context makes a universal standard for data `necessity' difficult to implement.
- Abstract(参考訳): データ最小化(Data Minimization)は、個人データ処理が特定の目的に必要なものに制限されるという法的原則である。
広範な個人データに依存するレコメンデーターシステムのためにこの原則を運用することは、依然として大きな課題である。
本稿では,そのようなシステムに対する暗黙的なフィードバック推定データの最小化について,その実現可能性について検討する。
本稿では,新しい問題定式化手法を提案し,様々な最小化手法を解析し,その有効性に影響を及ぼす重要な要因について検討する。
かなりの性能損失を伴わずに技術的に実現可能であることを示す。
しかし、その実用性は、技術的な設定(例えば、パフォーマンス目標、モデルの選択)とユーザ特性(例えば、履歴のサイズ、好みの複雑さ)の2つの要因によって決定される。
したがって、その技術的実現性を確立しつつも、データの最小化は事実上困難であり、その技術的およびユーザコンテキストへの依存は、データの'必要'の普遍的な標準の実装を困難にしていると結論付けている。
関連論文リスト
- SoK: Data Minimization in Machine Learning [49.60064304454055]
データ最小化(DM)は、与えられたタスクに必要なデータのみを収集する原則を記述している。
データ最小化の関連性は特に機械学習(ML)アプリケーションで顕著である。
他のMLプライバシおよびセキュリティトピックに関する既存の作業は、接続を明示的に認識することなく、DMMLに関連する問題に対処することが多い。
この作業では、統合データパイプライン、敵、最小化ポイントなど、DMMLの包括的なフレームワークを導入している。
論文 参考訳(メタデータ) (2025-08-14T17:00:13Z) - Algorithmic Data Minimization for Machine Learning over Internet-of-Things Data Streams [10.61303879393919]
機械学習は、IoTデバイスが生成する膨大なデータを分析してパターンを特定し、予測し、リアルタイムな意思決定を可能にする。
IoTシステムは、しばしば家庭やオフィスなどの機密性の高い環境にデプロイされ、不注意に識別可能な情報を公開することができる。
本稿では,センサストリームの文脈におけるデータ最小化の技術的解釈を提供し,実践的な実装方法を探究し,課題に対処する。
論文 参考訳(メタデータ) (2025-03-07T18:35:11Z) - The Data Minimization Principle in Machine Learning [61.17813282782266]
データ最小化は、収集、処理、保持されるデータの量を減らすことを目的としている。
様々な国際データ保護規制によって支持されている。
しかし、厳密な定式化が欠如しているため、その実践的な実装は依然として課題である。
論文 参考訳(メタデータ) (2024-05-29T19:40:27Z) - How Much More Data Do I Need? Estimating Requirements for Downstream
Tasks [99.44608160188905]
小さなトレーニングデータセットと学習アルゴリズムがあれば、ターゲットの検証やテストのパフォーマンスに到達するのに、どれくらいのデータが必要か?
データ要求を過大評価または過小評価すると、十分な予算で回避できる相当なコストが発生する。
本ガイドラインを用いることで,機械学習システムのデータ要求を正確に推定し,開発時間とデータ取得コストの双方で節約することができる。
論文 参考訳(メタデータ) (2022-07-04T21:16:05Z) - Learning to Limit Data Collection via Scaling Laws: Data Minimization
Compliance in Practice [62.44110411199835]
我々は機械学習法における文献に基づいて、データとシステム性能を結びつけるデータ解釈に基づく収集を制限するフレームワークを提案する。
我々は、性能曲線微分に基づくデータ最小化基準を定式化し、有効かつ解釈可能な分数法法技術を提供する。
論文 参考訳(メタデータ) (2021-07-16T19:59:01Z) - Counterfactual Explanations as Interventions in Latent Space [62.997667081978825]
反現実的な説明は、望ましい結果を達成するために変更が必要な機能のセットをエンドユーザに提供することを目的としています。
現在のアプローチでは、提案された説明を達成するために必要な行動の実現可能性を考慮することはめったにない。
本稿では,非現実的説明を生成する手法として,潜時空間における干渉としての対実的説明(CEILS)を提案する。
論文 参考訳(メタデータ) (2021-06-14T20:48:48Z) - Reviving Purpose Limitation and Data Minimisation in Personalisation,
Profiling and Decision-Making Systems [0.0]
本論文では、学際法則とコンピュータサイエンスレンズを通じて、データ駆動システムにおいてデータ最小化と目的制限を有意義に実装できるかどうかを決定する。
分析の結果,この2つの法原則が個人データ処理のリスク軽減に重要な役割を担っていることが明らかとなった。
これらの原則は検討中のシステムにおいて重要なセーフガードであるが、実用的な実装には重要な制限がある。
論文 参考訳(メタデータ) (2021-01-15T16:36:29Z) - Operationalizing the Legal Principle of Data Minimization for
Personalization [64.0027026050706]
データ最小化原理の同質な解釈が欠如していることを認識し、パーソナライゼーションの文脈に適用可能な2つの運用定義を探索する。
データ最小化によるパフォーマンス低下はそれほど大きくないかもしれないが、異なるユーザに影響を与える可能性がある。
論文 参考訳(メタデータ) (2020-05-28T00:43:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。