論文の概要: The trade-off between data minimization and fairness in collaborative filtering
- arxiv url: http://arxiv.org/abs/2410.07182v1
- Date: Sat, 21 Sep 2024 02:32:26 GMT
- ステータス: 処理完了
- システム内更新日: 2024-10-31 21:46:48.775526
- Title: The trade-off between data minimization and fairness in collaborative filtering
- Title(参考訳): 協調フィルタリングにおけるデータ最小化と公正性のトレードオフ
- Authors: Nasim Sonboli, Sipei Li, Mehdi Elahi, Asia Biega,
- Abstract要約: 一般データ保護規則は、個人個人の個人情報を害から保護することを目的としている。
完全なコンプライアンスはEUでは必須だが、他の地域では必須ではない。
本稿では,データ最小化の原理とレコメンダシステムにおける公平性の関係について検討する。
- 参考スコア(独自算出の注目度): 1.8936798735951967
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: General Data Protection Regulations (GDPR) aim to safeguard individuals' personal information from harm. While full compliance is mandatory in the European Union and the California Privacy Rights Act (CPRA), it is not in other places. GDPR requires simultaneous compliance with all the principles such as fairness, accuracy, and data minimization. However, it overlooks the potential contradictions within its principles. This matter gets even more complex when compliance is required from decision-making systems. Therefore, it is essential to investigate the feasibility of simultaneously achieving the goals of GDPR and machine learning, and the potential tradeoffs that might be forced upon us. This paper studies the relationship between the principles of data minimization and fairness in recommender systems. We operationalize data minimization via active learning (AL) because, unlike many other methods, it can preserve a high accuracy while allowing for strategic data collection, hence minimizing the amount of data collection. We have implemented several active learning strategies (personalized and non-personalized) and conducted a comparative analysis focusing on accuracy and fairness on two publicly available datasets. The results demonstrate that different AL strategies may have different impacts on the accuracy of recommender systems with nearly all strategies negatively impacting fairness. There has been no to very limited work on the trade-off between data minimization and fairness, the pros and cons of active learning methods as tools for implementing data minimization, and the potential impacts of AL on fairness. By exploring these critical aspects, we offer valuable insights for developing recommender systems that are GDPR compliant.
- Abstract(参考訳): 一般データ保護規則(GDPR)は、個人の個人情報を害から保護することを目的としている。
完全なコンプライアンスは欧州連合とカリフォルニア州プライバシー法(CPRA)で義務付けられているが、他の場所ではそうではない。
GDPRは公正性、正確性、データ最小化など、すべての原則を同時に遵守する必要がある。
しかし、その原理の潜在的な矛盾を見落としている。
意思決定システムにコンプライアンスが必要な場合、この問題はさらに複雑になります。
したがって、GDPRと機械学習の目標を同時に達成する可能性や、我々に強制される可能性のあるトレードオフの可能性を検討することが不可欠である。
本稿では,データ最小化の原理と推薦システムにおける公平性の関係について検討する。
アクティブラーニング(AL)によるデータ最小化を運用する理由は、他の多くの方法とは異なり、戦略的データ収集を可能としながら高い精度を維持することができ、したがってデータ収集量を最小化できるためである。
我々は、いくつかのアクティブな学習戦略(個人化および非個人化)を実践し、2つの公開データセットの正確性と公平性に着目した比較分析を行った。
その結果、様々なAL戦略が、ほぼ全ての戦略がフェアネスに悪影響を及ぼすようなレコメンデータシステムの精度に異なる影響を与える可能性が示された。
データ最小化と公正性のトレードオフ、データ最小化を実装するツールとしてのアクティブラーニングメソッドの長所と短所、そしてALが公正性に与える影響について、非常に限定的な作業は行われていない。
これらの重要な側面を探求することによって、GDPRに準拠したレコメンデーションシステムを開発する上で、貴重な洞察を提供する。
関連論文リスト
- The Data Minimization Principle in Machine Learning [61.17813282782266]
データ最小化は、収集、処理、保持されるデータの量を減らすことを目的としている。
様々な国際データ保護規制によって支持されている。
しかし、厳密な定式化が欠如しているため、その実践的な実装は依然として課題である。
論文 参考訳(メタデータ) (2024-05-29T19:40:27Z) - Learning to Limit Data Collection via Scaling Laws: Data Minimization
Compliance in Practice [62.44110411199835]
我々は機械学習法における文献に基づいて、データとシステム性能を結びつけるデータ解釈に基づく収集を制限するフレームワークを提案する。
我々は、性能曲線微分に基づくデータ最小化基準を定式化し、有効かつ解釈可能な分数法法技術を提供する。
論文 参考訳(メタデータ) (2021-07-16T19:59:01Z) - Risk Minimization from Adaptively Collected Data: Guarantees for
Supervised and Policy Learning [57.88785630755165]
経験的リスク最小化(Empirical Risk Minimization, ERM)は、機械学習のワークホースであるが、適応的に収集されたデータを使用すると、そのモデルに依存しない保証が失敗する可能性がある。
本研究では,仮説クラス上での損失関数の平均値を最小限に抑えるため,適応的に収集したデータを用いた一般的な重み付きERMアルゴリズムについて検討する。
政策学習では、探索がゼロになるたびに既存の文献のオープンギャップを埋める率-最適後悔保証を提供する。
論文 参考訳(メタデータ) (2021-06-03T09:50:13Z) - Reviving Purpose Limitation and Data Minimisation in Personalisation,
Profiling and Decision-Making Systems [0.0]
本論文では、学際法則とコンピュータサイエンスレンズを通じて、データ駆動システムにおいてデータ最小化と目的制限を有意義に実装できるかどうかを決定する。
分析の結果,この2つの法原則が個人データ処理のリスク軽減に重要な役割を担っていることが明らかとなった。
これらの原則は検討中のシステムにおいて重要なセーフガードであるが、実用的な実装には重要な制限がある。
論文 参考訳(メタデータ) (2021-01-15T16:36:29Z) - Is Pessimism Provably Efficient for Offline RL? [104.00628430454479]
優先度を収集したデータセットに基づいて最適なポリシーを学ぶことを目的としたオフライン強化学習(RL)について検討する。
ペナルティ関数として不確かさ量化器を組み込んだ値反復アルゴリズム(pevi)の悲観的変種を提案する。
論文 参考訳(メタデータ) (2020-12-30T09:06:57Z) - Privacy Preservation in Federated Learning: An insightful survey from
the GDPR Perspective [10.901568085406753]
この記事は、フェデレーテッドラーニングに使用できる最先端のプライバシー技術に関する調査に特化している。
近年の研究では、FLにおけるデータの保持と計算は、プライバシ保証者にとって不十分であることが示されている。
これは、FLシステム内のパーティ間で交換されるMLモデルパラメータが、いくつかのプライバシ攻撃で悪用されるためである。
論文 参考訳(メタデータ) (2020-11-10T21:41:25Z) - Provably Efficient Causal Reinforcement Learning with Confounded
Observational Data [135.64775986546505]
オフラインで収集されたデータセット(観測データ)を組み込んで、オンライン環境でのサンプル効率を改善する方法について検討する。
提案手法は,観測データを効率よく組み込んだ,分解された楽観的値反復 (DOVI) アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-22T14:49:33Z) - Operationalizing the Legal Principle of Data Minimization for
Personalization [64.0027026050706]
データ最小化原理の同質な解釈が欠如していることを認識し、パーソナライゼーションの文脈に適用可能な2つの運用定義を探索する。
データ最小化によるパフォーマンス低下はそれほど大きくないかもしれないが、異なるユーザに影響を与える可能性がある。
論文 参考訳(メタデータ) (2020-05-28T00:43:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。