論文の概要: Intersectional Data and the Social Cost of Digital Extraction: A Pigouvian Surcharge
- arxiv url: http://arxiv.org/abs/2601.08574v1
- Date: Tue, 13 Jan 2026 13:55:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-14 18:27:19.224479
- Title: Intersectional Data and the Social Cost of Digital Extraction: A Pigouvian Surcharge
- Title(参考訳): 間欠的データとデジタル抽出の社会的コスト : ピグルービアン・サチャージ
- Authors: Eduardo C. Garrido-Merchán,
- Abstract要約: 本稿では,相互情報に基づく価格ルールを提案する。このルールは,共通性分布上の個々のデータポイントによって引き起こされるエントロピーの低減に,金銭的価値を割り当てるものである。
我々は、規制当局がこの代償を調整し、競合する社会的価値を反映し、規範的判断を直接市場デザインに組み込むことができると主張している。
- 参考スコア(独自算出の注目度): 1.5736899098702974
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Contemporary digital capitalism relies on the large-scale extraction and commodification of personal data. Far from revealing isolated attributes, such data increasingly exposes intersectional social identities formed by combinations of race, gender, disability and others. This process generates a structural privacy externality: while firms appropriate economic value through profiling, prediction, and personalization, individuals and social groups bear diffuse costs in the form of heightened social risk, discrimination, and vulnerability. This paper develops a formal political economic framework to internalize these externalities by linking data valuation to information-theoretic measures. We propose a pricing rule based on mutual information that assigns monetary value to the entropy reduction induced by individual data points over joint intersectional identity distributions. Interpreted as a Pigouvian-style surcharge on data extraction, this mechanism functions as an institutional constraint on the asymmetric accumulation of informational power. A key advantage of the approach is its model-agnostic character: the valuation rule operates independently of the statistical structure used to estimate intersectional attributes, whether parametric, nonparametric, or machine-learned, and can be approximated through discretization of joint distributions. We argue that regulators can calibrate this surcharge to reflect contested social values, thereby embedding normative judgments directly into market design. By formalizing the social cost of intersectional data extraction, the proposed mechanism offers both a corrective to market failure and a redistributive institutional shield for vulnerable groups under conditions of digital asymmetry.
- Abstract(参考訳): 現代のデジタル資本主義は、個人データの大規模な抽出と商品化に依存している。
このようなデータは、孤立した属性を明らかにするだけでなく、人種、性別、障害、その他の組み合わせによって形成された交点の社会的アイデンティティを公開するようになっている。
このプロセスは、プロファイリング、予測、パーソナライゼーションを通じて適切な経済価値を保有する一方で、個人や社会グループは、社会的リスク、差別、脆弱性を高める形で拡散コストを負担する。
本稿では、データ評価と情報理論の指標を結びつけることによって、これらの外部性を内在化するための公式な政治経済枠組みを開発する。
本稿では,相互情報に基づく価格ルールを提案する。このルールは,共通性分布上の個々のデータポイントによって引き起こされるエントロピーの低減に,金銭的価値を割り当てるものである。
このメカニズムは、データ抽出におけるピグーヴィアンスタイルの電荷として解釈され、情報パワーの非対称的な蓄積に関する制度的な制約として機能する。
評価規則は、パラメトリック、非パラメトリック、機械学習など、交叉特性を推定するために用いられる統計構造とは独立に機能し、関節分布の離散化によって近似することができる。
我々は、規制当局がこの代償を調整し、競合する社会的価値を反映し、規範的判断を直接市場デザインに組み込むことができると主張している。
交差データ抽出の社会的コストを形式化することにより、デジタル非対称性の条件下では、市場失敗に対する是正と、脆弱なグループに対する再分配的な制度的シールドの両方を提供する。
関連論文リスト
- Wasserstein Markets for Differentially-Private Data [1.4266656344673316]
データ市場は、幅広いアクセスを可能にすると同時に、適切なプライバシーとユーティリティのトレードオフを決定する手段を提供する。
既存のデータ市場フレームワークでは、信頼できるサードパーティが高価なバリュエーションを実行するか、あるいはデータ価値の性質を把握できないかのいずれかが必要です。
本稿では,個人差分データに対するワッサーシュタイン距離に基づく評価機構とそれに対応する調達機構を提案する。
論文 参考訳(メタデータ) (2024-12-03T17:40:26Z) - Differentially Private Linear Regression with Linked Data [3.9325957466009203]
コンピュータ科学の数学的概念である差分プライバシーは、堅牢なプライバシー保証を提供する上昇するツールである。
最近の研究は、個々の統計および機械学習タスクの微分プライベートバージョンの開発に焦点を当てている。
相関データを用いた線形回帰のための2つの微分プライベートアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-08-01T21:00:19Z) - Breaking the Communication-Privacy-Accuracy Tradeoff with
$f$-Differential Privacy [51.11280118806893]
サーバが複数のユーザの協調的なデータ分析を,プライバシの懸念と限られた通信能力で調整する,フェデレートされたデータ分析問題を考える。
有限出力空間を有する離散値機構の局所的差分プライバシー保証を$f$-differential privacy (DP) レンズを用いて検討する。
より具体的には、様々な離散的評価機構の厳密な$f$-DP保証を導出することにより、既存の文献を前進させる。
論文 参考訳(メタデータ) (2023-02-19T16:58:53Z) - Improved Generalization Guarantees in Restricted Data Models [16.193776814471768]
差分プライバシーは、適応的、または探索的、データ分析による妥当性の脅威から保護されることが知られている。
この仮定では、データの異なる部分におけるプライバシー予算の「再利用」が可能であり、オーバーフィッティングのリスクを増大させることなく、精度を大幅に向上できることを示す。
論文 参考訳(メタデータ) (2022-07-20T16:04:12Z) - Spending Privacy Budget Fairly and Wisely [7.975975942400017]
差分プライベート(DP)合成データ生成は、データへのアクセスを改善するための実用的な方法である。
DP固有の問題のひとつは、"プライバシ予算"が一般的に、データセットの機能間で均等に"発効"していることだ。
我々は,DPデータに基づいてトレーニングされたモデルの予測精度を最大化するために,プライバシー予算を「賢明に」配布するアンサンブル手法を開発した。
論文 参考訳(メタデータ) (2022-04-27T13:13:56Z) - Post-processing of Differentially Private Data: A Fairness Perspective [53.29035917495491]
本稿では,ポストプロセッシングが個人やグループに異なる影響を与えることを示す。
差分的にプライベートなデータセットのリリースと、ダウンストリームの決定にそのようなプライベートなデータセットを使用するという、2つの重要な設定を分析している。
それは、異なる公正度尺度の下で(ほぼ)最適である新しい後処理機構を提案する。
論文 参考訳(メタデータ) (2022-01-24T02:45:03Z) - Data Sharing Markets [95.13209326119153]
我々は、各エージェントがデータの買い手および売り手の両方になり得る設定について検討する。
両データ交換(データ付きトレーディングデータ)と一方データ交換(お金付きトレーディングデータ)の2つの事例を考察する。
論文 参考訳(メタデータ) (2021-07-19T06:00:34Z) - Representative & Fair Synthetic Data [68.8204255655161]
公平性制約を自己監督学習プロセスに組み込むためのフレームワークを提示する。
私たちはuci成人国勢調査データセットの代表者および公正版を作成します。
我々は、代表的かつ公正な合成データを将来有望なビルディングブロックとみなし、歴史的世界ではなく、私たちが生きようとしている世界についてアルゴリズムを教える。
論文 参考訳(メタデータ) (2021-04-07T09:19:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。