論文の概要: A Sustainable AI Economy Needs Data Deals That Work for Generators
- arxiv url: http://arxiv.org/abs/2601.09966v1
- Date: Thu, 15 Jan 2026 01:05:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-16 19:43:18.933697
- Title: A Sustainable AI Economy Needs Data Deals That Work for Generators
- Title(参考訳): 持続可能なAI経済は、発電機で動くデータ処理を必要とする
- Authors: Ruoxi Jia, Luis Oala, Wenjie Xiong, Suqin Ge, Jiachen T. Wang, Feiyang Kang, Dawn Song,
- Abstract要約: 機械学習のバリューチェーンは、経済的なデータ処理の不平等のため、構造的に持続不可能である、と我々は主張する。
73の公開データ取引を分析し、アグリゲータに価値の大部分が蓄積されていることを示す。
参加者全員に利益をもたらす最小市場を実現するために、等価なData-Value Exchange Frameworkを提案する。
- 参考スコア(独自算出の注目度): 56.949279542190084
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We argue that the machine learning value chain is structurally unsustainable due to an economic data processing inequality: each state in the data cycle from inputs to model weights to synthetic outputs refines technical signal but strips economic equity from data generators. We show, by analyzing seventy-three public data deals, that the majority of value accrues to aggregators, with documented creator royalties rounding to zero and widespread opacity of deal terms. This is not just an economic welfare concern: as data and its derivatives become economic assets, the feedback loop that sustains current learning algorithms is at risk. We identify three structural faults - missing provenance, asymmetric bargaining power, and non-dynamic pricing - as the operational machinery of this inequality. In our analysis, we trace these problems along the machine learning value chain and propose an Equitable Data-Value Exchange (EDVEX) Framework to enable a minimal market that benefits all participants. Finally, we outline research directions where our community can make concrete contributions to data deals and contextualize our position with related and orthogonal viewpoints.
- Abstract(参考訳): 入力からモデル重みまでのデータサイクルの各状態は、技術的シグナルを洗練させるが、データジェネレータから経済的株式を剥奪する。
我々は、73件の公開データ取引を分析して、アグリゲータに価値の大部分が結びつき、ドキュメント作成者のロイヤリティはゼロで、取引条件が不透明であることを示している。
データとその派生物が経済資産になるにつれて、現在の学習アルゴリズムを維持するフィードバックループが危険にさらされている。
我々は、この不平等の運用機械として、3つの構造的欠陥、すなわち失効点、非対称バリケートパワー、非動的価格を同定する。
分析では、これらの問題を機械学習のバリューチェーンに沿って追跡し、すべての参加者に利益をもたらす最小市場を実現するために、EDVEX(Equitable Data-Value Exchange)フレームワークを提案する。
最後に、我々のコミュニティがデータ取引に具体的な貢献をし、関連性および直交的な視点で私たちの立場を文脈化できる研究の方向性を概説する。
関連論文リスト
- The Economics of AI Training Data: A Research Agenda [0.4174557458129457]
データのAI生産における中心的な役割にもかかわらず、まだ理解されていないインプットである。
AIラボが公開データを消耗し、プロプライエタリなソースに転換するにつれ、コンピュータ科学、経済学、法律、そしてポリシーに関する研究が断片化している。
私たちは3つの貢献を通じてコヒーレントな分野としてデータ経済学を確立します。
論文 参考訳(メタデータ) (2025-10-28T21:37:35Z) - The Economics of Information Pollution in the Age of AI: A General Equilibrium Approach to Welfare, Measurement, and Policy [4.887749221165767]
LLM(Large Language Models)の出現は、情報生産の経済性に対する根本的なショックである。
高品質な合成コンテンツを生成するための限界コストを非対称に崩壊させると同時に、高品質な生産をコスト的に残すことで、AIは情報汚染を体系的に動機付ける。
本稿では,この課題を解析するための一般均衡フレームワークを開発する。
論文 参考訳(メタデータ) (2025-09-17T06:31:17Z) - Surveying the Effects of Quality, Diversity, and Complexity in Synthetic Data From Large Language Models [12.85318938363753]
データ品質,多様性,複雑性の観点から,各アルゴリズムが生成した合成データの構成によるアルゴリズムの評価を行った。
合成データパイプラインにおける各種成分が各データ特性に与える影響について検討する。
これらのトレードオフのバランスは、将来の自己改善アルゴリズムの開発に不可欠である、と我々は主張する。
論文 参考訳(メタデータ) (2024-12-04T02:47:45Z) - A Novel Framework for Analyzing Structural Transformation in Data-Constrained Economies Using Bayesian Modeling and Machine Learning [0.0]
農業経済からより多様化した産業やサービスベースのシステムへの移行は、経済発展の重要な要因である。
低所得国と中所得国(LMIC)では、データの不足と信頼性の欠如が、このプロセスの正確な評価を妨げる。
本稿では,ベイジアン階層モデリング,機械学習に基づくデータ計算,因子分析を統合することで,これらの課題に対処する新しい統計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-25T08:39:41Z) - Auditing and Generating Synthetic Data with Controllable Trust Trade-offs [54.262044436203965]
合成データセットとAIモデルを包括的に評価する総合監査フレームワークを導入する。
バイアスや差別の防止、ソースデータへの忠実性の確保、実用性、堅牢性、プライバシ保護などに焦点を当てている。
多様なユースケースにまたがる様々な生成モデルを監査することにより,フレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2023-04-21T09:03:18Z) - Mechanisms that Incentivize Data Sharing in Federated Learning [90.74337749137432]
我々は、データ共有の利点が完全に損なわれているような、ナイーブなスキームが破滅的なフリーライディングのレベルにどのように結びつくかを示す。
次に,各エージェントが生成するデータ量を最大化する精度形成機構を導入する。
論文 参考訳(メタデータ) (2022-07-10T22:36:52Z) - Data Sharing Markets [95.13209326119153]
我々は、各エージェントがデータの買い手および売り手の両方になり得る設定について検討する。
両データ交換(データ付きトレーディングデータ)と一方データ交換(お金付きトレーディングデータ)の2つの事例を考察する。
論文 参考訳(メタデータ) (2021-07-19T06:00:34Z) - Representative & Fair Synthetic Data [68.8204255655161]
公平性制約を自己監督学習プロセスに組み込むためのフレームワークを提示する。
私たちはuci成人国勢調査データセットの代表者および公正版を作成します。
我々は、代表的かつ公正な合成データを将来有望なビルディングブロックとみなし、歴史的世界ではなく、私たちが生きようとしている世界についてアルゴリズムを教える。
論文 参考訳(メタデータ) (2021-04-07T09:19:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。