論文の概要: Data Sharing with a Generative AI Competitor
- arxiv url: http://arxiv.org/abs/2505.12386v1
- Date: Sun, 18 May 2025 12:22:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:11.203555
- Title: Data Sharing with a Generative AI Competitor
- Title(参考訳): ジェネレーティブAIコンピタによるデータ共有
- Authors: Boaz Taitler, Omer Madmon, Moshe Tennenholtz, Omer Ben-Porat,
- Abstract要約: 我々は、コンテンツ制作会社とGenAIプラットフォームとの間でデータ共有のモデルを提供し、サードパーティの専門家からコンテンツを取得することができる。
このインタラクションはStackelbergのゲームとしてモデル化されている。同社はまず、そのプロプライエタリなデータセットのどれ程をGenAIと共有するかを決め、続いてGenAIは、外部の専門家から取得するデータ量を決定する。
我々の結果は、GenAI時代のデータ共有パートナーシップを形作る経済力に光を当てています。
- 参考スコア(独自算出の注目度): 14.181796250900907
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: As GenAI platforms grow, their dependence on content from competing providers, combined with access to alternative data sources, creates new challenges for data-sharing decisions. In this paper, we provide a model of data sharing between a content creation firm and a GenAI platform that can also acquire content from third-party experts. The interaction is modeled as a Stackelberg game: the firm first decides how much of its proprietary dataset to share with GenAI, and GenAI subsequently determines how much additional data to acquire from external experts. Their utilities depend on user traffic, monetary transfers, and the cost of acquiring additional data from external experts. We characterize the unique subgame perfect equilibrium of the game and uncover a surprising phenomenon: The firm may be willing to pay GenAI to share the firm's own data, leading to a costly data-sharing equilibrium. We further characterize the set of Pareto improving data prices, and show that such improvements occur only when the firm pays to share data. Finally, we study how the price can be set to optimize different design objectives, such as promoting firm data sharing, expert data acquisition, or a balance of both. Our results shed light on the economic forces shaping data-sharing partnerships in the age of GenAI, and provide guidance for platforms, regulators and policymakers seeking to design effective data exchange mechanisms.
- Abstract(参考訳): GenAIプラットフォームが成長するにつれて、競合するプロバイダからのコンテンツへの依存が、代替データソースへのアクセスと相まって、データ共有の決定に新たな課題を生み出します。
本稿では,コンテンツ制作会社とGenAIプラットフォーム間のデータ共有モデルを提案する。
このインタラクションはStackelbergのゲームとしてモデル化されている。同社はまず、そのプロプライエタリなデータセットのどれ程をGenAIと共有するかを決め、続いてGenAIは、外部の専門家から取得するデータ量を決定する。
それらのユーティリティは、ユーザトラフィック、金融送金、および外部の専門家から追加データを取得するコストに依存する。
我々はゲームのユニークなサブゲームの完全均衡を特徴付け、驚くべき現象を明らかにします。同社はGenAIにお金を払って自社のデータを共有し、コストのかかるデータ共有均衡に繋がるかもしれません。
さらに、データ価格を改善するParetoのセットを特徴付け、企業がデータ共有に支払った場合にのみこのような改善が発生することを示す。
最後に,企業データ共有の促進,エキスパートデータ取得,あるいは両者のバランスなど,さまざまな設計目標を最適化するための価格設定について検討する。
我々の成果は、GenAI時代のデータ共有パートナーシップを形作る経済力に光を当て、効果的なデータ交換機構を設計しようとするプラットフォーム、規制、政策立案者へのガイダンスを提供した。
関連論文リスト
- Data Shapley in One Training Run [88.59484417202454]
Data Shapleyは、機械学習コンテキストにおけるデータのコントリビューションに寄与するための、原則化されたフレームワークを提供する。
既存のアプローチでは、計算集約的な異なるデータサブセット上の再学習モデルが必要である。
本稿では、対象とするデータモデルに対するスケーラブルなデータ属性を提供することにより、これらの制限に対処するIn-Run Data Shapleyを紹介する。
論文 参考訳(メタデータ) (2024-06-16T17:09:24Z) - CaPS: Collaborative and Private Synthetic Data Generation from Distributed Sources [5.898893619901382]
分散データホルダから合成データの協調的かつプライベートな生成のためのフレームワークを提案する。
我々は信頼されたアグリゲータをセキュアなマルチパーティ計算プロトコルに置き換え、差分プライバシー(DP)を介してプライバシを出力する。
MWEM+PGMおよびAIMの最先端選択測度生成アルゴリズムに対するアプローチの適用性とスケーラビリティを実証する。
論文 参考訳(メタデータ) (2024-02-13T17:26:32Z) - Data Acquisition: A New Frontier in Data-centric AI [65.90972015426274]
まず、現在のデータマーケットプレースを調査し、データセットに関する詳細な情報を提供するプラットフォームが不足していることを明らかにする。
次に、データプロバイダと取得者間のインタラクションをモデル化するベンチマークであるDAMチャレンジを紹介します。
提案手法の評価は,機械学習における効果的なデータ取得戦略の必要性を浮き彫りにしている。
論文 参考訳(メタデータ) (2023-11-22T22:15:17Z) - Data-centric AI: Perspectives and Challenges [51.70828802140165]
データ中心AI(DCAI)は、モデル進歩からデータ品質と信頼性の確保への根本的なシフトを提唱している。
データ開発、推論データ開発、データメンテナンスの3つの一般的なミッションをまとめます。
論文 参考訳(メタデータ) (2023-01-12T05:28:59Z) - Mechanisms that Incentivize Data Sharing in Federated Learning [90.74337749137432]
我々は、データ共有の利点が完全に損なわれているような、ナイーブなスキームが破滅的なフリーライディングのレベルにどのように結びつくかを示す。
次に,各エージェントが生成するデータ量を最大化する精度形成機構を導入する。
論文 参考訳(メタデータ) (2022-07-10T22:36:52Z) - Data Sharing Markets [95.13209326119153]
我々は、各エージェントがデータの買い手および売り手の両方になり得る設定について検討する。
両データ交換(データ付きトレーディングデータ)と一方データ交換(お金付きトレーディングデータ)の2つの事例を考察する。
論文 参考訳(メタデータ) (2021-07-19T06:00:34Z) - Modeling Stakeholder-centric Value Chain of Data to Understand Data
Exchange Ecosystem [0.12891210250935145]
本稿では,データビジネスにおける利害関係者間の関係に着目し,利害関係者中心の価値連鎖(SVC)を記述するモデルを提案する。
SVCモデルは、データ交換エコシステムの構造的特性の分析と理解を可能にする。
論文 参考訳(メタデータ) (2020-05-22T05:04:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。