論文の概要: How to Sell High-Dimensional Data Optimally
- arxiv url: http://arxiv.org/abs/2510.15214v1
- Date: Fri, 17 Oct 2025 00:49:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-20 20:17:34.424632
- Title: How to Sell High-Dimensional Data Optimally
- Title(参考訳): 高次元データを最適に販売する方法
- Authors: Andrew Li, R. Ravi, Karan Singh, Zihong Yi, Weizhong Zhang,
- Abstract要約: 意思決定バイヤーと独占販売者を含む情報価格の問題を考える。
買い手は、国家のより正確な評価によるより良い判断により、より大きな実用性を得るので、売り手は、価格で補足情報を約束することができる。
本稿では,状態空間へのアクセスのみをサンプリングするアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 31.69704731506027
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Motivated by the problem of selling large, proprietary data, we consider an information pricing problem proposed by Bergemann et al. that involves a decision-making buyer and a monopolistic seller. The seller has access to the underlying state of the world that determines the utility of the various actions the buyer may take. Since the buyer gains greater utility through better decisions resulting from more accurate assessments of the state, the seller can therefore promise the buyer supplemental information at a price. To contend with the fact that the seller may not be perfectly informed about the buyer's private preferences (or utility), we frame the problem of designing a data product as one where the seller designs a revenue-maximizing menu of statistical experiments. Prior work by Cai et al. showed that an optimal menu can be found in time polynomial in the state space, whereas we observe that the state space is naturally exponential in the dimension of the data. We propose an algorithm which, given only sampling access to the state space, provably generates a near-optimal menu with a number of samples independent of the state space. We then analyze a special case of high-dimensional Gaussian data, showing that (a) it suffices to consider scalar Gaussian experiments, (b) the optimal menu of such experiments can be found efficiently via a semidefinite program, and (c) full surplus extraction occurs if and only if a natural separation condition holds on the set of potential preferences of the buyer.
- Abstract(参考訳): 大規模でプロプライエタリなデータ販売の問題に触発された我々は、意思決定の買い手と独占的な売り手を含むベルゲマンらによって提案された情報価格の問題を考える。
売り手は世界の根底にある状態にアクセスでき、買い手が取るべき様々な行動の効用を決定する。
買い手は、国家のより正確な評価によるより良い判断によってより大きな実用性を得るので、売り手は買い手補充情報を価格で約束することができる。
売り手が買い手のプライベートな好み(あるいはユーティリティ)について完全には知らされていないという事実と対立するため、統計的実験の収益を最大化するメニューを設計する際の問題として、データプロダクトを設計する。
Cai らによる以前の研究は、状態空間の時間多項式に最適なメニューが見つかることを示し、一方、状態空間はデータ次元において自然指数的であることを示した。
本稿では,状態空間へのアクセスのみをサンプリングするアルゴリズムを提案する。
そして、高次元ガウスデータの特殊なケースを分析し、それを示します。
(a)スカラーガウスの実験を考えるのに十分である。
b) この実験の最適メニューは、半定値プログラムによって効率よく見つけることができ、
(c) 完全な余剰抽出は、自然分離条件が買い手の潜在的な嗜好のセットに当てはまる場合にのみ発生する。
関連論文リスト
- An Instrumental Value for Data Production and its Application to Data Pricing [107.98697414652479]
本稿では,データ生成プロセスのインストゥルメンタルな価値を捉えるためのアプローチを開発する。
情報経済学における情報設計と信号の古典的概念とどのように結びつくかを示す。
論文 参考訳(メタデータ) (2024-12-24T03:53:57Z) - Private, Augmentation-Robust and Task-Agnostic Data Valuation Approach for Data Marketplace [56.78396861508909]
PriArTaは、買い手の既存のデータセットと売り手のデータセットの分布の間の距離を計算するアプローチである。
PriArTaは通信効率が良く、買い手は各売り手からデータセット全体にアクセスすることなくデータセットを評価することができる。
論文 参考訳(メタデータ) (2024-11-01T17:13:14Z) - Data Distribution Valuation [56.71023681599737]
既存のデータバリュエーションメソッドは、離散データセットの値を定義します。
多くのユースケースでは、ユーザはデータセットの値だけでなく、データセットがサンプリングされた分布の値にも興味を持っています。
本稿では,理論的原理と実行可能なポリシを実現するための,MMDに基づく評価手法を提案する。
論文 参考訳(メタデータ) (2024-10-06T07:56:53Z) - Data Market Design through Deep Learning [16.505791601397185]
収益最適化データ市場の設計におけるディープラーニングの適用について紹介する。
我々の実験は、この新しいディープラーニングフレームワークが、既知のすべてのソリューションを理論からほぼ正確に複製できることを示した。
論文 参考訳(メタデータ) (2023-10-31T00:21:09Z) - Striking a Balance: An Optimal Mechanism Design for Heterogenous Differentially Private Data Acquisition for Logistic Regression [7.523820334642733]
プライバシに敏感な販売者のデータを用いて機械学習タスクを解決するという課題に対処する。
データは非公開なので、支払いと引き換えに販売者にデータを提供するインセンティブを与えるデータ市場を設計します。
論文 参考訳(メタデータ) (2023-09-19T05:51:13Z) - Large Language Models Are Not Robust Multiple Choice Selectors [117.72712117510953]
複数選択質問(MCQ)は、大規模言語モデル(LLM)の評価において、一般的なが重要なタスク形式として機能する。
この研究は、現代のLLMが、その固有の「選択バイアス」によるオプション位置変化に対して脆弱であることを示している。
そこで本研究では,オプションIDに対する事前バイアスを全体予測分布から分離するPriDeという,ラベルのない推論時間脱バイアス手法を提案する。
論文 参考訳(メタデータ) (2023-09-07T17:44:56Z) - Fundamentals of Task-Agnostic Data Valuation [21.78555506720078]
データ検索/購入者のためのデータ所有者/販売者のデータ評価について検討する。
検証の必要なく、タスクに依存しないデータ評価に重点を置いています。
論文 参考訳(メタデータ) (2022-08-25T22:07:07Z) - An Experimental Design Perspective on Model-Based Reinforcement Learning [73.37942845983417]
環境からの状態遷移を観察するのは費用がかかる。
標準RLアルゴリズムは通常、学習するために多くの観測を必要とする。
本稿では,マルコフ決定過程について,状態-作用対がどの程度の情報を提供するかを定量化する獲得関数を提案する。
論文 参考訳(メタデータ) (2021-12-09T23:13:57Z) - Spatial Privacy Pricing: The Interplay between Privacy, Utility and
Price in Geo-Marketplaces [14.466602643062142]
プライバシーに関心のあるユーザーは、位置情報を正確に特定するデータに対してより多くの料金を請求するかもしれない。
買い手はデータコストを最小限に抑えることを好むが、必要なレベルの精度を得るためにはより多くの費用を費やす必要があるかもしれない。
これをプライバシ、ユーティリティ、価格空間のプライバシ価格の相互作用と呼んでいる。
論文 参考訳(メタデータ) (2020-08-25T06:28:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。