論文の概要: Learn then Decide: A Learning Approach for Designing Data Marketplaces
- arxiv url: http://arxiv.org/abs/2503.10773v1
- Date: Thu, 13 Mar 2025 18:07:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-17 13:09:16.168721
- Title: Learn then Decide: A Learning Approach for Designing Data Marketplaces
- Title(参考訳): 意思決定を学ぶ: データマーケットプレースを設計するための学習アプローチ
- Authors: Yingqi Gao, Jin Zhou, Hua Zhou, Yong Chen, Xiaowu Dai,
- Abstract要約: 最大競売価格(MAPP)機構を導入する。
MAPPはまずオークションを通じて入札者の価値分布を推定し、次に最適な上場価格を決定する。
提案手法は,O_p(T-1/2(log T)2)$の平均的累積的後悔度を$O_p(T-1/2(log T)2)$で収束させることで,非回帰学習を実現する。
- 参考スコア(独自算出の注目度): 7.735168612333275
- License:
- Abstract: As data marketplaces become increasingly central to the digital economy, it is crucial to design efficient pricing mechanisms that optimize revenue while ensuring fair and adaptive pricing. We introduce the Maximum Auction-to-Posted Price (MAPP) mechanism, a novel two-stage approach that first estimates the bidders' value distribution through auctions and then determines the optimal posted price based on the learned distribution. We establish that MAPP is individually rational and incentive-compatible, ensuring truthful bidding while balancing revenue maximization with minimal price discrimination. MAPP achieves a regret of $O_p(n^{-1})$ when incorporating historical bid data, where $n$ is the number of bids in the current round. It outperforms existing methods while imposing weaker distributional assumptions. For sequential dataset sales over $T$ rounds, we propose an online MAPP mechanism that dynamically adjusts pricing across datasets with varying value distributions. Our approach achieves no-regret learning, with the average cumulative regret converging at a rate of $O_p(T^{-1/2}(\log T)^2)$. We validate the effectiveness of MAPP through simulations and real-world data from the FCC AWS-3 spectrum auction.
- Abstract(参考訳): データ市場がデジタル経済の中心となるにつれ、公正で適応的な価格を確保しつつ、収益を最適化する効率的な価格メカニズムを設計することが不可欠である。
提案手法は,競売を通じて入札者の価値分布を推定し,学習した分布に基づいて最適な上場価格を決定する新しい2段階のアプローチである。
我々は,MAPPが個々に合理的かつインセンティブに適合し,収益の最大化と最小価格の差別のバランスを保ちつつ,真正な入札を確保することを確立する。
MAPPは、過去の入札データを組み込んだ場合、$O_p(n^{-1})$を後悔する。
これは、より弱い分布仮定を示唆しながら、既存の方法より優れている。
価格分布の異なるデータセット間の価格を動的に調整するオンラインMAPP機構を提案する。
提案手法は,O_p(T^{-1/2}(\log T)^2)$の確率で平均累積的後悔が収束し,非回帰学習を実現する。
FCC AWS-3スペクトルオークションのシミュレーションと実世界のデータを用いて,MAPPの有効性を検証する。
関連論文リスト
- An Instrumental Value for Data Production and its Application to Data Pricing [107.98697414652479]
本稿では,データ生成プロセスのインストゥルメンタルな価値を捉えるためのアプローチを開発する。
情報経済学における情報設計と信号の古典的概念とどのように結びつくかを示す。
論文 参考訳(メタデータ) (2024-12-24T03:53:57Z) - Procurement Auctions via Approximately Optimal Submodular Optimization [53.93943270902349]
競売業者がプライベートコストで戦略的売り手からサービスを取得しようとする競売について検討する。
我々の目標は、取得したサービスの品質と販売者の総コストとの差を最大化する計算効率の良いオークションを設計することである。
論文 参考訳(メタデータ) (2024-11-20T18:06:55Z) - Fair Allocation in Dynamic Mechanism Design [57.66441610380448]
競売業者が各ラウンドの買い手グループに、合計で$T$で分けない商品を販売している問題を考える。
競売人は、各グループの最低平均配分を保証する公正な制約に固執しつつ、割引された全体の収益を最大化することを目的としている。
論文 参考訳(メタデータ) (2024-05-31T19:26:05Z) - Conformal Online Auction Design [6.265829744417118]
COADは入札者とアイテム機能の両方を取り入れ、オンラインオークションのインセンティブ互換メカニズムを提供する。
この手法は、共形予測手法を用いて、分布のない予測間隔に基づくアプローチを採用する。
COADは、ランダムフォレスト、カーネルメソッド、ディープニューラルネットを含む、幅広い現代的な機械学習手法の使用を認めている。
論文 参考訳(メタデータ) (2024-05-11T15:28:25Z) - Monte Carlo Tree Search Boosts Reasoning via Iterative Preference Learning [55.96599486604344]
本稿では,Large Language Models (LLMs) の推論能力向上を目的とした,反復的な選好学習プロセスによるアプローチを提案する。
我々は、MCTS(Monte Carlo Tree Search)を用いて好みデータを反復的に収集し、そのルックアヘッド機能を利用して、インスタンスレベルの報酬をよりきめ細かいステップレベルの信号に分解する。
提案アルゴリズムはDPO(Direct Preference Optimization)を用いて,新たに生成されたステップレベルの優先度データを用いてLCMポリシーを更新する。
論文 参考訳(メタデータ) (2024-05-01T11:10:24Z) - Dynamic Pricing with Volume Discounts in Online Settings [102.00782184214326]
本稿では,電子商取引における客観的機能が利益であり,取引データのみが利用可能である場合の価格設定に焦点を当てる。
我々の研究は、異なるボリューム閾値で最適な価格を定め、異なるクラスのユーザーに提供する価格戦略を見つけることを目的としている。
我々は、オンライン形式でデータを活用できる2段階のオンライン学習アルゴリズムBを設計する。
論文 参考訳(メタデータ) (2022-11-17T16:01:06Z) - VFed-SSD: Towards Practical Vertical Federated Advertising [53.08038962443853]
本稿では,2つの制限を緩和する半教師付き分割蒸留フレームワーク VFed-SSD を提案する。
具体的には,垂直分割された未ラベルデータを利用する自己教師型タスクMatchedPair Detection (MPD) を開発する。
当社のフレームワークは,デプロイコストの最小化と大幅なパフォーマンス向上を図った,リアルタイム表示広告のための効率的なフェデレーション強化ソリューションを提供する。
論文 参考訳(メタデータ) (2022-05-31T17:45:30Z) - Arbitrary Distribution Modeling with Censorship in Real-Time Bidding
Advertising [2.562910030418378]
インベントリプライシングの目的は、オンライン広告の機会に適切な価格を入札することであり、これはデマンド・サイド・プラットフォーム(DSP)がリアルタイム入札(RTB)で競売に勝つために不可欠である。
以前の作品の多くは、勝利価格の分布形式を強く仮定し、その正確さを減らし、一般化する能力を弱めた。
我々は,新たな損失関数であるNLL(Neighborhood Likelihood Loss)を提案し,検閲下での勝利価格分布を予測するためのフレームワークであるArbitrary Distribution Modeling(ADM)と協調する。
論文 参考訳(メタデータ) (2021-10-26T11:40:00Z) - Markdowns in E-Commerce Fresh Retail: A Counterfactual Prediction and
Multi-Period Optimization Approach [29.11201102550876]
半パラメトリック構造モデルを構築し、価格の弾力性を学習し、対物需要を予測する。
本稿では,有限販売地平線上での消耗品全体の利益を最大化するために,多周期動的価格アルゴリズムを提案する。
提案されたフレームワークは、よく知られたeコマースの新鮮な小売シナリオであるFreshippoにうまくデプロイされている。
論文 参考訳(メタデータ) (2021-05-18T07:01:37Z) - A Game-Theoretic Analysis of the Empirical Revenue Maximization
Algorithm with Endogenous Sampling [19.453243313852557]
実証収益最大化(ERM)はオークションデザインにおいて最も重要な価格学習アルゴリズムの1つである。
我々は、Laviらによって提案されたインセンティブ認識尺度の定義を一般化し、$N$の入力サンプルから$mge 1$の変化によるERMの出力価格の低減を定量化する。
本研究では, 単価オークションにおいて, 単価オークションにおけるグループインセンティブ・コンパチビリティを近似的に示すために, ERM を用いた効率よく, ほぼインセンティブに適合し, 収益に最適な学習アルゴリズムを構築した。
論文 参考訳(メタデータ) (2020-10-12T08:20:35Z) - Scalable Bid Landscape Forecasting in Real-time Bidding [12.692521867728091]
プログラム広告では、広告スロットは通常、第二価格(SP)オークションを使ってリアルタイムで販売される。
SPでは、1つの項目に対して、各入札者の支配的な戦略は、入札者の視点から真の価値を入札することである。
本稿では,ヘテロセダスティックな完全パラメトリック・レグレッション・アプローチと混合密度・レグレッション・ネットワークを提案する。
論文 参考訳(メタデータ) (2020-01-18T03:20:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。