論文の概要: Auction Design using Value Prediction with Hallucinations
- arxiv url: http://arxiv.org/abs/2502.08792v1
- Date: Wed, 12 Feb 2025 21:08:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-14 13:45:00.088184
- Title: Auction Design using Value Prediction with Hallucinations
- Title(参考訳): 幻覚を用いた価値予測を用いたオークションデザイン
- Authors: Ilan Lobel, Humberto Moreira, Omar Mouchtaki,
- Abstract要約: 我々は,販売者がn人の買い手に対して不可分な商品を売って収益を最大化しようとする問題について検討する。
本稿では,これらの信号が買い手の真の価値を反映することがあるが,時には幻覚となるような枠組みを提案する。
我々の主な貢献は、この枠組みの下での最適オークションのキャラクタリゼーションである。
- 参考スコア(独自算出の注目度): 2.4305626489408465
- License:
- Abstract: We investigate a Bayesian mechanism design problem where a seller seeks to maximize revenue by selling an indivisible good to one of n buyers, incorporating potentially unreliable predictions (signals) of buyers' private values derived from a machine learning model. We propose a framework where these signals are sometimes reflective of buyers' true valuations but other times are hallucinations, which are uncorrelated with the buyers' true valuations. Our main contribution is a characterization of the optimal auction under this framework. Our characterization establishes a near-decomposition of how to treat types above and below the signal. For the one buyer case, the seller's optimal strategy is to post one of three fairly intuitive prices depending on the signal, which we call the "ignore", "follow" and "cap" actions.
- Abstract(参考訳): 我々は,販売者が納品品をn人の購入者に販売することで収益を最大化しようとするベイズ機構設計問題について検討し,機械学習モデルに基づく購入者の個人価値の予測(署名)を潜在的に信頼できないものにする。
本稿では,これらの信号が買い手の真の価値を反映することがあるが,他の場合には幻覚であり,買い手の真の価値とは無関係である,という枠組みを提案する。
我々の主な貢献は、この枠組みの下での最適オークションのキャラクタリゼーションである。
我々の特徴は、信号の上下のタイプをどのように扱うかの、ほぼ分解を定めている。
1人の買い手にとって、売り手の最適な戦略は、信号によってかなり直感的な3つの価格の1つを投稿することである。
関連論文リスト
- A pragmatic policy learning approach to account for users' fatigue in repeated auctions [47.75983850930121]
MLモデルは、前回のオークションが現在の機会価値をどの程度獲得したかを予測することができる。
この予測を用いて、現在の競売の予想利益を最大化する政策を、患者と呼ぶことができる。
我々は、このコストの浸透の重要性について、実証的な2つの論証を提示した。
論文 参考訳(メタデータ) (2024-07-15T07:53:29Z) - Nearly Optimal Algorithms for Contextual Dueling Bandits from Adversarial Feedback [58.66941279460248]
人からのフィードバックから学ぶことは、大言語モデル(LLM)のような生成モデルを調整する上で重要な役割を果たす
本稿では,本問題の領域内モデルについて考察する。-文脈的デュエルバンディットと敵対的フィードバックを併用し,真の嗜好ラベルを敵によって反転させることができる。
本稿では,不確実性重み付き最大推定に基づく頑健なコンテキストデュエルバンドイット(アルゴ)を提案する。
論文 参考訳(メタデータ) (2024-04-16T17:59:55Z) - A Reinforcement Learning Approach in Multi-Phase Second-Price Auction
Design [158.0041488194202]
多相第2価格オークションにおけるリザーブ価格の最適化について検討する。
売り手の視点からは、潜在的に非現実的な入札者の存在下で、環境を効率的に探索する必要がある。
第三に、売り手のステップごとの収益は未知であり、非線形であり、環境から直接観察することさえできない。
論文 参考訳(メタデータ) (2022-10-19T03:49:05Z) - Price DOES Matter! Modeling Price and Interest Preferences in
Session-based Recommendation [55.0391061198924]
セッションベースのレコメンデーションは、匿名ユーザが自分の短い行動シーケンスに基づいて購入したいアイテムを予測することを目的としている。
セッションベースのレコメンデーションの価格設定を組み込むのは簡単ではない。
セッションベースレコメンデーションのためのCoHHN(Co-guided Heterogeneous Hypergraph Network)を提案する。
論文 参考訳(メタデータ) (2022-05-09T10:47:15Z) - Fast Rate Learning in Stochastic First Price Bidding [0.0]
ファーストプライスのオークションは、プログラム広告におけるビックレーのオークションに基づく伝統的な入札アプローチを大きく置き換えている。
対戦相手の最大入札分布が分かっている場合, 後悔度を著しく低くする方法を示す。
我々のアルゴリズムは、様々な入札分布の文献で提案されている選択肢よりもはるかに高速に収束する。
論文 参考訳(メタデータ) (2021-07-05T07:48:52Z) - A Regret Analysis of Bilateral Trade [5.031063690574698]
我々は、売り手/買い手の相互作用のラウンド上の後悔最小化フレームワークに二国間貿易問題で初めてキャストしました。
私達の主な貢献は異なったモデルのフィードバックおよび私用評価の固定価格のメカニズムのための後悔の体制の完全な特徴付けです。
論文 参考訳(メタデータ) (2021-02-16T08:53:17Z) - Certifying Strategyproof Auction Networks [53.37051312298459]
我々は、任意の数のアイテムと参加者でオークションを表現できるRegretNetアーキテクチャに焦点を当てる。
本稿では,ニューラルネットワーク検証文献から得られた手法を用いて,特定の評価プロファイルの下で戦略の安全性を明示的に検証する方法を提案する。
論文 参考訳(メタデータ) (2020-06-15T20:22:48Z) - VCG Mechanism Design with Unknown Agent Values under Stochastic Bandit
Feedback [104.06766271716774]
本研究では,エージェントが自己の価値を知らない場合に,マルチラウンドの福祉最大化機構設計問題について検討する。
まず、福祉に対する後悔の3つの概念、各エージェントの個々のユーティリティ、メカニズムの3つの概念を定義します。
当社のフレームワークは価格体系を柔軟に制御し、エージェントと販売者の後悔のトレードオフを可能にする。
論文 参考訳(メタデータ) (2020-04-19T18:00:58Z) - Optimal No-regret Learning in Repeated First-price Auctions [38.908235632001116]
オンライン学習を反復した初価オークションで研究する。
我々は,ほぼ最適の$widetildeO(sqrtT)$ regret boundを達成するための最初の学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-03-22T03:32:09Z) - Dynamic Incentive-aware Learning: Robust Pricing in Contextual Auctions [13.234975857626752]
我々は、文脈的な第2価格オークションにおいて、戦略的買い手に対する準備価格の堅牢な学習の問題を考察する。
このような戦略的行動に頑健な学習方針を提案する。
論文 参考訳(メタデータ) (2020-02-25T19:00:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。