論文の概要: Dynamic Incentive-aware Learning: Robust Pricing in Contextual Auctions
- arxiv url: http://arxiv.org/abs/2002.11137v1
- Date: Tue, 25 Feb 2020 19:00:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-28 21:20:36.946917
- Title: Dynamic Incentive-aware Learning: Robust Pricing in Contextual Auctions
- Title(参考訳): 動的インセンティブ認識学習:コンテキストオークションにおけるロバスト価格
- Authors: Negin Golrezaei, Adel Javanmard and Vahab Mirrokni
- Abstract要約: 我々は、文脈的な第2価格オークションにおいて、戦略的買い手に対する準備価格の堅牢な学習の問題を考察する。
このような戦略的行動に頑健な学習方針を提案する。
- 参考スコア(独自算出の注目度): 13.234975857626752
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Motivated by pricing in ad exchange markets, we consider the problem of
robust learning of reserve prices against strategic buyers in repeated
contextual second-price auctions. Buyers' valuations for an item depend on the
context that describes the item. However, the seller is not aware of the
relationship between the context and buyers' valuations, i.e., buyers'
preferences. The seller's goal is to design a learning policy to set reserve
prices via observing the past sales data, and her objective is to minimize her
regret for revenue, where the regret is computed against a clairvoyant policy
that knows buyers' heterogeneous preferences. Given the seller's goal,
utility-maximizing buyers have the incentive to bid untruthfully in order to
manipulate the seller's learning policy. We propose learning policies that are
robust to such strategic behavior. These policies use the outcomes of the
auctions, rather than the submitted bids, to estimate the preferences while
controlling the long-term effect of the outcome of each auction on the future
reserve prices. When the market noise distribution is known to the seller, we
propose a policy called Contextual Robust Pricing (CORP) that achieves a
T-period regret of $O(d\log(Td) \log (T))$, where $d$ is the dimension of {the}
contextual information. When the market noise distribution is unknown to the
seller, we propose two policies whose regrets are sublinear in $T$.
- Abstract(参考訳): 広告交換市場における価格設定に動機づけられ,コンテクスト2次価格オークションにおいて,戦略購入者に対する準備価格の堅牢な学習が課題となっている。
アイテムの購入者の評価は、そのアイテムを記述するコンテキストに依存する。
しかし、売り手は、コンテキストと購入者の評価、すなわち購入者の選好との関係を意識していない。
売り手の目的は、過去の販売データを観察して準備価格を設定するための学習政策を設計することであり、その目的は、購入者の不均一な嗜好を知っており、不均一な政策に対して後悔を和らげることである。
売り手の目標を考えると、ユーティリティを最大化する買い手は、売り手の学習方針を操作するために不正に入札するインセンティブを持つ。
このような戦略的行動に頑健な学習方針を提案する。
これらの政策は、提出された入札ではなく、オークションの結果を用いて、各オークションの結果が将来の準備価格に与える影響を制御しながら、好みを見積もる。
マーケットノイズの分布が売り手に知られる場合,$O(d\log(Td) \log (T))$ の T 周期的後悔を実現する Contextual Robust Pricing (CORP) というポリシーを提案し,$d$ は {the} コンテキスト情報の次元である。
売り手にとってマーケットノイズの分布が不明な場合には, 後悔がサブリニアな2つのポリシーを提案する。
関連論文リスト
- A pragmatic policy learning approach to account for users' fatigue in repeated auctions [47.75983850930121]
MLモデルは、前回のオークションが現在の機会価値をどの程度獲得したかを予測することができる。
この予測を用いて、現在の競売の予想利益を最大化する政策を、患者と呼ぶことができる。
我々は、このコストの浸透の重要性について、実証的な2つの論証を提示した。
論文 参考訳(メタデータ) (2024-07-15T07:53:29Z) - A Primal-Dual Online Learning Approach for Dynamic Pricing of Sequentially Displayed Complementary Items under Sale Constraints [54.46126953873298]
顧客に対して順次表示される補完アイテムの動的価格設定の問題に対処する。
各項目の価格を個別に最適化するのは効果がないため、補完項目のコヒーレントな価格ポリシーが不可欠である。
実世界のデータからランダムに生成した合成設定を用いて,我々のアプローチを実証的に評価し,制約違反や後悔の観点からその性能を比較した。
論文 参考訳(メタデータ) (2024-07-08T09:55:31Z) - Nearly Optimal Algorithms for Contextual Dueling Bandits from Adversarial Feedback [58.66941279460248]
人からのフィードバックから学ぶことは、大言語モデル(LLM)のような生成モデルを調整する上で重要な役割を果たす
本稿では,本問題の領域内モデルについて考察する。-文脈的デュエルバンディットと敵対的フィードバックを併用し,真の嗜好ラベルを敵によって反転させることができる。
本稿では,不確実性重み付き最大推定に基づく頑健なコンテキストデュエルバンドイット(アルゴ)を提案する。
論文 参考訳(メタデータ) (2024-04-16T17:59:55Z) - Dynamic Pricing and Learning with Long-term Reference Effects [16.07344044662994]
本研究では,販売者が提示した過去の価格の基準価格が平均値となる,シンプルで斬新な参照価格メカニズムについて検討する。
このメカニズムの下では,モデルパラメータに関係なく,マークダウンポリシがほぼ最適であることを示す。
次に、需要モデルパラメータが不明な、より困難な動的価格と学習の問題について検討する。
論文 参考訳(メタデータ) (2024-02-19T21:36:54Z) - Contextual Dynamic Pricing with Strategic Buyers [93.97401997137564]
戦略的買い手によるコンテキスト動的価格問題について検討する。
売り手は買い手の真の特徴を観察せず、買い手の戦略行動に応じて操作された特徴を観察する。
本稿では,販売者の累積収益を最大化するために,購入者の戦略的行動をオンライン学習に取り入れた戦略的動的価格政策を提案する。
論文 参考訳(メタデータ) (2023-07-08T23:06:42Z) - Dynamic Pricing and Learning with Bayesian Persuasion [18.59029578133633]
我々は,商品の価格設定に加えて,販売者が「広告計画」にコミットする,新たな動的価格設定と学習環境を考える。
我々は、バイエルンの一般的な説得フレームワークを使用して、これらのシグナルが購入者の評価と購入反応に与える影響をモデル化する。
我々は、過去の購入応答を利用して最適な価格と広告戦略を適応的に学習できるオンラインアルゴリズムを設計する。
論文 参考訳(メタデータ) (2023-04-27T17:52:06Z) - A Reinforcement Learning Approach in Multi-Phase Second-Price Auction
Design [158.0041488194202]
多相第2価格オークションにおけるリザーブ価格の最適化について検討する。
売り手の視点からは、潜在的に非現実的な入札者の存在下で、環境を効率的に探索する必要がある。
第三に、売り手のステップごとの収益は未知であり、非線形であり、環境から直接観察することさえできない。
論文 参考訳(メタデータ) (2022-10-19T03:49:05Z) - Price DOES Matter! Modeling Price and Interest Preferences in
Session-based Recommendation [55.0391061198924]
セッションベースのレコメンデーションは、匿名ユーザが自分の短い行動シーケンスに基づいて購入したいアイテムを予測することを目的としている。
セッションベースのレコメンデーションの価格設定を組み込むのは簡単ではない。
セッションベースレコメンデーションのためのCoHHN(Co-guided Heterogeneous Hypergraph Network)を提案する。
論文 参考訳(メタデータ) (2022-05-09T10:47:15Z) - Distribution-free Contextual Dynamic Pricing [5.773269033551628]
コンテキスト動的価格設定は、顧客との逐次的なインタラクションに基づいてパーソナライズされた価格を設定することを目的としている。
本稿では,未知のランダムノイズを伴う文脈的動的価格を評価モデルで検討する。
我々の流通自由価格政策は、コンテキスト関数と市場ノイズの両方を同時に学習する。
論文 参考訳(メタデータ) (2021-09-15T14:52:44Z) - Learning to Price Against a Moving Target [23.085429420254787]
買い手の価値が移動目標である、すなわち時間とともに変化する問題について検討する。
いずれの場合も、最適収益損失の上限は上下限である。
論文 参考訳(メタデータ) (2021-06-08T20:57:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。