論文の概要: Dynamic Incentive-aware Learning: Robust Pricing in Contextual Auctions
- arxiv url: http://arxiv.org/abs/2002.11137v1
- Date: Tue, 25 Feb 2020 19:00:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-28 21:20:36.946917
- Title: Dynamic Incentive-aware Learning: Robust Pricing in Contextual Auctions
- Title(参考訳): 動的インセンティブ認識学習:コンテキストオークションにおけるロバスト価格
- Authors: Negin Golrezaei, Adel Javanmard and Vahab Mirrokni
- Abstract要約: 我々は、文脈的な第2価格オークションにおいて、戦略的買い手に対する準備価格の堅牢な学習の問題を考察する。
このような戦略的行動に頑健な学習方針を提案する。
- 参考スコア(独自算出の注目度): 13.234975857626752
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Motivated by pricing in ad exchange markets, we consider the problem of
robust learning of reserve prices against strategic buyers in repeated
contextual second-price auctions. Buyers' valuations for an item depend on the
context that describes the item. However, the seller is not aware of the
relationship between the context and buyers' valuations, i.e., buyers'
preferences. The seller's goal is to design a learning policy to set reserve
prices via observing the past sales data, and her objective is to minimize her
regret for revenue, where the regret is computed against a clairvoyant policy
that knows buyers' heterogeneous preferences. Given the seller's goal,
utility-maximizing buyers have the incentive to bid untruthfully in order to
manipulate the seller's learning policy. We propose learning policies that are
robust to such strategic behavior. These policies use the outcomes of the
auctions, rather than the submitted bids, to estimate the preferences while
controlling the long-term effect of the outcome of each auction on the future
reserve prices. When the market noise distribution is known to the seller, we
propose a policy called Contextual Robust Pricing (CORP) that achieves a
T-period regret of $O(d\log(Td) \log (T))$, where $d$ is the dimension of {the}
contextual information. When the market noise distribution is unknown to the
seller, we propose two policies whose regrets are sublinear in $T$.
- Abstract(参考訳): 広告交換市場における価格設定に動機づけられ,コンテクスト2次価格オークションにおいて,戦略購入者に対する準備価格の堅牢な学習が課題となっている。
アイテムの購入者の評価は、そのアイテムを記述するコンテキストに依存する。
しかし、売り手は、コンテキストと購入者の評価、すなわち購入者の選好との関係を意識していない。
売り手の目的は、過去の販売データを観察して準備価格を設定するための学習政策を設計することであり、その目的は、購入者の不均一な嗜好を知っており、不均一な政策に対して後悔を和らげることである。
売り手の目標を考えると、ユーティリティを最大化する買い手は、売り手の学習方針を操作するために不正に入札するインセンティブを持つ。
このような戦略的行動に頑健な学習方針を提案する。
これらの政策は、提出された入札ではなく、オークションの結果を用いて、各オークションの結果が将来の準備価格に与える影響を制御しながら、好みを見積もる。
マーケットノイズの分布が売り手に知られる場合,$O(d\log(Td) \log (T))$ の T 周期的後悔を実現する Contextual Robust Pricing (CORP) というポリシーを提案し,$d$ は {the} コンテキスト情報の次元である。
売り手にとってマーケットノイズの分布が不明な場合には, 後悔がサブリニアな2つのポリシーを提案する。
関連論文リスト
- Dynamic Pricing and Learning with Long-term Reference Effects [18.988640613396118]
本研究では,販売者が提示した過去の価格の基準価格が平均値となる,シンプルで斬新な参照価格メカニズムについて検討する。
このメカニズムの下では,モデルパラメータに関係なく,マークダウンポリシがほぼ最適であることを示す。
次に、需要モデルパラメータが不明な、より困難な動的価格と学習の問題について検討する。
論文 参考訳(メタデータ) (2024-02-19T21:36:54Z) - Contextual Dynamic Pricing with Strategic Buyers [105.79693016985807]
戦略的買い手によるコンテキスト動的価格問題について検討する。
売り手は買い手の真の特徴を観察せず、買い手の戦略行動に応じて操作された特徴を観察する。
本稿では,販売者の累積収益を最大化するために,購入者の戦略的行動をオンライン学習に取り入れた戦略的動的価格政策を提案する。
論文 参考訳(メタデータ) (2023-07-08T23:06:42Z) - Dynamic Pricing and Learning with Bayesian Persuasion [18.59029578133633]
我々は,商品の価格設定に加えて,販売者が「広告計画」にコミットする,新たな動的価格設定と学習環境を考える。
我々は、バイエルンの一般的な説得フレームワークを使用して、これらのシグナルが購入者の評価と購入反応に与える影響をモデル化する。
我々は、過去の購入応答を利用して最適な価格と広告戦略を適応的に学習できるオンラインアルゴリズムを設計する。
論文 参考訳(メタデータ) (2023-04-27T17:52:06Z) - Adaptive Risk-Aware Bidding with Budget Constraint in Display
Advertising [47.14651340748015]
本稿では,強化学習による予算制約を考慮した適応型リスク対応入札アルゴリズムを提案する。
リスク・アット・バリュー(VaR)に基づく不確実性とリスク傾向の本質的関係を理論的に明らかにする。
論文 参考訳(メタデータ) (2022-12-06T18:50:09Z) - A Reinforcement Learning Approach in Multi-Phase Second-Price Auction
Design [158.0041488194202]
多相第2価格オークションにおけるリザーブ価格の最適化について検討する。
売り手の視点からは、潜在的に非現実的な入札者の存在下で、環境を効率的に探索する必要がある。
第三に、売り手のステップごとの収益は未知であり、非線形であり、環境から直接観察することさえできない。
論文 参考訳(メタデータ) (2022-10-19T03:49:05Z) - Price DOES Matter! Modeling Price and Interest Preferences in
Session-based Recommendation [55.0391061198924]
セッションベースのレコメンデーションは、匿名ユーザが自分の短い行動シーケンスに基づいて購入したいアイテムを予測することを目的としている。
セッションベースのレコメンデーションの価格設定を組み込むのは簡単ではない。
セッションベースレコメンデーションのためのCoHHN(Co-guided Heterogeneous Hypergraph Network)を提案する。
論文 参考訳(メタデータ) (2022-05-09T10:47:15Z) - Distribution-free Contextual Dynamic Pricing [5.773269033551628]
コンテキスト動的価格設定は、顧客との逐次的なインタラクションに基づいてパーソナライズされた価格を設定することを目的としている。
本稿では,未知のランダムノイズを伴う文脈的動的価格を評価モデルで検討する。
我々の流通自由価格政策は、コンテキスト関数と市場ノイズの両方を同時に学習する。
論文 参考訳(メタデータ) (2021-09-15T14:52:44Z) - Learning to Price Against a Moving Target [23.085429420254787]
買い手の価値が移動目標である、すなわち時間とともに変化する問題について検討する。
いずれの場合も、最適収益損失の上限は上下限である。
論文 参考訳(メタデータ) (2021-06-08T20:57:11Z) - Fairness, Welfare, and Equity in Personalized Pricing [88.9134799076718]
顧客特性に基づくパーソナライズ価格における公平性、福祉、株式の配慮の相互作用について検討する。
選択ワクチンの価格補助金と、マイクロクレジットの下流結果に対するパーソナライズされた利率の影響の2つの設定において、パーソナライズされた価格の潜在的利点を示す。
論文 参考訳(メタデータ) (2020-12-21T01:01:56Z) - Adversarial Attacks on Linear Contextual Bandits [87.08004581867537]
悪意のあるエージェントは、望ましい行動を実行するためにバンディットアルゴリズムを攻撃するインセンティブを持つ可能性がある。
悪意のあるエージェントは、線形コンテキストのバンドイットアルゴリズムに任意のアーム$T - o(T)$倍を$T$ステップで引き出すように強制することができる。
また,悪意のあるエージェントが単一コンテキストにおける帯域幅アルゴリズムの動作に影響を与えることに関心がある場合についても検討する。
論文 参考訳(メタデータ) (2020-02-10T15:04:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。