Fugu-MT 論文翻訳(概要): Dynamic Incentive-aware Learning: Robust Pricing in Contextual Auctions

論文の概要: Dynamic Incentive-aware Learning: Robust Pricing in Contextual Auctions

arxiv url: http://arxiv.org/abs/2002.11137v1
Date: Tue, 25 Feb 2020 19:00:29 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-28 21:20:36.946917
Title: Dynamic Incentive-aware Learning: Robust Pricing in Contextual Auctions
Title（参考訳）: 動的インセンティブ認識学習:コンテキストオークションにおけるロバスト価格
Authors: Negin Golrezaei, Adel Javanmard and Vahab Mirrokni
Abstract要約: 我々は、文脈的な第2価格オークションにおいて、戦略的買い手に対する準備価格の堅牢な学習の問題を考察する。このような戦略的行動に頑健な学習方針を提案する。
参考スコア（独自算出の注目度）: 13.234975857626752
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Motivated by pricing in ad exchange markets, we consider the problem of robust learning of reserve prices against strategic buyers in repeated contextual second-price auctions. Buyers' valuations for an item depend on the context that describes the item. However, the seller is not aware of the relationship between the context and buyers' valuations, i.e., buyers' preferences. The seller's goal is to design a learning policy to set reserve prices via observing the past sales data, and her objective is to minimize her regret for revenue, where the regret is computed against a clairvoyant policy that knows buyers' heterogeneous preferences. Given the seller's goal, utility-maximizing buyers have the incentive to bid untruthfully in order to manipulate the seller's learning policy. We propose learning policies that are robust to such strategic behavior. These policies use the outcomes of the auctions, rather than the submitted bids, to estimate the preferences while controlling the long-term effect of the outcome of each auction on the future reserve prices. When the market noise distribution is known to the seller, we propose a policy called Contextual Robust Pricing (CORP) that achieves a T-period regret of $O(d\log(Td) \log (T))$, where $d$ is the dimension of {the} contextual information. When the market noise distribution is unknown to the seller, we propose two policies whose regrets are sublinear in $T$.
Abstract（参考訳）: 広告交換市場における価格設定に動機づけられ,コンテクスト2次価格オークションにおいて,戦略購入者に対する準備価格の堅牢な学習が課題となっている。アイテムの購入者の評価は、そのアイテムを記述するコンテキストに依存する。しかし、売り手は、コンテキストと購入者の評価、すなわち購入者の選好との関係を意識していない。売り手の目的は、過去の販売データを観察して準備価格を設定するための学習政策を設計することであり、その目的は、購入者の不均一な嗜好を知っており、不均一な政策に対して後悔を和らげることである。売り手の目標を考えると、ユーティリティを最大化する買い手は、売り手の学習方針を操作するために不正に入札するインセンティブを持つ。このような戦略的行動に頑健な学習方針を提案する。これらの政策は、提出された入札ではなく、オークションの結果を用いて、各オークションの結果が将来の準備価格に与える影響を制御しながら、好みを見積もる。マーケットノイズの分布が売り手に知られる場合,$O(d\log(Td) \log (T))$ の T 周期的後悔を実現する Contextual Robust Pricing (CORP) というポリシーを提案し,$d$ は {the} コンテキスト情報の次元である。売り手にとってマーケットノイズの分布が不明な場合には, 後悔がサブリニアな2つのポリシーを提案する。

関連論文リスト

Nonparametric Contextual Online Bilateral Trade [15.586783656868706]
文脈的オンライン二国間貿易の問題について検討する。学習者の目標は、両者間の貿易を促進するために価格を公表することである。階層木構築による文脈情報を活用するアルゴリズムを設計する。
論文参考訳（メタデータ） (2026-02-13T13:03:30Z)
Learning Steerable Clarification Policies with Collaborative Self-play [67.67872810596839]
不明瞭なクエリを処理するために、AIアシスタントは不確実性を管理するためのポリシーが必要である。我々は,この不確実性を管理するために,自己再生を用いて評価可能な政策を訓練することを提案する。このことが、提供されたコストに応じて予測可能な振る舞いを変更する、評価可能なポリシーにつながることを示す。
論文参考訳（メタデータ） (2025-12-03T18:49:54Z)
Optimal Nonlinear Online Learning under Sequential Price Competition via s-Concavity [24.586053819490985]
われわれは、複数の売り手の間での価格競争をT$の期間で検討している。売り手は価格を同時に提供し、それぞれの需要を競合相手に見つからないように監視する。すべての売り手が当社の政策を採用すると、その価格がナッシュ均衡価格に対して$O(T-1/7)のレートで収束し、もし売り手が十分に情報を得たらリーチできることが示される。
論文参考訳（メタデータ） (2025-03-20T22:51:03Z)
Fairness-aware Contextual Dynamic Pricing with Strategic Buyers [4.883313216485195]
本稿では,価格の公平性を同時に達成し,戦略的行動を阻害する動的価格政策を提案する。我々のポリシーは、$O(sqrt+H(T))$ regret over $T$ time horizons という上限を達成する。我々はまた、我々の問題設定の下で、いかなる価格ポリシーの低い限界を後悔する$Omega(sqrtT)を証明します。
論文参考訳（メタデータ） (2025-01-25T22:30:37Z)
A pragmatic policy learning approach to account for users' fatigue in repeated auctions [47.75983850930121]
MLモデルは、前回のオークションが現在の機会価値をどの程度獲得したかを予測することができる。この予測を用いて、現在の競売の予想利益を最大化する政策を、患者と呼ぶことができる。我々は、このコストの浸透の重要性について、実証的な2つの論証を提示した。
論文参考訳（メタデータ） (2024-07-15T07:53:29Z)
A Primal-Dual Online Learning Approach for Dynamic Pricing of Sequentially Displayed Complementary Items under Sale Constraints [54.46126953873298]
顧客に対して順次表示される補完アイテムの動的価格設定の問題に対処する。各項目の価格を個別に最適化するのは効果がないため、補完項目のコヒーレントな価格ポリシーが不可欠である。実世界のデータからランダムに生成した合成設定を用いて,我々のアプローチを実証的に評価し,制約違反や後悔の観点からその性能を比較した。
論文参考訳（メタデータ） (2024-07-08T09:55:31Z)
Nearly Optimal Algorithms for Contextual Dueling Bandits from Adversarial Feedback [58.66941279460248]
人からのフィードバックから学ぶことは、大言語モデル(LLM)のような生成モデルを調整する上で重要な役割を果たす本稿では,本問題の領域内モデルについて考察する。-文脈的デュエルバンディットと敵対的フィードバックを併用し,真の嗜好ラベルを敵によって反転させることができる。本稿では,不確実性重み付き最大推定に基づく頑健なコンテキストデュエルバンドイット(アルゴ)を提案する。
論文参考訳（メタデータ） (2024-04-16T17:59:55Z)
Language Models Can Reduce Asymmetry in Information Markets [100.38786498942702]
我々は、言語モデルを利用した知的エージェントが外部参加者に代わって情報を売買する、オープンソースのシミュレートされたデジタルマーケットプレースを紹介した。このマーケットプレースを実現する中心的なメカニズムはエージェントの二重機能であり、特権情報の品質を評価する能力を持つと同時に、忘れる能力も備えている。適切に行動するためには、エージェントは合理的な判断をし、生成されたサブクエリを通じて市場を戦略的に探索し、購入した情報から回答を合成する必要がある。
論文参考訳（メタデータ） (2024-03-21T14:48:37Z)
Dynamic Pricing and Learning with Long-term Reference Effects [16.07344044662994]
本研究では,販売者が提示した過去の価格の基準価格が平均値となる,シンプルで斬新な参照価格メカニズムについて検討する。このメカニズムの下では,モデルパラメータに関係なく,マークダウンポリシがほぼ最適であることを示す。次に、需要モデルパラメータが不明な、より困難な動的価格と学習の問題について検討する。
論文参考訳（メタデータ） (2024-02-19T21:36:54Z)
Contextual Dynamic Pricing with Strategic Buyers [93.97401997137564]
戦略的買い手によるコンテキスト動的価格問題について検討する。売り手は買い手の真の特徴を観察せず、買い手の戦略行動に応じて操作された特徴を観察する。本稿では,販売者の累積収益を最大化するために,購入者の戦略的行動をオンライン学習に取り入れた戦略的動的価格政策を提案する。
論文参考訳（メタデータ） (2023-07-08T23:06:42Z)
Dynamic Pricing and Learning with Bayesian Persuasion [18.59029578133633]
我々は,商品の価格設定に加えて,販売者が「広告計画」にコミットする,新たな動的価格設定と学習環境を考える。我々は、バイエルンの一般的な説得フレームワークを使用して、これらのシグナルが購入者の評価と購入反応に与える影響をモデル化する。我々は、過去の購入応答を利用して最適な価格と広告戦略を適応的に学習できるオンラインアルゴリズムを設計する。
論文参考訳（メタデータ） (2023-04-27T17:52:06Z)
A Reinforcement Learning Approach in Multi-Phase Second-Price Auction Design [158.0041488194202]
多相第2価格オークションにおけるリザーブ価格の最適化について検討する。売り手の視点からは、潜在的に非現実的な入札者の存在下で、環境を効率的に探索する必要がある。第三に、売り手のステップごとの収益は未知であり、非線形であり、環境から直接観察することさえできない。
論文参考訳（メタデータ） (2022-10-19T03:49:05Z)
Price DOES Matter! Modeling Price and Interest Preferences in Session-based Recommendation [55.0391061198924]
セッションベースのレコメンデーションは、匿名ユーザが自分の短い行動シーケンスに基づいて購入したいアイテムを予測することを目的としている。セッションベースのレコメンデーションの価格設定を組み込むのは簡単ではない。セッションベースレコメンデーションのためのCoHHN(Co-guided Heterogeneous Hypergraph Network)を提案する。
論文参考訳（メタデータ） (2022-05-09T10:47:15Z)
Distribution-free Contextual Dynamic Pricing [5.773269033551628]
コンテキスト動的価格設定は、顧客との逐次的なインタラクションに基づいてパーソナライズされた価格を設定することを目的としている。本稿では,未知のランダムノイズを伴う文脈的動的価格を評価モデルで検討する。我々の流通自由価格政策は、コンテキスト関数と市場ノイズの両方を同時に学習する。
論文参考訳（メタデータ） (2021-09-15T14:52:44Z)
Learning to Price Against a Moving Target [23.085429420254787]
買い手の価値が移動目標である、すなわち時間とともに変化する問題について検討する。いずれの場合も、最適収益損失の上限は上下限である。
論文参考訳（メタデータ） (2021-06-08T20:57:11Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。