論文の概要: Personalized Pricing with Invalid Instrumental Variables:
Identification, Estimation, and Policy Learning
- arxiv url: http://arxiv.org/abs/2302.12670v1
- Date: Fri, 24 Feb 2023 14:50:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-27 13:18:58.654655
- Title: Personalized Pricing with Invalid Instrumental Variables:
Identification, Estimation, and Policy Learning
- Title(参考訳): 無効な機器変数を用いたパーソナライズ価格:識別・推定・政策学習
- Authors: Rui Miao, Zhengling Qi, Cong Shi, Lin Lin
- Abstract要約: 本研究は,インストゥルメンタル変数アプローチを用いて,内在性の下でのオフラインパーソナライズド価格について検討する。
Invalid iNsTrumental変数を用いたパーソナライズされたプライシングのための新しいポリシー学習手法を提案する。
- 参考スコア(独自算出の注目度): 5.372349090093469
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pricing based on individual customer characteristics is widely used to
maximize sellers' revenues. This work studies offline personalized pricing
under endogeneity using an instrumental variable approach. Standard
instrumental variable methods in causal inference/econometrics either focus on
a discrete treatment space or require the exclusion restriction of instruments
from having a direct effect on the outcome, which limits their applicability in
personalized pricing. In this paper, we propose a new policy learning method
for Personalized pRicing using Invalid iNsTrumental variables (PRINT) for
continuous treatment that allow direct effects on the outcome. Specifically,
relying on the structural models of revenue and price, we establish the
identifiability condition of an optimal pricing strategy under endogeneity with
the help of invalid instrumental variables. Based on this new identification,
which leads to solving conditional moment restrictions with generalized
residual functions, we construct an adversarial min-max estimator and learn an
optimal pricing strategy. Furthermore, we establish an asymptotic regret bound
to find an optimal pricing strategy. Finally, we demonstrate the effectiveness
of the proposed method via extensive simulation studies as well as a real data
application from an US online auto loan company.
- Abstract(参考訳): 個々の顧客特性に基づく価格は、販売者の収益を最大化するために広く利用されている。
本研究は,機器変数を用いた内在性に基づくオフラインパーソナライズド価格に関する研究である。
因果推論/計量学における標準の機器変数法は、個別の処理空間に焦点をあてるか、または機器の排他的制限が結果に直接影響することを要求する。
本稿では,Invalid iNsTrumental variables (PRINT) を用いたパーソナライズド・プライシングのための新しいポリシー学習手法を提案する。
具体的には、収益と価格の構造モデルに基づき、不正な機器変数の助けを借りて、内在性の下で最適な価格戦略の特定可能性条件を確立する。
一般化された残余関数による条件付きモーメント制約を解消する新たな同定法に基づき,逆数min-max推定器を構築し,最適価格戦略を学習する。
さらに,最適価格戦略を見出すための漸近的な後悔を確立する。
最後に,提案手法の有効性を,米国オンライン自動車ローン会社による実データアプリケーションとともに,広範なシミュレーション研究を通じて実証する。
関連論文リスト
- A Tale of Two Cities: Pessimism and Opportunism in Offline Dynamic Pricing [20.06425698412548]
本稿では,データカバレッジを前提としないオフライン動的価格について検討する。
我々は、関連する価格が観測されていない需要パラメータに限定した部分的識別を確立する。
提案した部分的識別枠組みに悲観的・機会論的戦略を取り入れて,推定方針を導出する。
論文 参考訳(メタデータ) (2024-11-12T19:09:41Z) - A Primal-Dual Online Learning Approach for Dynamic Pricing of Sequentially Displayed Complementary Items under Sale Constraints [54.46126953873298]
顧客に対して順次表示される補完アイテムの動的価格設定の問題に対処する。
各項目の価格を個別に最適化するのは効果がないため、補完項目のコヒーレントな価格ポリシーが不可欠である。
実世界のデータからランダムに生成した合成設定を用いて,我々のアプローチを実証的に評価し,制約違反や後悔の観点からその性能を比較した。
論文 参考訳(メタデータ) (2024-07-08T09:55:31Z) - $i$REPO: $i$mplicit Reward Pairwise Difference based Empirical Preference Optimization [12.266207199002604]
大規模言語モデル(LLM)は、人間の期待から外れた出力を生成することがある。
経験的選好最適化に暗黙的逆差分回帰を利用する,$i$REPO という新しいフレームワークを提案する。
i$REPOは, ソフトラベル, 自己生成応答, 経験的AIアノテータのロジットを用いて, 効果的に自己アライメントを実現することを示す。
論文 参考訳(メタデータ) (2024-05-24T05:42:11Z) - Policy Gradient with Active Importance Sampling [55.112959067035916]
政策勾配法(PG法)はISの利点を大いに生かし、以前に収集したサンプルを効果的に再利用することができる。
しかし、ISは歴史的サンプルを再重み付けするための受動的ツールとしてRLに採用されている。
我々は、政策勾配のばらつきを減らすために、サンプルを収集する最良の行動ポリシーを模索する。
論文 参考訳(メタデータ) (2024-05-09T09:08:09Z) - Metalearners for Ranking Treatment Effects [1.469168639465869]
政策の漸進的な利益曲線の下で、ランク付けの学習がいかにその領域を最大化できるかを示す。
政策の漸進的な利益曲線の下で、ランク付けの学習がいかにその領域を最大化できるかを示す。
論文 参考訳(メタデータ) (2024-05-03T15:31:18Z) - Structured Dynamic Pricing: Optimal Regret in a Global Shrinkage Model [50.06663781566795]
消費者の嗜好と価格感が時間とともに変化する動的モデルを考える。
我々は,モデルパラメータの順序を事前に把握している透視者と比較して,収益損失が予想される,後悔による動的価格政策の性能を計測する。
提案した政策の最適性を示すだけでなく,政策立案のためには,利用可能な構造情報を組み込むことが不可欠であることを示す。
論文 参考訳(メタデータ) (2023-03-28T00:23:23Z) - Uncertainty-Aware Instance Reweighting for Off-Policy Learning [63.31923483172859]
本研究では,不確実性を考慮した逆確率スコア推定器 (UIPS) を提案する。
実世界の3つのレコメンデーションデータセットを用いた実験結果から,提案したUIPS推定器の有効サンプル効率が示された。
論文 参考訳(メタデータ) (2023-03-11T11:42:26Z) - Balanced Off-Policy Evaluation for Personalized Pricing [3.296526804364952]
我々は、特徴情報、歴史的価格決定、バイナリ実現需要からなるデータを持つパーソナライズされた価格問題を考える。
目標は、機能と価格をマッピングするパーソナライズされた価格ポリシーの、非政治的な評価を行うことだ。
Kallusのバランスの取れた政策評価フレームワークを基盤として、価格アプリケーションに適した新しいアプローチを提案する。
論文 参考訳(メタデータ) (2023-02-24T16:44:46Z) - When Demonstrations Meet Generative World Models: A Maximum Likelihood
Framework for Offline Inverse Reinforcement Learning [62.00672284480755]
本稿では, 専門家エージェントから, 一定の有限個の実演において観測された動作を過小評価する報酬と環境力学の構造を復元することを目的とする。
タスクを実行するための正確な専門知識モデルは、臨床的意思決定や自律運転のような安全に敏感な応用に応用できる。
論文 参考訳(メタデータ) (2023-02-15T04:14:20Z) - Low-Cost Algorithmic Recourse for Users With Uncertain Cost Functions [74.00030431081751]
本稿では,ユーザ固有のコスト関数の概念を定式化し,ユーザのための行動可能なリコースを識別する新しい手法を提案する。
本手法は,強いベースライン法に比べて最大25.89パーセントのユーザを満足させる。
論文 参考訳(メタデータ) (2021-11-01T19:49:35Z) - Model Distillation for Revenue Optimization: Interpretable Personalized
Pricing [8.07517029746865]
我々は、複雑なブラックボックス機械学習アルゴリズムから知識を抽出する、カスタマイズされた、規範的なツリーベースアルゴリズムを提案する。
同様のバリュエーションで顧客を分割し、解釈可能性を維持しながら収益を最大化するような価格を定めている。
論文 参考訳(メタデータ) (2020-07-03T18:33:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。