論文の概要: Uncertainty Quantification for Demand Prediction in Contextual Dynamic
Pricing
- arxiv url: http://arxiv.org/abs/2003.07017v2
- Date: Mon, 31 Aug 2020 16:39:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-23 02:36:48.970819
- Title: Uncertainty Quantification for Demand Prediction in Contextual Dynamic
Pricing
- Title(参考訳): コンテキスト動的価格設定における需要予測の不確かさの定量化
- Authors: Yining Wang and Xi Chen and Xiangyu Chang and Dongdong Ge
- Abstract要約: 本研究では,需要関数に対する精度の高い信頼区間構築の問題について検討する。
偏りのあるアプローチを開発し、偏りのある推定器の正規性を保証する。
- 参考スコア(独自算出の注目度): 20.828160401904697
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data-driven sequential decision has found a wide range of applications in
modern operations management, such as dynamic pricing, inventory control, and
assortment optimization. Most existing research on data-driven sequential
decision focuses on designing an online policy to maximize the revenue.
However, the research on uncertainty quantification on the underlying true
model function (e.g., demand function), a critical problem for practitioners,
has not been well explored. In this paper, using the problem of demand function
prediction in dynamic pricing as the motivating example, we study the problem
of constructing accurate confidence intervals for the demand function. The main
challenge is that sequentially collected data leads to significant
distributional bias in the maximum likelihood estimator or the empirical risk
minimization estimate, making classical statistics approaches such as the
Wald's test no longer valid. We address this challenge by developing a debiased
approach and provide the asymptotic normality guarantee of the debiased
estimator. Based this the debiased estimator, we provide both point-wise and
uniform confidence intervals of the demand function.
- Abstract(参考訳): データ駆動シーケンシャルな決定は、動的価格設定、在庫管理、品揃え最適化など、現代の運用管理における幅広い応用を見出した。
データ駆動シーケンシャルな意思決定に関する既存の研究は、収益を最大化するオンラインポリシーの設計に焦点を当てている。
しかし、基礎となる真のモデル関数(例えば、需要関数)に対する不確実性定量化の研究は、実践者にとって重要な問題である。
本稿では,動的価格設定における需要関数予測の問題を動機として,需要関数の信頼区間を精度良く構築する問題について検討する。
主な課題は、シーケンシャルに収集されたデータが最大確率推定値や経験的リスク最小化推定値にかなりの分布バイアスをもたらし、ウォルド検定のような古典的な統計学的アプローチがもはや有効ではないことである。
この課題に対処するために、偏りのあるアプローチを開発し、偏りのある推定器の漸近正規性を保証する。
これに基づいて,要求関数の点的信頼区間と一様信頼区間の両方を提供する。
関連論文リスト
- Deep Generative Demand Learning for Newsvendor and Pricing [7.594251468240168]
我々は、機能ベースのニュースベンダ問題において、データ駆動の在庫と価格決定について検討する。
本稿では,これらの課題に対処するために条件付き深層生成モデル(cDGM)を活用する新しいアプローチを提案する。
我々は、利益予測の整合性や最適解への決定の収束など、我々のアプローチに対する理論的保証を提供する。
論文 参考訳(メタデータ) (2024-11-13T14:17:26Z) - Non-Asymptotic Uncertainty Quantification in High-Dimensional Learning [5.318766629972959]
不確かさの定量化は多くの高次元回帰や学習問題において決定的だが難しい課題である。
我々は、古典的回帰アプローチとニューラルネットワークの両方に適用可能な、回帰におけるUQのための新しいデータ駆動アプローチを開発した。
論文 参考訳(メタデータ) (2024-07-18T16:42:10Z) - Pessimistic Causal Reinforcement Learning with Mediators for Confounded Offline Data [17.991833729722288]
我々は新しいポリシー学習アルゴリズム PESsimistic CAusal Learning (PESCAL) を提案する。
我々のキーとなる観察は、システム力学における作用の効果を媒介する補助変数を組み込むことで、Q-関数の代わりに媒介物分布関数の下位境界を学習することは十分であるということである。
提案するアルゴリズムの理論的保証とシミュレーションによる有効性の実証、および主要な配車プラットフォームからのオフラインデータセットを利用した実世界の実験を提供する。
論文 参考訳(メタデータ) (2024-03-18T14:51:19Z) - Model-Based Epistemic Variance of Values for Risk-Aware Policy Optimization [59.758009422067]
モデルベース強化学習における累積報酬に対する不確実性を定量化する問題を考察する。
我々は、解が値の真後分散に収束する新しい不確実性ベルマン方程式(UBE)を提案する。
本稿では,リスク・サーキングとリスク・アバース・ポリシー最適化のいずれにも適用可能な汎用ポリシー最適化アルゴリズムQ-Uncertainty Soft Actor-Critic (QU-SAC)を導入する。
論文 参考訳(メタデータ) (2023-12-07T15:55:58Z) - When Demonstrations Meet Generative World Models: A Maximum Likelihood
Framework for Offline Inverse Reinforcement Learning [62.00672284480755]
本稿では, 専門家エージェントから, 一定の有限個の実演において観測された動作を過小評価する報酬と環境力学の構造を復元することを目的とする。
タスクを実行するための正確な専門知識モデルは、臨床的意思決定や自律運転のような安全に敏感な応用に応用できる。
論文 参考訳(メタデータ) (2023-02-15T04:14:20Z) - Bayesian Bilinear Neural Network for Predicting the Mid-price Dynamics
in Limit-Order Book Markets [84.90242084523565]
伝統的な時系列計量法は、価格力学を駆動する多層相互作用の真の複雑さを捉えることができないことが多い。
最先端の2次最適化アルゴリズムを採用することで、時間的注意を払ってベイジアン双線形ニューラルネットワークを訓練する。
予測分布を用いて推定パラメータとモデル予測に関連する誤差や不確実性を解析することにより、ベイズモデルと従来のML代替品を徹底的に比較する。
論文 参考訳(メタデータ) (2022-03-07T18:59:54Z) - Loss Functions for Discrete Contextual Pricing with Observational Data [8.661128420558349]
顧客および/または製品の特徴に基づいて、各顧客がコンテキスト化された価格で提供される価格設定について検討する。
顧客の真の価値よりも,各顧客が所定の価格で商品を購入しているかどうかを観察する。
論文 参考訳(メタデータ) (2021-11-18T20:12:57Z) - Learning Probabilistic Ordinal Embeddings for Uncertainty-Aware
Regression [91.3373131262391]
不確かさが唯一の確実性である。
伝統的に、直接回帰定式化を考慮し、ある確率分布の族に出力空間を変更することによって不確実性をモデル化する。
現在のレグレッション技術における不確実性をモデル化する方法は、未解決の問題である。
論文 参考訳(メタデータ) (2021-03-25T06:56:09Z) - CoinDICE: Off-Policy Confidence Interval Estimation [107.86876722777535]
強化学習における高信頼行動非依存のオフ政治評価について検討する。
様々なベンチマークにおいて、信頼区間推定が既存の手法よりも厳密で精度が高いことが示されている。
論文 参考訳(メタデータ) (2020-10-22T12:39:11Z) - Regularized Online Allocation Problems: Fairness and Beyond [7.433931244705934]
本稿では, 総資源消費に作用する非線形正規化器を含む変種である, 語彙化オンライン割当問題を紹介する。
この問題では、要求は時間とともに繰り返し届き、各要求に対して、意思決定者は報酬を生成しリソースを消費するアクションを取る必要があります。
目的は、資源制約を受ける加算可分な報酬と非分離可正則化器の値とを同時に最大化することである。
論文 参考訳(メタデータ) (2020-07-01T14:24:58Z) - GenDICE: Generalized Offline Estimation of Stationary Values [108.17309783125398]
重要なアプリケーションでは,効果的な推定が依然として可能であることを示す。
我々のアプローチは、定常分布と経験分布の差を補正する比率を推定することに基づいている。
結果として得られるアルゴリズム、GenDICEは単純で効果的である。
論文 参考訳(メタデータ) (2020-02-21T00:27:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。