論文の概要: Poisson-MNL Bandit: Nearly Optimal Dynamic Joint Assortment and Pricing with Decision-Dependent Customer Arrivals
- arxiv url: http://arxiv.org/abs/2602.16923v1
- Date: Wed, 18 Feb 2026 22:30:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-20 15:21:28.492772
- Title: Poisson-MNL Bandit: Nearly Optimal Dynamic Joint Assortment and Pricing with Decision-Dependent Customer Arrivals
- Title(参考訳): Poisson-MNL Bandit: ほぼ最適な動的関節配置と決定依存型顧客注文による価格設定
- Authors: Junhui Cai, Ran Chen, Qitao Huang, Linda Zhao, Wu Zhu,
- Abstract要約: 本研究では,販売者が定期会計/運用の間隔で意思決定を更新する動的ジョイント・アソシエーションと価格について検討する。
多くの設定では、品揃えと価格は、到着した顧客が何を買うかだけでなく、その期間内に何人の顧客が到着するかにも影響を及ぼす。
本稿では、文脈的MNL選択モデルと、提示された品目と価格に依存するポアソン到着モデルとを結合するポアソン-MNLモデルを提案する。
- 参考スコア(独自算出の注目度): 2.023747761104056
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study dynamic joint assortment and pricing where a seller updates decisions at regular accounting/operating intervals to maximize the cumulative per-period revenue over a horizon $T$. In many settings, assortment and prices affect not only what an arriving customer buys but also how many customers arrive within the period, whereas classical multinomial logit (MNL) models assume arrivals as fixed, potentially leading to suboptimal decisions. We propose a Poisson-MNL model that couples a contextual MNL choice model with a Poisson arrival model whose rate depends on the offered assortment and prices. Building on this model, we develop an efficient algorithm PMNL based on the idea of upper confidence bound (UCB). We establish its (near) optimality by proving a non-asymptotic regret bound of order $\sqrt{T\log{T}}$ and a matching lower bound (up to $\log T$). Simulation studies underscore the importance of accounting for the dependency of arrival rates on assortment and pricing: PMNL effectively learns customer choice and arrival models and provides joint assortment-pricing decisions that outperform others that assume fixed arrival rates.
- Abstract(参考訳): 本研究では,販売者が定期会計/営業間隔で意思決定を更新し,時間ごとの累積収益を水平線$T$で最大化する動的ジョイント・アソシエーションと価格について検討する。
多くの設定では、品揃えと価格は、到着した顧客が何を購入するかだけでなく、その期間内に何人の顧客が到着するかにも影響を及ぼすが、古典的なマルチノミカルロジット(MNL)モデルは到着を固定として想定し、潜在的に最適以下の決定につながる。
本稿では、文脈的MNL選択モデルと、提示された品目と価格に依存するポアソン到着モデルとを結合するポアソン-MNLモデルを提案する。
このモデルに基づいて,上信頼境界(UCB)に基づく効率的なアルゴリズムPMNLを開発した。
我々は、次数$\sqrt{T\log{T}}$と一致する下限(最大$\log T$)の非漸近的後悔境界を証明することによって、その(近く)最適性を確立する。
PMNLは、顧客選択と到着モデルを効果的に学習し、固定到着率を仮定する他者よりも優れた共同購入価格決定を提供する。
関連論文リスト
- Dynamic Assortment Selection and Pricing with Censored Preference Feedback [10.988222071035198]
本稿では,テキストセンタ型マルチノミアルロジット(C-MNL)選択モデルに基づく新しいフレームワークを提案する。
売り手は価格で一連の商品を提示し、買い手は価格より高い価格で商品をフィルタリングし、残りの選択肢から少なくとも1つの商品を購入する。
我々のアルゴリズムは $tildeO(dfrac32sqrtT/kappa)$ と $tildeO(d2sqrtT/kappa) の残差を実現する。
論文 参考訳(メタデータ) (2025-04-03T06:56:08Z) - MM-RLHF: The Next Step Forward in Multimodal LLM Alignment [59.536850459059856]
MM-RLHF, $mathbf120k$ fine-fine, human-annotated preference comparison pairsを含むデータセットを紹介する。
本稿では,報酬モデルの品質向上とアライメントアルゴリズムの効率向上のために,いくつかの重要なイノベーションを提案する。
我々のアプローチは、$mathbf10$の異なる次元と$mathbf27$のベンチマークで厳格に評価されている。
論文 参考訳(メタデータ) (2025-02-14T18:59:51Z) - Ranked from Within: Ranking Large Multimodal Models Without Labels [73.96543593298426]
ソフトマックス分布から導かれる不確実性スコアは,様々なタスクにまたがるランキングモデルに対して,ロバストな基礎となることを示す。
これにより、ラベルのないデータに対するLMMのランク付けが容易になり、手動のアノテーションを必要とせずに、多様なターゲットドメインのモデルを選択するための実践的なアプローチを提供する。
論文 参考訳(メタデータ) (2024-12-09T13:05:43Z) - From Stream to Pool: Pricing Under the Law of Diminishing Marginal Utility [5.632624116225276]
我々は、独占販売業者と繰り返しやりとりする顧客に対して、textbfpool$を調査する。
特に,ディスカウント関数が一定であれば,プールモデルによりストリームモデルが復元される。
我々は、非適応的で詳細のない(すなわち、バリュエーションを「知る」)政策を提示し、競争比1/kで達成する。
論文 参考訳(メタデータ) (2023-10-30T01:53:37Z) - Personalized Federated Learning under Mixture of Distributions [98.25444470990107]
本稿では,ガウス混合モデル(GMM)を用いたPFL(Personalized Federated Learning)を提案する。
FedGMMはオーバーヘッドを最小限に抑え、新しいクライアントに適応する付加的なアドバンテージを持ち、不確実な定量化を可能にします。
PFL分類と新しいサンプル検出の両方において, 合成データセットとベンチマークデータセットの実証評価により, 提案手法の優れた性能を示した。
論文 参考訳(メタデータ) (2023-05-01T20:04:46Z) - Structured Dynamic Pricing: Optimal Regret in a Global Shrinkage Model [50.06663781566795]
消費者の嗜好と価格感が時間とともに変化する動的モデルを考える。
我々は,モデルパラメータの順序を事前に把握している透視者と比較して,収益損失が予想される,後悔による動的価格政策の性能を計測する。
提案した政策の最適性を示すだけでなく,政策立案のためには,利用可能な構造情報を組み込むことが不可欠であることを示す。
論文 参考訳(メタデータ) (2023-03-28T00:23:23Z) - Autoregressive Bandits [58.46584210388307]
本稿では,オンライン学習環境であるAutoregressive Banditsを提案する。
報酬プロセスの軽微な仮定の下では、最適ポリシーを便利に計算できることが示される。
次に、新しい楽観的後悔最小化アルゴリズム、すなわちAutoRegressive Upper Confidence Bound (AR-UCB)を考案し、$widetildemathcalO left( frac(k+1)3/2sqrtnT (1-G)のサブ線形後悔を被る。
論文 参考訳(メタデータ) (2022-12-12T21:37:36Z) - Price DOES Matter! Modeling Price and Interest Preferences in
Session-based Recommendation [55.0391061198924]
セッションベースのレコメンデーションは、匿名ユーザが自分の短い行動シーケンスに基づいて購入したいアイテムを予測することを目的としている。
セッションベースのレコメンデーションの価格設定を組み込むのは簡単ではない。
セッションベースレコメンデーションのためのCoHHN(Co-guided Heterogeneous Hypergraph Network)を提案する。
論文 参考訳(メタデータ) (2022-05-09T10:47:15Z) - MNL-Bandits under Inventory and Limited Switches Constraints [38.960764902819434]
我々は、データから顧客の選択を学習しながら、アソートを最適化する効率的な UCB ライクなアルゴリズムを開発した。
我々のアルゴリズムは、$O(Talpha)$スイッチが許される場合、サブ線形後悔境界$tildeOleft(T1-alpha/2right)$を達成できることを証明している。
論文 参考訳(メタデータ) (2022-04-22T16:02:27Z) - On the estimation of discrete choice models to capture irrational
customer behaviors [4.683806391173103]
我々は、部分的にランク付けされた好みを使って、トランザクションデータから合理的で不合理な顧客タイプを効率的にモデル化する方法を示す。
提案手法の予測精度を評価する実験を幅広く行った。
論文 参考訳(メタデータ) (2021-09-08T19:19:51Z) - Multi-Purchase Behavior: Modeling, Estimation and Optimization [0.9337154228221861]
本稿では,Bundle-MVL-Kファミリーと呼ばれる,同種の選択モデルのマルチ購入ファミリを提案する。
このモデルに対して最適化されたレコメンデーションを効率的に計算するバイナリ検索に基づく反復戦略を開発する。
論文 参考訳(メタデータ) (2020-06-14T23:47:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。