論文の概要: Robust Assortment Optimization from Observational Data
- arxiv url: http://arxiv.org/abs/2602.10696v1
- Date: Wed, 11 Feb 2026 09:57:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-12 21:44:01.666663
- Title: Robust Assortment Optimization from Observational Data
- Title(参考訳): 観測データからのロバスト配置最適化
- Authors: Miao Lu, Yuxuan Han, Han Zhong, Zhengyuan Zhou, Jose Blanchet,
- Abstract要約: 本稿では,顧客選択行動の分散的変化を考慮に入れた,データ駆動型アソシエーション最適化のためのフレームワークを提案する。
当社のアプローチは、データを生成し、最悪の予測収益を最大化しようとする名目選択モデルから、潜在的な選好シフトをモデル化する。
- 参考スコア(独自算出の注目度): 32.720761309403436
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Assortment optimization is a fundamental challenge in modern retail and recommendation systems, where the goal is to select a subset of products that maximizes expected revenue under complex customer choice behaviors. While recent advances in data-driven methods have leveraged historical data to learn and optimize assortments, these approaches typically rely on strong assumptions -- namely, the stability of customer preferences and the correctness of the underlying choice models. However, such assumptions frequently break in real-world scenarios due to preference shifts and model misspecification, leading to poor generalization and revenue loss. Motivated by this limitation, we propose a robust framework for data-driven assortment optimization that accounts for potential distributional shifts in customer choice behavior. Our approach models potential preference shift from a nominal choice model that generates data and seeks to maximize worst-case expected revenue. We first establish the computational tractability of robust assortment planning when the nominal model is known, then advance to the data-driven setting, where we design statistically optimal algorithms that minimize the data requirements while maintaining robustness. Our theoretical analysis provides both upper bounds and matching lower bounds on the sample complexity, offering theoretical guarantees for robust generalization. Notably, we uncover and identify the notion of ``robust item-wise coverage'' as the minimal data requirement to enable sample-efficient robust assortment learning. Our work bridges the gap between robustness and statistical efficiency in assortment learning, contributing new insights and tools for reliable assortment optimization under uncertainty.
- Abstract(参考訳): アソート最適化は、複雑な顧客選択行動の下で期待される収益を最大化する製品のサブセットを選択することを目的としている、現代の小売およびレコメンデーションシステムにおける基本的な課題である。
データ駆動手法の最近の進歩は、過去のデータを活用してアソートを学習し、最適化していますが、これらのアプローチは通常、強い仮定、すなわち、顧客の好みの安定性と基盤となる選択モデルの正しさに依存しています。
しかし、そのような仮定は、好みのシフトやモデルのミススペクテーションによって現実のシナリオでしばしば失敗し、一般化の貧弱さと収益の損失をもたらす。
この制限により,顧客選択行動の分散的変化を考慮に入れた,データ駆動型アソシエーション最適化のための堅牢なフレームワークを提案する。
当社のアプローチは、データを生成し、最悪の予測収益を最大化しようとする名目選択モデルから、潜在的な選好シフトをモデル化する。
まず,ロバスト性を維持しつつ,データ要求を最小限に抑える統計的に最適なアルゴリズムを設計するデータ駆動設定に先立って,ロバストなアソート計画の計算的トラクタビリティを確立する。
我々の理論的解析は、サンプルの複雑さの上限と下限の一致の両方を提供し、ロバストな一般化の理論的保証を提供する。
特に,'robust item-wise coverage'という概念を,サンプル効率の良いロバストなアソート学習を実現するために,最小限のデータ要件として発見し,識別する。
我々の研究は、整合性学習における堅牢性と統計的効率のギャップを埋め、不確実性の下で信頼性の高い整合性最適化のための新しい洞察とツールに寄与する。
関連論文リスト
- Autocorrelated Optimize-via-Estimate: Predict-then-Optimize versus Finite-sample Optimal [2.0228793142608588]
有限サンプル体制におけるアウト・オブ・サンプル性能を直接最適化するモデルは、従来の見積もりを最適化するアプローチに代わる有望な選択肢として現れてきた。
自動相関不確実性(特にベクトル自己回帰移動平均VARMA(p,q)プロセス)の文脈での性能を比較する。
論文 参考訳(メタデータ) (2026-02-02T09:49:51Z) - Not All Preferences Are Created Equal: Stability-Aware and Gradient-Efficient Alignment for Reasoning Models [52.48582333951919]
ポリシー更新の信号対雑音比を最大化することにより、アライメントの信頼性を高めるために設計された動的フレームワークを提案する。
SAGE(Stability-Aware Gradient Efficiency)は、モデル能力に基づいて候補プールをリフレッシュする粗いきめ細かいカリキュラムメカニズムを統合する。
複数の数学的推論ベンチマークの実験により、SAGEは収束を著しく加速し、静的ベースラインを上回っていることが示された。
論文 参考訳(メタデータ) (2026-02-01T12:56:10Z) - PASTA: A Unified Framework for Offline Assortment Learning [22.89627688628713]
オフラインおよびデータ駆動環境でのアソシエーション最適化の幅広いクラスについて検討する。
このような問題において、企業は、基礎となる選択モデルに関する事前知識を欠き、過去の顧客選択データに基づいて最適な選択肢を決定することを目的としている。
我々は、悲観主義の原理を利用して、一般的な選択モデルの下で最適な予測収益を達成する新しい悲観的最適化フレームワークを導入する。
論文 参考訳(メタデータ) (2025-10-02T05:47:56Z) - Leveraging Robust Optimization for LLM Alignment under Distribution Shifts [51.74394601039711]
人間の値に整合した出力を生成するために、大規模言語モデルを操る上で、優先順位アライメント手法はますます重要になっている。
このようなシフトに拘わらず、好みのアライメントを改善する新しい分布対応最適化フレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-08T09:14:38Z) - Learning an Optimal Assortment Policy under Observational Data [32.720761309403436]
我々は,MNL(Multinomial Logit)モデルに基づくオフラインアソシエーション最適化の基本的問題について検討する。
本稿では、オフライン学習のパラダイムを考察し、効率的なオフライン配置最適化のための最小限のデータ要件について検討する。
論文 参考訳(メタデータ) (2025-02-10T18:54:41Z) - Self-Steering Optimization: Autonomous Preference Optimization for Large Language Models [79.84205827056907]
本稿では,高品質な嗜好データを自律的に生成するアルゴリズムであるセルフステアリング最適化(SSO$)を提案する。
$SSO$は、ポリシーモデル自体からデータジェネレータを構築するために、特別な最適化目標を採用しています。
評価の結果,$SSO$は人選好アライメントと報酬最適化のベースラインを一貫して上回っていることがわかった。
論文 参考訳(メタデータ) (2024-10-22T16:04:03Z) - An incremental preference elicitation-based approach to learning potentially non-monotonic preferences in multi-criteria sorting [53.36437745983783]
まず最適化モデルを構築し,非単調な選好をモデル化する。
本稿では,情報量測定手法と質問選択戦略を考案し,各イテレーションにおいて最も情報に富む選択肢を特定する。
2つのインクリメンタルな選好に基づくアルゴリズムは、潜在的に単調な選好を学習するために開発された。
論文 参考訳(メタデータ) (2024-09-04T14:36:20Z) - Bayesian Nonparametrics Meets Data-Driven Distributionally Robust Optimization [29.24821214671497]
機械学習と統計モデルのトレーニングは、しばしばデータ駆動型リスク基準の最適化を伴う。
ベイズ的非パラメトリック(ディリクレ過程)理論と、スムーズなあいまいさ-逆選好の最近の決定論的モデルを組み合わせた、新しいロバストな基準を提案する。
実用的な実装として、よく知られたディリクレプロセスの表現に基づいて、評価基準の抽出可能な近似を提案し、研究する。
論文 参考訳(メタデータ) (2024-01-28T21:19:15Z) - When Demonstrations Meet Generative World Models: A Maximum Likelihood
Framework for Offline Inverse Reinforcement Learning [62.00672284480755]
本稿では, 専門家エージェントから, 一定の有限個の実演において観測された動作を過小評価する報酬と環境力学の構造を復元することを目的とする。
タスクを実行するための正確な専門知識モデルは、臨床的意思決定や自律運転のような安全に敏感な応用に応用できる。
論文 参考訳(メタデータ) (2023-02-15T04:14:20Z) - Modeling the Second Player in Distributionally Robust Optimization [90.25995710696425]
我々は、最悪のケース分布を特徴付けるために神経生成モデルを使うことを議論する。
このアプローチは多くの実装と最適化の課題をもたらします。
提案されたアプローチは、同等のベースラインよりも堅牢なモデルを生み出す。
論文 参考訳(メタデータ) (2021-03-18T14:26:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。