論文の概要: PASTA: A Unified Framework for Offline Assortment Learning
- arxiv url: http://arxiv.org/abs/2510.01693v1
- Date: Thu, 02 Oct 2025 05:47:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:21.017888
- Title: PASTA: A Unified Framework for Offline Assortment Learning
- Title(参考訳): PASTA: オフラインアソシエーション学習のための統一フレームワーク
- Authors: Juncheng Dong, Weibin Mo, Zhengling Qi, Cong Shi, Ethan X. Fang, Vahid Tarokh,
- Abstract要約: オフラインおよびデータ駆動環境でのアソシエーション最適化の幅広いクラスについて検討する。
このような問題において、企業は、基礎となる選択モデルに関する事前知識を欠き、過去の顧客選択データに基づいて最適な選択肢を決定することを目的としている。
我々は、悲観主義の原理を利用して、一般的な選択モデルの下で最適な予測収益を達成する新しい悲観的最適化フレームワークを導入する。
- 参考スコア(独自算出の注目度): 22.89627688628713
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study a broad class of assortment optimization problems in an offline and data-driven setting. In such problems, a firm lacks prior knowledge of the underlying choice model, and aims to determine an optimal assortment based on historical customer choice data. The combinatorial nature of assortment optimization often results in insufficient data coverage, posing a significant challenge in designing provably effective solutions. To address this, we introduce a novel Pessimistic Assortment Optimization (PASTA) framework that leverages the principle of pessimism to achieve optimal expected revenue under general choice models. Notably, PASTA requires only that the offline data distribution contains an optimal assortment, rather than providing the full coverage of all feasible assortments. Theoretically, we establish the first finite-sample regret bounds for offline assortment optimization across several widely used choice models, including the multinomial logit and nested logit models. Additionally, we derive a minimax regret lower bound, proving that PASTA is minimax optimal in terms of sample and model complexity. Numerical experiments further demonstrate that our method outperforms existing baseline approaches.
- Abstract(参考訳): オフラインおよびデータ駆動環境でのアソシエーション最適化の幅広いクラスについて検討する。
このような問題において、企業は、基礎となる選択モデルに関する事前知識を欠き、過去の顧客選択データに基づいて最適な選択肢を決定することを目的としている。
アソシエーション最適化の組合せの性質は、しばしばデータカバレッジが不十分になり、証明可能な効果的なソリューションを設計する上で大きな課題となる。
これを解決するために、悲観的最適化(PASTA)フレームワークを導入し、悲観主義の原理を活用し、一般的な選択モデルの下で最適な収益を達成する。
特に、PASTAは、すべての可能なアソートの全カバレッジを提供するのではなく、オフラインデータディストリビューションが最適なアソートを含むことを要求している。
理論的には、多項ロジットモデルやネストされたロジットモデルを含む、広く使われているいくつかの選択モデルに対して、オフラインアソート最適化のための最初の有限サンプル後悔境界を確立する。
さらに, PASTA が標本およびモデル複雑性の点で最小値であることを示すために, 最小値の最小値の最小値が導出される。
さらに,本手法が既存のベースライン手法よりも優れていることを示す。
関連論文リスト
- Preference-Guided Diffusion for Multi-Objective Offline Optimization [64.08326521234228]
オフライン多目的最適化のための優先誘導拡散モデルを提案する。
我々の指導は、ある設計が他の設計を支配する確率を予測するために訓練された選好モデルである。
本結果は,多種多様な高品質な解を生成する上での分類器誘導拡散モデルの有効性を浮き彫りにした。
論文 参考訳(メタデータ) (2025-03-21T16:49:38Z) - Learning an Optimal Assortment Policy under Observational Data [32.720761309403436]
我々は,MNL(Multinomial Logit)モデルに基づくオフラインアソシエーション最適化の基本的問題について検討する。
本稿では、オフライン学習のパラダイムを考察し、効率的なオフライン配置最適化のための最小限のデータ要件について検討する。
論文 参考訳(メタデータ) (2025-02-10T18:54:41Z) - An incremental preference elicitation-based approach to learning potentially non-monotonic preferences in multi-criteria sorting [53.36437745983783]
まず最適化モデルを構築し,非単調な選好をモデル化する。
本稿では,情報量測定手法と質問選択戦略を考案し,各イテレーションにおいて最も情報に富む選択肢を特定する。
2つのインクリメンタルな選好に基づくアルゴリズムは、潜在的に単調な選好を学習するために開発された。
論文 参考訳(メタデータ) (2024-09-04T14:36:20Z) - Functional Graphical Models: Structure Enables Offline Data-Driven Optimization [111.28605744661638]
構造がサンプル効率のよいデータ駆動最適化を実現する方法を示す。
また、FGM構造自体を推定するデータ駆動最適化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-01-08T22:33:14Z) - Optimizing Solution-Samplers for Combinatorial Problems: The Landscape
of Policy-Gradient Methods [52.0617030129699]
本稿では,DeepMatching NetworksとReinforcement Learningメソッドの有効性を解析するための新しい理論フレームワークを提案する。
我々の主な貢献は、Max- and Min-Cut、Max-$k$-Bipartite-Bi、Maximum-Weight-Bipartite-Bi、Traveing Salesman Problemを含む幅広い問題である。
本分析の副産物として,バニラ降下による新たな正則化プロセスを導入し,失効する段階的な問題に対処し,悪い静止点から逃れる上で有効であることを示す理論的および実験的証拠を提供する。
論文 参考訳(メタデータ) (2023-10-08T23:39:38Z) - PASTA: Pessimistic Assortment Optimization [25.51792135903357]
オフラインデータ駆動環境でのアソシエーション最適化のクラスについて検討する。
本稿では,悲観主義の原理に基づくPASTA(Pessimistic Assortment opTimizAtion)と呼ばれるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-08T01:11:51Z) - Modeling the Second Player in Distributionally Robust Optimization [90.25995710696425]
我々は、最悪のケース分布を特徴付けるために神経生成モデルを使うことを議論する。
このアプローチは多くの実装と最適化の課題をもたらします。
提案されたアプローチは、同等のベースラインよりも堅牢なモデルを生み出す。
論文 参考訳(メタデータ) (2021-03-18T14:26:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。