論文の概要: PASTA: Pessimistic Assortment Optimization
- arxiv url: http://arxiv.org/abs/2302.03821v1
- Date: Wed, 8 Feb 2023 01:11:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-09 17:42:49.759656
- Title: PASTA: Pessimistic Assortment Optimization
- Title(参考訳): PASTA: 悲観的なアソシエーション最適化
- Authors: Juncheng Dong, Weibin Mo, Zhengling Qi, Cong Shi, Ethan X. Fang, Vahid
Tarokh
- Abstract要約: オフラインデータ駆動環境でのアソシエーション最適化のクラスについて検討する。
本稿では,悲観主義の原理に基づくPASTA(Pessimistic Assortment opTimizAtion)と呼ばれるアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 25.51792135903357
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider a class of assortment optimization problems in an offline
data-driven setting. A firm does not know the underlying customer choice model
but has access to an offline dataset consisting of the historically offered
assortment set, customer choice, and revenue. The objective is to use the
offline dataset to find an optimal assortment. Due to the combinatorial nature
of assortment optimization, the problem of insufficient data coverage is likely
to occur in the offline dataset. Therefore, designing a provably efficient
offline learning algorithm becomes a significant challenge. To this end, we
propose an algorithm referred to as Pessimistic ASsortment opTimizAtion (PASTA
for short) designed based on the principle of pessimism, that can correctly
identify the optimal assortment by only requiring the offline data to cover the
optimal assortment under general settings. In particular, we establish a regret
bound for the offline assortment optimization problem under the celebrated
multinomial logit model. We also propose an efficient computational procedure
to solve our pessimistic assortment optimization problem. Numerical studies
demonstrate the superiority of the proposed method over the existing baseline
method.
- Abstract(参考訳): オフラインデータ駆動環境でのアソート最適化のクラスを考える。
企業は、基盤となる顧客選択モデルを知らないが、歴史的に提供されたソートセット、顧客選択、収益からなるオフラインデータセットにアクセスできる。
目的は、オフラインデータセットを使用して最適なアソートを見つけることである。
アソシエーション最適化の組合せの性質のため、オフラインデータセットでは不十分なデータカバレッジの問題が発生する可能性が高い。
したがって、効率的なオフライン学習アルゴリズムを設計することは大きな課題となる。
そこで本研究では、ペシミズムの原理に基づいて設計されたPASTA(Pessimistic Assortment opTimizAtion)と呼ばれるアルゴリズムを提案する。
特に,多項ロジットモデルにおいて,オフラインソート最適化問題に対する後悔点を確立する。
また,悲観的ソート最適化問題を解くための効率的な計算手順を提案する。
提案手法が既存のベースライン法よりも優れていることを示す数値的研究を行った。
関連論文リスト
- An incremental preference elicitation-based approach to learning potentially non-monotonic preferences in multi-criteria sorting [53.36437745983783]
まず最適化モデルを構築し,非単調な選好をモデル化する。
本稿では,情報量測定手法と質問選択戦略を考案し,各イテレーションにおいて最も情報に富む選択肢を特定する。
2つのインクリメンタルな選好に基づくアルゴリズムは、潜在的に単調な選好を学習するために開発された。
論文 参考訳(メタデータ) (2024-09-04T14:36:20Z) - Offline Model-Based Optimization via Policy-Guided Gradient Search [30.87992788876113]
オフライン強化学習問題として再構成することで、オフライン最適化のための新しい学習-探索-勾配の視点を導入する。
提案手法は,オフラインデータから生成されたサロゲートモデルに対して,適切なポリシーを明示的に学習する。
論文 参考訳(メタデータ) (2024-05-08T18:27:37Z) - Stop Relying on No-Choice and Do not Repeat the Moves: Optimal,
Efficient and Practical Algorithms for Assortment Optimization [38.57171985309975]
本研究では,emphPlackett Luce (PL) を用いたコンソーシアム選択問題に対する効率的なアルゴリズムを開発した。
提案手法は,既存の手法の限界を無視し,実用的かつ確実に最適である。
論文 参考訳(メタデータ) (2024-02-29T07:17:04Z) - Towards Efficient Exact Optimization of Language Model Alignment [93.39181634597877]
嗜好データから直接ポリシーを最適化するために、直接選好最適化(DPO)が提案された。
問題の最適解に基づいて導出されたDPOが,現実の最適解の妥協平均探索近似に繋がることを示す。
本稿では、アライメント目的の効率的な精度最適化(EXO)を提案する。
論文 参考訳(メタデータ) (2024-02-01T18:51:54Z) - Functional Graphical Models: Structure Enables Offline Data-Driven Optimization [111.28605744661638]
構造がサンプル効率のよいデータ駆動最適化を実現する方法を示す。
また、FGM構造自体を推定するデータ駆動最適化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-01-08T22:33:14Z) - Online Joint Assortment-Inventory Optimization under MNL Choices [14.530542487845732]
本稿では,MNL(Multinomial Logit)選択モデルに従えば,各顧客の選択行動が従うと仮定する,オンラインジョイント・アソート・インベントリ最適化問題について考察する。
本稿では,オンラインの品揃えと在庫の意思決定における探索と搾取を効果的にバランスさせる新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-04-04T09:25:34Z) - Data-Driven Offline Decision-Making via Invariant Representation
Learning [97.49309949598505]
オフラインのデータ駆動意思決定は、アクティブなインタラクションなしで最適化された決定を合成する。
オフラインデータからトレーニングされたモデルへの入力に関して最適化する場合、誤って良いように見えるアウト・オブ・ディストリビューション(OOD)インプットを生成するのは簡単です。
本稿では、オフラインデータ駆動意思決定をドメイン適応として定式化し、最適化された決定値の正確な予測を行うことを目標とする。
論文 参考訳(メタデータ) (2022-11-21T11:01:37Z) - Optimal Data Selection: An Online Distributed View [61.31708750038692]
この問題のオンライン版と分散版のアルゴリズムを開発する。
ランダム選択法は, ランダム選択法よりも5~20%高い性能を示した。
ImageNet と MNIST の学習タスクにおいて、我々の選択方法はランダム選択よりも5-20% 高い性能を示した。
論文 参考訳(メタデータ) (2022-01-25T18:56:16Z) - Is Pessimism Provably Efficient for Offline RL? [104.00628430454479]
優先度を収集したデータセットに基づいて最適なポリシーを学ぶことを目的としたオフライン強化学習(RL)について検討する。
ペナルティ関数として不確かさ量化器を組み込んだ値反復アルゴリズム(pevi)の悲観的変種を提案する。
論文 参考訳(メタデータ) (2020-12-30T09:06:57Z) - DeepCO: Offline Combinatorial Optimization Framework Utilizing Deep
Learning [1.2183405753834562]
ディープラーニングを利用したオフライン最適化フレームワークDeepCOを提案する。
また,倉庫運用順序最適化問題をモデル化するために,TSP(Travelling Salesman Problem)のオフライン変動を設計する。
限られた履歴データのみで、新しい分布正規化最適化は、経路長を平均5.7%削減するオフライン実験において、既存のベースライン法より優れている。
論文 参考訳(メタデータ) (2020-07-20T04:17:30Z) - Optimizing Revenue while showing Relevant Assortments at Scale [1.0200170217746136]
リアルタイムアソシエーション最適化は、電子商取引業務において欠かせないものとなっている。
我々は、困難な状況下で最適なアソートを見つける高速で柔軟なアルゴリズムを設計する。
実世界のデータセットを用いた実証検証によると、我々のアルゴリズムは、アイテムの数が以前研究されたよりも105$$大きいインスタンスであっても競争力がある。
論文 参考訳(メタデータ) (2020-03-06T20:16:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。