論文の概要: Data-Driven Dynamic Assortment in Online Platforms: Learning about Two Sides
- arxiv url: http://arxiv.org/abs/2606.11118v2
- Date: Wed, 10 Jun 2026 06:30:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-11 14:23:44.410283
- Title: Data-Driven Dynamic Assortment in Online Platforms: Learning about Two Sides
- Title(参考訳): オンラインプラットフォームにおけるデータ駆動型動的アソシエーション:2つの側面について学ぶ
- Authors: Rahul Roy, Nur Sunar, Jayashankar M. Swaminathan,
- Abstract要約: 不完全な情報と不均一な顧客を持つ双方向サービスプラットフォーム上での動的アソシエーション問題について検討する。
重要な課題は、プラットフォームが事前に顧客または販売者の選択モデルパラメータを知らないことだ。
我々はこれらのパラメータを学習し、プラットフォームの目的を時間とともに最適化するデータ駆動アルゴリズムを開発した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study a dynamic assortment problem on a two-sided service platform with incomplete information and heterogeneous customers in a discrete-time setting. In each period, a customer arrives seeking service, and the platform chooses an assortment of sellers to display. The customer then proposes a transaction to at most one seller in the assortment according to a multinomial logit choice model. After a fixed number of periods, sellers review the proposals they have received and each chooses at most one customer according to another multinomial logit choice model, after which the cycle repeats. A key challenge is that the platform does not know the choice-model parameters of either customers or sellers in advance. To our knowledge, this is the first study of a dynamic assortment problem in which both sides' choice parameters are unknown. We develop a data-driven algorithm that learns these parameters while optimizing the platform's objective over time. We evaluate performance using regret, which measures revenue loss relative to a clairvoyant benchmark that knows all parameters and customer arrivals in advance. We show that the algorithm's worst-case regret grows polylogarithmically over time, and we derive a matching lower bound, establishing its rate optimality.
- Abstract(参考訳): 本研究では,不完全な情報と異質な顧客を個別に設定した双方向サービスプラットフォームにおける動的アソシエーション問題について検討する。
各期間に顧客がサービスを求めて到着し、プラットフォームは販売者の表示方法を選択する。
その後、顧客は、マルチノミアルロジット選択モデルに従って、アソシエーション内の少なくとも1つの売り手に対してトランザクションを提案する。
一定期間の期間が経過した後、売り手は受け取った提案をレビューし、その後にサイクルが繰り返される別の多項ロジット選択モデルに従って、各顧客が少なくとも1つの顧客に選択する。
重要な課題は、プラットフォームが事前に顧客または販売者の選択モデルパラメータを知らないことだ。
我々の知る限り、これは双方の選択パラメータが不明な動的分解問題の最初の研究である。
我々はこれらのパラメータを学習し、プラットフォームの目的を時間とともに最適化するデータ駆動アルゴリズムを開発した。
我々は,すべてのパラメータと顧客到着を事前に把握した透視ベンチマークと比較して,収益損失を計測する後悔を用いて,業績を評価する。
アルゴリズムの最悪の後悔は、時間とともに多義的に増大し、一致した下界を導き、その速度最適性を確立する。
関連論文リスト
- SalesSim: Benchmarking and Aligning Multimodal Language Models as Retail User Simulators [63.68151307455963]
本稿では,マルチモーダル大規模言語モデル(MLLM)の現実的,ペルソナ主導の顧客行動のシミュレート能力を評価するためのフレームワークとテストベッドであるSalesSimを紹介する。
我々は,シミュレータの動作とペルソナ仕様との整合性,および会話品質を測定する。
実験により,UserGRPOは,会話品質を改善しつつ,ベースラインモデルの整合性を13.8%向上させることを示した。
論文 参考訳(メタデータ) (2026-05-08T17:59:23Z) - Poisson-MNL Bandit: Nearly Optimal Dynamic Joint Assortment and Pricing with Decision-Dependent Customer Arrivals [2.023747761104056]
本研究では,販売者が定期会計/運用の間隔で意思決定を更新する動的ジョイント・アソシエーションと価格について検討する。
多くの設定では、品揃えと価格は、到着した顧客が何を買うかだけでなく、その期間内に何人の顧客が到着するかにも影響を及ぼす。
本稿では、文脈的MNL選択モデルと、提示された品目と価格に依存するポアソン到着モデルとを結合するポアソン-MNLモデルを提案する。
論文 参考訳(メタデータ) (2026-02-18T22:30:49Z) - An incremental preference elicitation-based approach to learning potentially non-monotonic preferences in multi-criteria sorting [53.36437745983783]
まず最適化モデルを構築し,非単調な選好をモデル化する。
本稿では,情報量測定手法と質問選択戦略を考案し,各イテレーションにおいて最も情報に富む選択肢を特定する。
2つのインクリメンタルな選好に基づくアルゴリズムは、潜在的に単調な選好を学習するために開発された。
論文 参考訳(メタデータ) (2024-09-04T14:36:20Z) - A Primal-Dual Online Learning Approach for Dynamic Pricing of Sequentially Displayed Complementary Items under Sale Constraints [54.46126953873298]
顧客に対して順次表示される補完アイテムの動的価格設定の問題に対処する。
各項目の価格を個別に最適化するのは効果がないため、補完項目のコヒーレントな価格ポリシーが不可欠である。
実世界のデータからランダムに生成した合成設定を用いて,我々のアプローチを実証的に評価し,制約違反や後悔の観点からその性能を比較した。
論文 参考訳(メタデータ) (2024-07-08T09:55:31Z) - Emulating Full Participation: An Effective and Fair Client Selection Strategy for Federated Learning [50.060154488277036]
連合学習では、クライアントの選択はモデルの性能と公平性の両方に大きな影響を及ぼす重要な問題である。
2つの指標間の固有の対立に対処し、互いに強化する2つの原則を提案する。
提案手法は,データ分布に基づいてクライアントを選択することにより,この多様性を適応的に向上させ,モデル性能と公平性の両方を改善する。
論文 参考訳(メタデータ) (2024-05-22T12:27:24Z) - Multi-Criteria Client Selection and Scheduling with Fairness Guarantee
for Federated Learning Service [17.986744632466515]
フェデレートラーニング(FL)は、複数のクライアントが生のトレーニングデータを共有せずに、機械学習モデルを協調的にトレーニングすることを可能にする。
公平性を保証するマルチ基準クライアント選択とスケジューリング方式を提案する。
我々のスキームは、特にデータが非IDである場合、モデル品質を改善することができる。
論文 参考訳(メタデータ) (2023-12-05T16:56:24Z) - Amazon-M2: A Multilingual Multi-locale Shopping Session Dataset for
Recommendation and Text Generation [127.35910314813854]
Amazon Multi-locale Shopping Sessionデータセット、すなわちAmazon-M2を提示します。
6つの異なるローカライズされた数百万のユーザセッションからなる、最初の多言語データセットである。
注目すべきは、データセットがパーソナライズとユーザの好みの理解を高めるのに役立つことだ。
論文 参考訳(メタデータ) (2023-07-19T00:08:49Z) - Online Joint Assortment-Inventory Optimization under MNL Choices [11.669431684184534]
本稿では,MNL(Multinomial Logit)選択モデルに従えば,各顧客の選択行動が従うと仮定する,オンラインジョイント・アソート・インベントリ最適化問題について考察する。
本稿では,オンラインでの品揃えと在庫のオンライン意思決定において,探索と利用を効果的にバランスさせる新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-04-04T09:25:34Z) - Optimizing Offer Sets in Sub-Linear Time [5.027714423258537]
本稿では,各項目数のサブ線形時間内で動作するパーソナライズされたオファーセット最適化アルゴリズムを提案する。
私たちのアルゴリズムは完全にデータ駆動で、ユーザーのサンプルに依存します。
論文 参考訳(メタデータ) (2020-11-17T13:02:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。