論文の概要: Revenue Maximization and Learning in Products Ranking
- arxiv url: http://arxiv.org/abs/2012.03800v1
- Date: Mon, 7 Dec 2020 15:41:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-16 21:07:19.228087
- Title: Revenue Maximization and Learning in Products Ranking
- Title(参考訳): 製品ランキングにおける収益最大化と学習
- Authors: Ningyuan Chen, Anran Li, Shuoguang Yang
- Abstract要約: 私たちは、価格と品質が異なる一連の製品を表示し、順番にランク付けすることを計画しているオンライン小売業者の収益問題を検討します。
消費者は無作為な注意スパンを持ち、サティフィシング製品を購入するか、注意スパンが切れたときにプラットフォームを空にしておく。
我々のフレームワークはカスケードモデルを2つの方向に拡張している: 消費者は固定されたものの代わりにランダムな注意範囲を持ち、会社は確率をクリックせずに収益を最大化する。
- 参考スコア(独自算出の注目度): 1.7403133838762448
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider the revenue maximization problem for an online retailer who plans
to display a set of products differing in their prices and qualities and rank
them in order. The consumers have random attention spans and view the products
sequentially before purchasing a ``satisficing'' product or leaving the
platform empty-handed when the attention span gets exhausted. Our framework
extends the cascade model in two directions: the consumers have random
attention spans instead of fixed ones and the firm maximizes revenues instead
of clicking probabilities. We show a nested structure of the optimal product
ranking as a function of the attention span when the attention span is fixed
and design a $1/e$-approximation algorithm accordingly for the random attention
spans. When the conditional purchase probabilities are not known and may depend
on consumer and product features, we devise an online learning algorithm that
achieves $\tilde{\mathcal{O}}(\sqrt{T})$ regret relative to the approximation
algorithm, despite of the censoring of information: the attention span of a
customer who purchases an item is not observable. Numerical experiments
demonstrate the outstanding performance of the approximation and online
learning algorithms.
- Abstract(参考訳): 価格や品質の異なる商品群を表示し、それらを順にランク付けするオンライン小売業者の収益最大化問題を考える。
消費者はランダムな注意範囲を持ち、'満足'製品を購入する前に製品を順次見るか、注意範囲が枯渇したときにプラットフォームを空っぽにしておく。
当社のフレームワークはカスケードモデルを2方向に拡張している。消費者は固定ではなくランダムな注意範囲を持ち、企業は確率をクリックせずに収益を最大化する。
注意範囲が固定されたときの注意範囲の関数として最適製品ランキングのネスト構造を示し、ランダムな注意範囲に応じて1/e$-近似アルゴリズムを設計する。
条件付き購入確率が分かっておらず,消費者や製品機能に依存する可能性がある場合,情報を検閲しているにもかかわらず,近似アルゴリズムに対して$\tilde{\mathcal{O}}(\sqrt{T})$後悔するオンライン学習アルゴリズムを考案する。
数値実験により近似およびオンライン学習アルゴリズムの優れた性能を示す。
関連論文リスト
- Long-Sequence Recommendation Models Need Decoupled Embeddings [49.410906935283585]
我々は、既存の長期推薦モデルにおいて無視された欠陥を識別し、特徴付ける。
埋め込みの単一のセットは、注意と表現の両方を学ぶのに苦労し、これら2つのプロセス間の干渉につながります。
本稿では,2つの異なる埋め込みテーブルを別々に学習し,注意と表現を完全に分離する,DARE(Decoupled Attention and Representation Embeddings)モデルを提案する。
論文 参考訳(メタデータ) (2024-10-03T15:45:15Z) - A Primal-Dual Online Learning Approach for Dynamic Pricing of Sequentially Displayed Complementary Items under Sale Constraints [54.46126953873298]
顧客に対して順次表示される補完アイテムの動的価格設定の問題に対処する。
各項目の価格を個別に最適化するのは効果がないため、補完項目のコヒーレントな価格ポリシーが不可欠である。
実世界のデータからランダムに生成した合成設定を用いて,我々のアプローチを実証的に評価し,制約違反や後悔の観点からその性能を比較した。
論文 参考訳(メタデータ) (2024-07-08T09:55:31Z) - Product Ranking for Revenue Maximization with Multiple Purchases [29.15026863056805]
オンライン小売業者が消費者の行動を正確にモデル化できる場合に最適なランキングポリシーを提案する。
We developed the Multiple-Purchase-with-Budget UCB algorithm with $O(sqrtT)$ regret。
合成データセットと半合成データセットの両方の実験により、提案アルゴリズムの有効性が証明された。
論文 参考訳(メタデータ) (2022-10-15T11:59:45Z) - Modeling Content Creator Incentives on Algorithm-Curated Platforms [76.53541575455978]
本研究では,アルゴリズムの選択が露出ゲームにおける(ナッシュ)平衡の存在と性格にどのように影響するかを検討する。
本研究では、露出ゲームにおける平衡を数値的に見つけるためのツールを提案し、MovieLensとLastFMデータセットの監査結果を示す。
論文 参考訳(メタデータ) (2022-06-27T08:16:59Z) - Personalized Entity Resolution with Dynamic Heterogeneous Knowledge
Graph Representations [40.37976161857134]
製品ランキングの精度を向上させるためにパーソナライズされた機能を活用する新しいフレームワークを提案する。
まず、顧客購入履歴と製品知識グラフからオープンソースの異種知識グラフを作成し、顧客と製品の埋め込みを共同で学習します。
その後、プロダクト、顧客、履歴の表現をニューラルリランキングモデルに組み込んで、どの候補が特定の顧客に購入される可能性が最も高いかを予測します。
論文 参考訳(メタデータ) (2021-04-06T16:58:27Z) - A Tractable Online Learning Algorithm for the Multinomial Logit Contextual Bandit [2.9998316151418107]
我々は、意思決定者が消費者に製品のサブセットを提供する動的集合最適化問題を考える。
MNL(Multinomial Logit)モデルを用いて消費者選択行動のモデル化を行う。
後悔は$O(sqrtdT + kappa)$で束縛され、既存のメソッドよりもパフォーマンスが大幅に向上していることを示す。
論文 参考訳(メタデータ) (2020-11-28T00:20:36Z) - Regret in Online Recommendation Systems [73.58127515175127]
本稿では,オンライン環境におけるレコメンデーションシステムの理論的分析について提案する。
各ラウンドにおいて、ユーザがランダムに$m$ユーザから選択され、レコメンデーションが要求される。決定者は、ユーザを観察し、$n$アイテムのカタログからアイテムを選択する。
推奨アルゴリズムのパフォーマンスは、これらの可能性を認識したOracleアルゴリズムを参照して、その後悔を通じて取得される。
論文 参考訳(メタデータ) (2020-10-23T12:48:35Z) - Learning to Infer User Hidden States for Online Sequential Advertising [52.169666997331724]
本稿では,これらの問題に対処するディープインテントシーケンス広告(DISA)手法を提案する。
解釈可能性の鍵となる部分は、消費者の購入意図を理解することである。
論文 参考訳(メタデータ) (2020-09-03T05:12:26Z) - Learning Robust Models for e-Commerce Product Search [23.537201383165755]
検索クエリ意図にマッチしないアイテムを表示することは、eコマースにおける顧客エクスペリエンスを低下させる。
問題を緩和するには、大きなラベル付きデータセットが必要である。
我々は、ミスマッチを効果的に分類することを学ぶ、深いエンドツーエンドモデルを開発する。
論文 参考訳(メタデータ) (2020-05-07T17:22:21Z) - Ranking a set of objects: a graph based least-square approach [70.7866286425868]
同一労働者の群集によるノイズの多いペアワイズ比較から始まる$N$オブジェクトのランク付けの問題について考察する。
品質評価のために,最小二乗内在的最適化基準に依存する非適応的ランキングアルゴリズムのクラスを提案する。
論文 参考訳(メタデータ) (2020-02-26T16:19:09Z) - Assortment Optimization with Repeated Exposures and Product-dependent
Patience Cost [19.29174615532181]
アマゾンなど多くのオンライン小売業者が直面しているアソシエーション最適化問題について検討する。
我々は,複数の段階にわたる消費者の購買行動を把握するために,多項ロジットモデルを開発した。
論文 参考訳(メタデータ) (2020-02-13T03:12:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。