論文の概要: A Scalable Probabilistic Model for Reward Optimizing Slate
Recommendation
- arxiv url: http://arxiv.org/abs/2208.06263v1
- Date: Wed, 10 Aug 2022 13:18:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-15 13:11:10.955198
- Title: A Scalable Probabilistic Model for Reward Optimizing Slate
Recommendation
- Title(参考訳): スレートレコメンデーションを最適化するスケーラブルな確率モデル
- Authors: Imad Aouali, Achraf Ait Sidi Hammou, Sergey Ivanov, Otmane Sakhi,
David Rohde, Flavian Vasile
- Abstract要約: 本稿では,パーソナライズされたスレートレコメンデーションのためのスケーラブルな確率モデルであるPRR(Probabilistic Rank and Reward model)を紹介する。
本手法は,報酬のみを使用するバンディット法や,ランクのみを使用するユーザの選好法よりも効率よく学習する。
提案手法は,最大100万項目の大規模データセット上での速度と精度の両面での最先端技術である。
- 参考スコア(独自算出の注目度): 9.104884285248115
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce Probabilistic Rank and Reward model (PRR), a scalable
probabilistic model for personalized slate recommendation. Our model allows
state-of-the-art estimation of user interests in the following ubiquitous
recommender system scenario: A user is shown a slate of K recommendations and
the user chooses at most one of these K items. It is the goal of the
recommender system to find the K items of most interest to a user in order to
maximize the probability that the user interacts with the slate. Our
contribution is to show that we can learn more effectively the probability of
the recommendations being successful by combining the reward - whether the
slate was clicked or not - and the rank - the item on the slate that was
selected. Our method learns more efficiently than bandit methods that use only
the reward, and user preference methods that use only the rank. It also
provides similar or better estimation performance to independent
inverse-propensity-score methods and is far more scalable. Our method is state
of the art in terms of both speed and accuracy on massive datasets with up to 1
million items. Finally, our method allows fast delivery of recommendations
powered by maximum inner product search (MIPS), making it suitable in extremely
low latency domains such as computational advertising.
- Abstract(参考訳): 本稿では,パーソナライズされたスレートレコメンデーションのためのスケーラブルな確率モデルであるPRR(Probabilistic Rank and Reward model)を紹介する。
本モデルでは,以下のユビキタスレコメンデーションシステムシナリオにおいて,ユーザの興味を最先端に推定することが可能である。
ユーザがスレートと対話する確率を最大化するために、最も関心のあるK項目を見つけることが推奨システムの目標である。
私たちの貢献は、スレートがクリックされたかどうかに関わらず報酬と、選択されたスレートの項目を組み合わせることで、推奨が成功する確率をより効果的に知ることができることを示しています。
本手法は報酬のみを使用するbanditメソッドやランクのみを使用するユーザ嗜好メソッドよりも効率的に学習する。
また、独立の逆確率スコア法と類似またはより良い推定性能を提供し、はるかにスケーラブルである。
提案手法は,最大100万項目の大規模データセット上での速度と精度の両面での最先端技術である。
最後に,提案手法により,最大内積探索(MIPS)を利用したレコメンデーションの迅速な配信が可能となり,計算広告などの極めて低レイテンシ領域に適合する。
関連論文リスト
- Recommendation Systems with Distribution-Free Reliability Guarantees [83.80644194980042]
我々は、主に良いアイテムを含むことを厳格に保証されたアイテムのセットを返す方法を示す。
本手法は, 擬似発見率の厳密な有限サンプル制御によるランキングモデルを提供する。
我々はYahoo!のランキングとMSMarcoデータセットの学習方法を評価する。
論文 参考訳(メタデータ) (2022-07-04T17:49:25Z) - Meta-Wrapper: Differentiable Wrapping Operator for User Interest
Selection in CTR Prediction [97.99938802797377]
クリックスルー率(CTR)予測は、ユーザーが商品をクリックする確率を予測することを目的としており、リコメンデーションシステムにおいてますます重要になっている。
近年,ユーザの行動からユーザの興味を自動的に抽出する深層学習モデルが大きな成功を収めている。
そこで我々は,メタラッパー(Meta-Wrapper)と呼ばれるラッパー手法の枠組みに基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2022-06-28T03:28:15Z) - Introducing a Framework and a Decision Protocol to Calibrate Recommender
Systems [0.0]
本稿では,ジャンルの校正バランスを考慮したレコメンデーションリスト作成手法を提案する。
主な主張は、キャリブレーションはより公平なレコメンデーションを生み出すために肯定的に貢献できるということである。
本稿では,1000以上の校正システムの組み合わせを生成するための概念的フレームワークと決定プロトコルを提案する。
論文 参考訳(メタデータ) (2022-04-07T19:30:55Z) - Modeling Dynamic User Preference via Dictionary Learning for Sequential
Recommendation [133.8758914874593]
ユーザの好みのダイナミックさを捉えることは、ユーザの将来の行動を予測する上で非常に重要です。
浅いものも深いものも含む、既存のレコメンデーションアルゴリズムの多くは、このようなダイナミクスを独立してモデル化することが多い。
本稿では、ユーザのシーケンシャルな振る舞いを、ユーザ好みの潜伏した空間に埋め込むことの問題について考察する。
論文 参考訳(メタデータ) (2022-04-02T03:23:46Z) - Quantifying Availability and Discovery in Recommender Systems via
Stochastic Reachability [27.21058243752746]
そこで本稿では,ユーザへのコンテンツ推薦の最大確率を定量化するために,到達性に基づく評価手法を提案する。
リーチビリティは、コンテンツの可用性のバイアスを検出し、ユーザに与えられる発見の機会の制限を診断するために使用することができる。
明示的および暗黙的な評価の大規模なデータセットに基づいてトレーニングされた推薦アルゴリズムの評価を示す。
論文 参考訳(メタデータ) (2021-06-30T16:18:12Z) - PURS: Personalized Unexpected Recommender System for Improving User
Satisfaction [76.98616102965023]
本稿では、予期せぬことを推奨プロセスに組み込んだ、新しいPersonalized Unexpected Recommender System(PURS)モデルについて述べる。
3つの実世界のデータセットに対する大規模なオフライン実験は、提案されたPURSモデルが最先端のベースラインアプローチを大幅に上回っていることを示している。
論文 参考訳(メタデータ) (2021-06-05T01:33:21Z) - Dynamic Slate Recommendation with Gated Recurrent Units and Thompson
Sampling [6.312395952874578]
我々は,インターネットプラットフォームのユーザに対して,アイテムリストとしてslatesという,関連するコンテンツを推薦する問題を考える。
本稿では,インターネットプラットフォームとユーザ間のインタラクションの時系列に作用する変分ベイズ型リカレントニューラルネットレコメンデータシステムを提案する。
我々は,探索的レコメンデーション戦略が,同程度以上の欲望に対して有効であることを実験的に示す。
論文 参考訳(メタデータ) (2021-04-30T15:16:35Z) - PinnerSage: Multi-Modal User Embedding Framework for Recommendations at
Pinterest [54.56236567783225]
PinnerSageはエンド・ツー・エンドのレコメンデーションシステムで、マルチモーダル・埋め込みを通じて各ユーザーを表現する。
オフラインおよびオンラインA/B実験を複数実施し,本手法が単一埋め込み法より有意に優れていることを示す。
論文 参考訳(メタデータ) (2020-07-07T17:13:20Z) - Seamlessly Unifying Attributes and Items: Conversational Recommendation
for Cold-Start Users [111.28351584726092]
コールドスタートユーザに対しては,属性を問うと同時に,ユーザに対して対話的に商品を推薦する,対話型レコメンデーションを提案する。
会話型トンプソンサンプリング(ConTS)モデルでは,最大報酬の腕を選択することで,対話型レコメンデーションにおけるすべての質問を一意に解決する。
論文 参考訳(メタデータ) (2020-05-23T08:56:37Z) - RNE: A Scalable Network Embedding for Billion-scale Recommendation [21.6366085346674]
データ効率のよいレコメンデーションベースのネットワーク埋め込み手法であるRNEを提案し、ユーザに対してパーソナライズされた多様なアイテムを提供する。
一方,提案手法は,ユーザの関心の多様性と動的特性をモデル化し,推薦品質を高めるとともに,ユーザとアイテム間の局所的な構造を維持できる。
当社は、中国最大のEコマースプラットフォームであるTaobaoのレコメンデーションシナリオにRNEをデプロイし、それを10億規模のユーザテムグラフでトレーニングしています。
論文 参考訳(メタデータ) (2020-03-10T07:08:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。