論文の概要: Combining Reward and Rank Signals for Slate Recommendation
- arxiv url: http://arxiv.org/abs/2107.12455v2
- Date: Thu, 29 Jul 2021 14:08:05 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-30 10:24:17.079184
- Title: Combining Reward and Rank Signals for Slate Recommendation
- Title(参考訳): Slate Recommendationのためのリワード信号とランク信号の組み合わせ
- Authors: Imad Aouali, Sergey Ivanov, Mike Gartrell, David Rohde, Flavian
Vasile, Victor Zaytsev, Diego Legrand
- Abstract要約: ここでは,推奨項目のコレクションやスレートを一度に提示する,スレートレコメンデーションの問題を考える。
推奨システムには2つの情報がある: スレートがクリックされたか(報酬)、スレートがクリックされた場合、どのアイテムがクリックされたか(ランク)。
- 参考スコア(独自算出の注目度): 11.90262158856215
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider the problem of slate recommendation, where the recommender system
presents a user with a collection or slate composed of K recommended items at
once. If the user finds the recommended items appealing then the user may click
and the recommender system receives some feedback. Two pieces of information
are available to the recommender system: was the slate clicked? (the reward),
and if the slate was clicked, which item was clicked? (rank). In this paper, we
formulate several Bayesian models that incorporate the reward signal (Reward
model), the rank signal (Rank model), or both (Full model), for
non-personalized slate recommendation. In our experiments, we analyze
performance gains of the Full model and show that it achieves significantly
lower error as the number of products in the catalog grows or as the slate size
increases.
- Abstract(参考訳): 提案手法では,k個の推奨項目からなるコレクションやスレートをユーザに同時に提示するスレートレコメンデーションの問題を考える。
ユーザが推奨項目を見つけた場合、ユーザーはクリックし、レコメンダシステムはいくつかのフィードバックを受け取る。
推薦システムには2つの情報がある:スレートはクリックされたか?
そしてもしスレートがクリックされたら、どのアイテムがクリックされたのか?
(位)
本稿では,非パーソナライズスレート推薦のための報酬信号(reward model),ランク信号(rank model),あるいはその両方(full model)を組み込んだベイズモデルをいくつか定式化する。
本実験では, フルモデルの性能向上を解析し, カタログ内の製品数の増加やスレートサイズの増加に伴い, 誤差を著しく低減することを示した。
関連論文リスト
- A Large Language Model Enhanced Sequential Recommender for Joint Video and Comment Recommendation [77.42486522565295]
我々は、パーソナライズされたビデオとコメントのレコメンデーションを共同で行うLSVCRと呼ばれる新しいレコメンデーション手法を提案する。
提案手法は,逐次レコメンデーション(SR)モデルと補足型大規模言語モデル(LLM)レコメンデーションという2つの重要なコンポーネントから構成される。
特に、コメント視聴時間の4.13%が大幅に向上した。
論文 参考訳(メタデータ) (2024-03-20T13:14:29Z) - Interactive Garment Recommendation with User in the Loop [77.35411131350833]
我々は,服を作るために補完的なアイテムを推奨するので,ユーザ反応を統合することでユーザプロファイルをその場で構築することを提案する。
本稿では,適切な衣服を提案し,ユーザのフィードバックを取り入れて推薦を改善することができる強化学習エージェントを提案する。
論文 参考訳(メタデータ) (2024-02-18T16:01:28Z) - RecXplainer: Amortized Attribute-based Personalized Explanations for
Recommender Systems [35.57265154621778]
提案するRecXplainerは,推奨項目の属性に対するユーザの好みに基づいた,きめ細かい説明を生成する手法である。
我々はRecXplainerを5つの実世界および大規模レコメンデーションデータセットで評価する。
論文 参考訳(メタデータ) (2022-11-27T21:00:31Z) - Breaking Feedback Loops in Recommender Systems with Causal Inference [99.22185950608838]
近年の研究では、フィードバックループが推奨品質を損なう可能性があり、ユーザの振る舞いを均質化している。
本稿では、因果推論を用いてフィードバックループを確実に破壊するアルゴリズムCAFLを提案する。
従来の補正手法と比較して,CAFLは推奨品質を向上することを示す。
論文 参考訳(メタデータ) (2022-07-04T17:58:39Z) - Recommendation Systems with Distribution-Free Reliability Guarantees [83.80644194980042]
我々は、主に良いアイテムを含むことを厳格に保証されたアイテムのセットを返す方法を示す。
本手法は, 擬似発見率の厳密な有限サンプル制御によるランキングモデルを提供する。
我々はYahoo!のランキングとMSMarcoデータセットの学習方法を評価する。
論文 参考訳(メタデータ) (2022-07-04T17:49:25Z) - FINN.no Slates Dataset: A new Sequential Dataset Logging Interactions,
allViewed Items and Click Responses/No-Click for Recommender Systems Research [4.792216056979392]
本稿では,ユーザとオンラインマーケットプレース間の逐次的なインタラクションを記録する,新たなレコメンデータシステムデータセットを提案する。
データセットには、各ラウンドで提示されたスレート、ユーザがこれらのアイテムをクリックしたかどうか、ユーザがクリックしたアイテムが含まれている。
論文 参考訳(メタデータ) (2021-11-05T09:21:58Z) - Automatic Collection Creation and Recommendation [0.0]
本稿では,ユーザレベルで自動的にアイテムのコレクションを作成し,推薦できるコレクションレコメンダシステムを提案する。
提案システムは,項目推薦システムで学習したユーザ・イテム表現に基づいて構築される。
アイテムよりもコレクションを推奨する場合、レコメンデーション駆動の消費は2.3倍増加しています。
論文 参考訳(メタデータ) (2021-05-03T16:51:21Z) - Dynamic Slate Recommendation with Gated Recurrent Units and Thompson
Sampling [6.312395952874578]
我々は,インターネットプラットフォームのユーザに対して,アイテムリストとしてslatesという,関連するコンテンツを推薦する問題を考える。
本稿では,インターネットプラットフォームとユーザ間のインタラクションの時系列に作用する変分ベイズ型リカレントニューラルネットレコメンデータシステムを提案する。
我々は,探索的レコメンデーション戦略が,同程度以上の欲望に対して有効であることを実験的に示す。
論文 参考訳(メタデータ) (2021-04-30T15:16:35Z) - ELIXIR: Learning from User Feedback on Explanations to Improve
Recommender Models [26.11434743591804]
説明に対するユーザフィードバックをユーザ好みのペアワイズ学習に活用する,ループ内人間フレームワーク ELIXIR を考案した。
elixirは、レコメンデーションと説明のペアに対するフィードバックを活用して、ユーザ固有の潜在選好ベクトルを学習する。
このフレームワークは、ランダムウォークとリスタートによる一般化グラフレコメンデーションを用いてインスタンス化される。
論文 参考訳(メタデータ) (2021-02-15T13:43:49Z) - Regret in Online Recommendation Systems [73.58127515175127]
本稿では,オンライン環境におけるレコメンデーションシステムの理論的分析について提案する。
各ラウンドにおいて、ユーザがランダムに$m$ユーザから選択され、レコメンデーションが要求される。決定者は、ユーザを観察し、$n$アイテムのカタログからアイテムを選択する。
推奨アルゴリズムのパフォーマンスは、これらの可能性を認識したOracleアルゴリズムを参照して、その後悔を通じて取得される。
論文 参考訳(メタデータ) (2020-10-23T12:48:35Z) - Controllable Multi-Interest Framework for Recommendation [64.30030600415654]
我々はレコメンデータシステムを逐次レコメンデーション問題として定式化する。
我々は,ComiRec と呼ばれる連続的なレコメンデーションのための新しい制御可能な多目的フレームワークを提案する。
私たちのフレームワークは、オフラインのAlibaba分散クラウドプラットフォームにうまくデプロイされています。
論文 参考訳(メタデータ) (2020-05-19T10:18:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。