論文の概要: Dynamic Slate Recommendation with Gated Recurrent Units and Thompson
Sampling
- arxiv url: http://arxiv.org/abs/2104.15046v1
- Date: Fri, 30 Apr 2021 15:16:35 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-03 15:53:39.412336
- Title: Dynamic Slate Recommendation with Gated Recurrent Units and Thompson
Sampling
- Title(参考訳): Gated Recurrent Units と Thompson サンプリングによる動的スレート勧告
- Authors: Simen Eide, David S. Leslie, Arnoldo Frigessi
- Abstract要約: 我々は,インターネットプラットフォームのユーザに対して,アイテムリストとしてslatesという,関連するコンテンツを推薦する問題を考える。
本稿では,インターネットプラットフォームとユーザ間のインタラクションの時系列に作用する変分ベイズ型リカレントニューラルネットレコメンデータシステムを提案する。
我々は,探索的レコメンデーション戦略が,同程度以上の欲望に対して有効であることを実験的に示す。
- 参考スコア(独自算出の注目度): 6.312395952874578
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We consider the problem of recommending relevant content to users of an
internet platform in the form of lists of items, called slates. We introduce a
variational Bayesian Recurrent Neural Net recommender system that acts on time
series of interactions between the internet platform and the user, and which
scales to real world industrial situations. The recommender system is tested
both online on real users, and on an offline dataset collected from a Norwegian
web-based marketplace, FINN.no, that is made public for research. This is one
of the first publicly available datasets which includes all the slates that are
presented to users as well as which items (if any) in the slates were clicked
on. Such a data set allows us to move beyond the common assumption that
implicitly assumes that users are considering all possible items at each
interaction. Instead we build our likelihood using the items that are actually
in the slate, and evaluate the strengths and weaknesses of both approaches
theoretically and in experiments. We also introduce a hierarchical prior for
the item parameters based on group memberships. Both item parameters and user
preferences are learned probabilistically. Furthermore, we combine our model
with bandit strategies to ensure learning, and introduce `in-slate Thompson
Sampling' which makes use of the slates to maximise explorative opportunities.
We show experimentally that explorative recommender strategies perform on par
or above their greedy counterparts. Even without making use of exploration to
learn more effectively, click rates increase simply because of improved
diversity in the recommended slates.
- Abstract(参考訳): 我々は,インターネットプラットフォームのユーザに対して,アイテムリストとしてslatesという,関連するコンテンツを推薦する問題を考える。
本稿では,インターネットプラットフォームとユーザ間のインタラクションの時系列に作用し,実世界の産業状況にスケールするベイズ的リカレントニューラルネット推薦システムを提案する。
レコメンダシステムは、実際のユーザと、ノルウェーのwebベースのマーケットプレースであるfinn.noから収集されたオフラインデータセットの両方でオンラインでテストされている。
これは、ユーザーに提示されるすべてのスレートと、スレート内の(もしあるなら)どのアイテムがクリックされたかを含む、最初の公開データセットの1つである。
このようなデータセットは、ユーザがそれぞれのインタラクションで可能なすべての項目を考慮していると暗黙的に仮定する、一般的な仮定を超えることができます。
その代わりに、実際にスレートにあるアイテムを使って可能性を構築し、理論的および実験において両方のアプローチの長所と短所を評価する。
また,グループメンバシップに基づく項目パラメータの階層的事前設定も導入する。
アイテムパラメータとユーザの好みの両方が確率的に学習される。
さらに,本モデルとバンディット戦略を組み合わせて学習を確実にし,爆発的機会を最大化するためにスレートを利用する'in-slate Thompson Sampling'を導入する。
我々は,探索的レコメンデーション戦略が,同程度以上の欲望に対して有効であることを実験的に示す。
より効果的に学習するために探索を使わなくても、推奨スレートの多様性の改善によってクリック率が向上する。
関連論文リスト
- Measuring Strategization in Recommendation: Users Adapt Their Behavior to Shape Future Content [66.71102704873185]
実験と調査を行うことで,ユーザストラテジゼーションの試行を行う。
参加者の居住時間や「いいね!」の使用など,結果指標間での戦略化の強い証拠を見出す。
この結果から,プラットフォームはアルゴリズムがユーザの行動に与える影響を無視できないことが示唆された。
論文 参考訳(メタデータ) (2024-05-09T07:36:08Z) - PARSRec: Explainable Personalized Attention-fused Recurrent Sequential
Recommendation Using Session Partial Actions [0.5801044612920815]
共通のパターンと個人の行動に依存したアーキテクチャを提案する。
Nielsen Consumer Panel データセットの実証結果は,提案手法が最大27.9%のパフォーマンス向上を達成したことを示唆している。
論文 参考訳(メタデータ) (2022-09-16T12:07:43Z) - Incentivizing Combinatorial Bandit Exploration [87.08827496301839]
自己関心のあるユーザに対してレコメンデーションシステムでアクションを推奨するバンディットアルゴリズムを考える。
ユーザーは他のアクションを自由に選択でき、アルゴリズムの推奨に従うためにインセンティブを得る必要がある。
ユーザは悪用を好むが、アルゴリズムは、前のユーザから収集した情報を活用することで、探索にインセンティブを与えることができる。
論文 参考訳(メタデータ) (2022-06-01T13:46:25Z) - Learning Personalized Item-to-Item Recommendation Metric via Implicit
Feedback [24.37151414523712]
本稿では,暗黙のフィードバックによるメトリクス学習の新しい視点から,レコメンデーションシステムにおける項目間推薦問題について検討する。
本研究では,アイテムの内部コンテンツとユーザによるインタラクションの両方をキャプチャする,パーソナライズ可能なディープメトリックモデルを開発し,検討する。
論文 参考訳(メタデータ) (2022-03-18T18:08:57Z) - FINN.no Slates Dataset: A new Sequential Dataset Logging Interactions,
allViewed Items and Click Responses/No-Click for Recommender Systems Research [4.792216056979392]
本稿では,ユーザとオンラインマーケットプレース間の逐次的なインタラクションを記録する,新たなレコメンデータシステムデータセットを提案する。
データセットには、各ラウンドで提示されたスレート、ユーザがこれらのアイテムをクリックしたかどうか、ユーザがクリックしたアイテムが含まれている。
論文 参考訳(メタデータ) (2021-11-05T09:21:58Z) - Set2setRank: Collaborative Set to Set Ranking for Implicit Feedback
based Recommendation [59.183016033308014]
本稿では,暗黙的フィードバックの特徴を探究し,推奨するSet2setRankフレームワークを提案する。
提案するフレームワークはモデルに依存しず,ほとんどの推奨手法に容易に適用できる。
論文 参考訳(メタデータ) (2021-05-16T08:06:22Z) - Partial Bandit and Semi-Bandit: Making the Most Out of Scarce Users'
Feedback [62.997667081978825]
本稿では,ユーザのフィードバックを考慮し,3つの戦略を用いて評価する手法を提案する。
ユーザからのフィードバックが制限されているにも関わらず(全体の20%以下)、我々の手法は最先端のアプローチと同じような結果が得られる。
論文 参考訳(メタデータ) (2020-09-16T07:32:51Z) - Deep Bayesian Bandits: Exploring in Online Personalized Recommendations [4.845576821204241]
我々は、表示広告レコメンデータを文脈的盗賊として定式化する。
クリックスルーレートの後部分布からのサンプリングを必要とする探索手法を実装した。
提案したディープベイズ帯域幅アルゴリズムをオフラインシミュレーションとオンラインAB設定で検証した。
論文 参考訳(メタデータ) (2020-08-03T08:58:18Z) - Seamlessly Unifying Attributes and Items: Conversational Recommendation
for Cold-Start Users [111.28351584726092]
コールドスタートユーザに対しては,属性を問うと同時に,ユーザに対して対話的に商品を推薦する,対話型レコメンデーションを提案する。
会話型トンプソンサンプリング(ConTS)モデルでは,最大報酬の腕を選択することで,対話型レコメンデーションにおけるすべての質問を一意に解決する。
論文 参考訳(メタデータ) (2020-05-23T08:56:37Z) - Controllable Multi-Interest Framework for Recommendation [64.30030600415654]
我々はレコメンデータシステムを逐次レコメンデーション問題として定式化する。
我々は,ComiRec と呼ばれる連続的なレコメンデーションのための新しい制御可能な多目的フレームワークを提案する。
私たちのフレームワークは、オフラインのAlibaba分散クラウドプラットフォームにうまくデプロイされています。
論文 参考訳(メタデータ) (2020-05-19T10:18:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。