論文の概要: RLT4Rec: Reinforcement Learning Transformer for User Cold Start and Item Recommendation
- arxiv url: http://arxiv.org/abs/2412.07403v1
- Date: Tue, 10 Dec 2024 10:52:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-11 14:35:16.292581
- Title: RLT4Rec: Reinforcement Learning Transformer for User Cold Start and Item Recommendation
- Title(参考訳): RLT4Rec: ユーザコールドスタートとアイテムレコメンデーションのための強化学習変換器
- Authors: Dilina Chandika Rajapakse, Douglas Leith,
- Abstract要約: 逐次変圧器強化学習アーキテクチャ RLT4Rec
RLT4Recは、新しいユーザと確立したユーザを同じ一貫したフレームワーク内で処理する。
RLT4Recのトレーニングは堅牢で高速である。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: We introduce a new sequential transformer reinforcement learning architecture RLT4Rec and demonstrate that it achieves excellent performance in a range of item recommendation tasks. RLT4Rec uses a relatively simple transformer architecture that takes as input the user's (item,rating) history and outputs the next item to present to the user. Unlike existing RL approaches, there is no need to input a state observation or estimate. RLT4Rec handles new users and established users within the same consistent framework and automatically balances the "exploration" needed to discover the preferences of a new user with the "exploitation" that is more appropriate for established users. Training of RLT4Rec is robust and fast and is insensitive to the choice of training data, learning to generate "good" personalised sequences that the user tends to rate highly even when trained on "bad" data.
- Abstract(参考訳): 本稿では,新しいシーケンシャルトランスフォーマー強化学習アーキテクチャRTT4Recを導入し,項目推薦タスクにおいて優れた性能を発揮することを示す。
RLT4Recは、ユーザの(イテム、イテム)履歴を入力として、ユーザが提示する次のアイテムを出力する比較的単純なトランスフォーマーアーキテクチャを使用する。
既存のRLアプローチとは異なり、状態観察や推定を行う必要はない。
RLT4Recは、新しいユーザと確立されたユーザを同じ一貫したフレームワーク内で処理し、新しいユーザの好みを発見するのに必要な"探索"と、確立したユーザに適した"探索"とを自動的にバランスさせる。
RLT4Recのトレーニングは堅牢で高速で、トレーニングデータの選択に敏感であり、ユーザが“悪い”データでトレーニングした場合でも高い評価を行う傾向にある“よい”パーソナライズされたシーケンスを生成することを学ぶ。
関連論文リスト
- TTT4Rec: A Test-Time Training Approach for Rapid Adaption in Sequential Recommendation [11.15566809055308]
テスト時間トレーニング(TTT)は、推論中に自己教師付き学習を使用してモデルパラメータを動的に更新することで、新しいアプローチを提供する。
TTT4Recは,動的ユーザの振る舞いをよりよく捉えるためにTTTを統合したシーケンシャルレコメンデーションフレームワークである。
我々は、TTT4Recを3つの広く使われているレコメンデーションデータセットで評価し、最先端のモデルと同等以上のパフォーマンスを達成できることを実証した。
論文 参考訳(メタデータ) (2024-09-27T21:14:23Z) - CURE4Rec: A Benchmark for Recommendation Unlearning with Deeper Influence [55.21518669075263]
CURE4Recは、レコメンデーションアンラーニング評価のための最初の包括的なベンチマークである。
さまざまな影響レベルのデータに対する推薦公正性と堅牢性に対するアンラーニングの影響について検討する。
論文 参考訳(メタデータ) (2024-08-26T16:21:50Z) - Dynamic Collaborative Filtering for Matrix- and Tensor-based Recommender
Systems [5.1148288291550505]
我々は、TIRecAとして知られる逐次問題に対する新しい協調フィルタリングモデルを提案する。
TIRecAは、新しいデータセグメントのみを使用してパラメータを効率的に更新し、リコメンダシステムに新たなユーザとアイテムをインクリメンタルに追加することができる。
一般行列とテンソルベースラインとの比較から,TIRecAはトレーニング時間において10~20倍高速でありながら,ベースライン法に匹敵する品質を達成できることが判明した。
論文 参考訳(メタデータ) (2023-12-04T20:45:51Z) - Incorporating Relevance Feedback for Information-Seeking Retrieval using
Few-Shot Document Re-Ranking [56.80065604034095]
我々は,クエリとユーザが関連すると考えるドキュメントとの類似性に基づいて,文書を再参照するkNNアプローチを提案する。
異なる統合戦略を評価するため、既存の4つの情報検索データセットを関連フィードバックシナリオに変換する。
論文 参考訳(メタデータ) (2022-10-19T16:19:37Z) - Generating Negative Samples for Sequential Recommendation [83.60655196391855]
逐次レコメンデーション(SR)のための負のサンプル(イテム)を生成することを提案する。
アイテムに対する現在のSRモデルの学習されたユーザの好みに基づいて、各タイムステップで負の項目をサンプリングする。
4つの公開データセットの実験は、SRに高品質な負のサンプルを提供することの重要性を検証する。
論文 参考訳(メタデータ) (2022-08-07T05:44:13Z) - Effective and Efficient Training for Sequential Recommendation using
Recency Sampling [91.02268704681124]
本稿では,新しいRecency-based Smpling of Sequencesトレーニング目標を提案する。
提案手法により拡張されたモデルにより,最先端のBERT4Recに近い性能が得られることを示す。
論文 参考訳(メタデータ) (2022-07-06T13:06:31Z) - Learning to Learn a Cold-start Sequential Recommender [70.5692886883067]
コールドスタート勧告は、現代のオンラインアプリケーションにおいて緊急の問題である。
メタ学習に基づくコールドスタートシーケンシャルレコメンデーションフレームワークMetaCSRを提案する。
MetaCSRは、通常のユーザの行動から共通のパターンを学ぶ能力を持っている。
論文 参考訳(メタデータ) (2021-10-18T08:11:24Z) - Zero-Shot Recommender Systems [17.30915687549977]
我々は、ZESRec(ZEro-Shot Recommenders)と呼ばれるアルゴリズムを開発し、古いデータセットに基づいてトレーニングし、新しいデータセットに一般化する。
ユーザに関しては、ZESRecはシーケンシャルRSの最近の進歩に基づいて、アイテムとのインタラクションを使用してユーザを表現する。
2組の現実世界のRSデータセットを調査し、ZESRecがそのようなゼロショット設定でレコメンデーションを有効にできることを実証します。
論文 参考訳(メタデータ) (2021-05-18T07:17:37Z) - Transfer Learning for Human Activity Recognition using Representational
Analysis of Neural Networks [0.5898893619901381]
本稿では,人間の行動認識のための伝達学習フレームワークを提案する。
転送学習を使わずに,ベースラインと比較して43%の精度向上と66%のトレーニング時間短縮を実現した。
論文 参考訳(メタデータ) (2020-12-05T01:35:11Z) - Parameter-Efficient Transfer from Sequential Behaviors for User Modeling
and Recommendation [111.44445634272235]
本稿では,PeterRecと呼ばれるパラメータ効率のよい移動学習アーキテクチャを提案する。
PeterRecは、トレーニング済みのパラメータを、一連の再学習ニューラルネットワークを注入することで、微調整中に修正されないようにする。
我々は5つの下流タスクにおいて学習したユーザ表現の有効性を示すために、広範囲な実験的アブレーションを行う。
論文 参考訳(メタデータ) (2020-01-13T14:09:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。