論文の概要: D2RLIR : an improved and diversified ranking function in interactive
recommendation systems based on deep reinforcement learning
- arxiv url: http://arxiv.org/abs/2110.15089v2
- Date: Fri, 29 Oct 2021 02:37:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-01 12:38:00.636853
- Title: D2RLIR : an improved and diversified ranking function in interactive
recommendation systems based on deep reinforcement learning
- Title(参考訳): D2RLIR : 深層強化学習に基づく対話型推薦システムにおける改良された多様化されたランキング機能
- Authors: Vahid Baghi, Seyed Mohammad Seyed Motehayeri, Ali Moeini, Rooholah
Abedian
- Abstract要約: 本稿では,アクタ・クリティカルアーキテクチャを用いた深層強化学習に基づく推薦システムを提案する。
提案モデルでは,ユーザの嗜好に基づいて,多様かつ関連性の高いレコメンデーションリストを生成することができる。
- 参考スコア(独自算出の注目度): 0.3058685580689604
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, interactive recommendation systems based on reinforcement learning
have been attended by researchers due to the consider recommendation procedure
as a dynamic process and update the recommendation model based on immediate
user feedback, which is neglected in traditional methods. The existing works
have two significant drawbacks. Firstly, inefficient ranking function to
produce the Top-N recommendation list. Secondly, focusing on recommendation
accuracy and inattention to other evaluation metrics such as diversity. This
paper proposes a deep reinforcement learning based recommendation system by
utilizing Actor-Critic architecture to model dynamic users' interaction with
the recommender agent and maximize the expected long-term reward. Furthermore,
we propose utilizing Spotify's ANNoy algorithm to find the most similar items
to generated action by actor-network. After that, the Total Diversity Effect
Ranking algorithm is used to generate the recommendations concerning relevancy
and diversity. Moreover, we apply positional encoding to compute
representations of the user's interaction sequence without using
sequence-aligned recurrent neural networks. Extensive experiments on the
MovieLens dataset demonstrate that our proposed model is able to generate a
diverse while relevance recommendation list based on the user's preferences.
- Abstract(参考訳): 近年,強化学習に基づく対話型レコメンデーションシステムは,リコメンデーション手順を動的プロセスとして,また従来の手法では無視されていた即時フィードバックに基づくレコメンデーションモデルを更新するため,研究者が参加している。
現存する作品は2つの大きな欠点がある。
まず、Top-Nレコメンデーションリストを生成する非効率なランキング関数。
第2に、レコメンデーションの正確さと多様性などの他の評価指標への不注意に注目します。
本稿では,Actor-Criticアーキテクチャを用いて,推薦エージェントとの動的インタラクションをモデル化し,期待される長期報酬を最大化する深層強化学習に基づく推薦システムを提案する。
さらに,spotify の annoy アルゴリズムを用いて,アクタネットワークによる生成動作と最も類似した項目を見つけることを提案する。
その後、全多様性効果ランキングアルゴリズムを用いて、関連性と多様性に関する勧告を生成する。
さらに、配列整列型リカレントニューラルネットワークを用いることなく、ユーザのインタラクションシーケンスの表現に位置符号化を適用する。
movielensデータセットに関する広範囲な実験により,提案モデルがユーザの好みに基づいて,多様かつ関連性のあるレコメンデーションリストを生成できることが証明された。
関連論文リスト
- Pre-trained Language Model and Knowledge Distillation for Lightweight Sequential Recommendation [51.25461871988366]
本稿では,事前学習言語モデルと知識蒸留に基づく逐次推薦アルゴリズムを提案する。
提案アルゴリズムは,推薦精度を高め,タイムリーな推薦サービスを提供する。
論文 参考訳(メタデータ) (2024-09-23T08:39:07Z) - Relevance meets Diversity: A User-Centric Framework for Knowledge Exploration through Recommendations [15.143224593682012]
本稿では,コプラ関数による妥当性と多様性を組み合わせた新しいレコメンデーション戦略を提案する。
我々は,システムと対話しながらユーザから得た知識量のサロゲートとして多様性を利用する。
我々の戦略は、最先端のライバル数社を上回っている。
論文 参考訳(メタデータ) (2024-08-07T13:48:24Z) - Fisher-Weighted Merge of Contrastive Learning Models in Sequential
Recommendation [0.0]
我々は、まず、フィッシャー・マージング法をシークエンシャル・レコメンデーションに適用し、それに関連する実践的な課題に対処し、解決する。
提案手法の有効性を実証し, シーケンシャルラーニングおよびレコメンデーションシステムにおける最先端化の可能性を明らかにする。
論文 参考訳(メタデータ) (2023-07-05T05:58:56Z) - Modeling Dynamic User Preference via Dictionary Learning for Sequential
Recommendation [133.8758914874593]
ユーザの好みのダイナミックさを捉えることは、ユーザの将来の行動を予測する上で非常に重要です。
浅いものも深いものも含む、既存のレコメンデーションアルゴリズムの多くは、このようなダイナミクスを独立してモデル化することが多い。
本稿では、ユーザのシーケンシャルな振る舞いを、ユーザ好みの潜伏した空間に埋め込むことの問題について考察する。
論文 参考訳(メタデータ) (2022-04-02T03:23:46Z) - GHRS: Graph-based Hybrid Recommendation System with Application to Movie
Recommendation [0.0]
本稿では,ユーザのレーティングの類似性に関連するグラフベースモデルを用いたレコメンデータシステムを提案する。
オートエンコーダの特徴抽出の利点を生かして,全ての属性を組み合わせて新しい特徴を抽出する。
The experimental results on the MovieLens dataset shows that the proposed algorithm developed many existing recommendation algorithm on recommendation accuracy。
論文 参考訳(メタデータ) (2021-11-06T10:47:45Z) - Choosing the Best of Both Worlds: Diverse and Novel Recommendations
through Multi-Objective Reinforcement Learning [68.45370492516531]
本稿では,Recommender Systems (RS) 設定のための拡張多目的強化学習(SMORL)を紹介する。
SMORLエージェントは、標準レコメンデーションモデルを拡張し、RLレイヤーを追加し、3つの主要な目的(正確性、多様性、新しいレコメンデーション)を同時に満たすように強制する。
実世界の2つのデータセットに対する実験結果から,集約的多様性の顕著な増加,精度の適度な向上,レコメンデーションの反復性の低下,および相補的目的としての多様性と新規性の強化の重要性が示された。
論文 参考訳(メタデータ) (2021-10-28T13:22:45Z) - Generative Inverse Deep Reinforcement Learning for Online Recommendation [62.09946317831129]
オンラインレコメンデーションのための新しい逆強化学習手法InvRecを提案する。
InvRecは、オンラインレコメンデーションのために、ユーザの行動から報酬関数を自動的に抽出する。
論文 参考訳(メタデータ) (2020-11-04T12:12:25Z) - Towards Comprehensive Recommender Systems: Time-Aware
UnifiedcRecommendations Based on Listwise Ranking of Implicit Cross-Network
Data [33.17802459749589]
我々は,コールドスタートとデータ空間の問題を軽減するために,新しい深層学習に基づく統合型クロスネットワークソリューションを提案する。
提案手法は精度,ノベルティ,多様性の点で優れていることを示す。
人気の高いMovieLensデータセットを用いて行った実験から,提案手法が既存の最先端ランキング技術より優れていることが示唆された。
論文 参考訳(メタデータ) (2020-08-25T08:08:03Z) - Self-Supervised Reinforcement Learning for Recommender Systems [77.38665506495553]
逐次リコメンデーションタスクのための自己指導型強化学習を提案する。
提案手法は,2つの出力層を持つ標準レコメンデーションモデルを強化する。
このようなアプローチに基づいて、自己監督型Q-ラーニング(SQN)と自己監督型アクター・クライブ(SAC)という2つのフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-10T11:18:57Z) - Sequential Recommendation with Self-Attentive Multi-Adversarial Network [101.25533520688654]
逐次レコメンデーションにおける文脈情報の影響を明示的にモデル化するためのMFGAN(Multi-Factor Generative Adversarial Network)を提案する。
当社のフレームワークは,複数種類の因子情報を組み込むことが柔軟であり,各因子が推奨決定にどのように貢献するかを時間とともに追跡することができる。
論文 参考訳(メタデータ) (2020-05-21T12:28:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。