Fugu-MT 論文翻訳(概要): D2RLIR : an improved and diversified ranking function in interactive recommendation systems based on deep reinforcement learning

論文の概要: D2RLIR : an improved and diversified ranking function in interactive recommendation systems based on deep reinforcement learning

arxiv url: http://arxiv.org/abs/2110.15089v1
Date: Thu, 28 Oct 2021 13:11:29 GMT
ステータス: 翻訳完了
システム内更新日: 2021-10-30 00:53:21.356033
Title: D2RLIR : an improved and diversified ranking function in interactive recommendation systems based on deep reinforcement learning
Title（参考訳）: D2RLIR : 深層強化学習に基づく対話型推薦システムにおける改良された多様化されたランキング機能
Authors: Vahid Baghi, Seyed Mohammad Seyed Motehayeri, Ali Moeini, Rooholah Abedian
Abstract要約: 本稿では,アクタ・クリティカルアーキテクチャを用いた深層強化学習に基づく推薦システムを提案する。提案モデルでは,ユーザの嗜好に基づいて,多様かつ関連性の高いレコメンデーションリストを生成することができる。
参考スコア（独自算出の注目度）: 0.3058685580689604
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Recently, interactive recommendation systems based on reinforcement learning have been attended by researchers due to the consider recommendation procedure as a dynamic process and update the recommendation model based on immediate user feedback, which is neglected in traditional methods. The existing works have two significant drawbacks. Firstly, inefficient ranking function to produce the Top-N recommendation list. Secondly, focusing on recommendation accuracy and inattention to other evaluation metrics such as diversity. This paper proposes a deep reinforcement learning based recommendation system by utilizing Actor-Critic architecture to model dynamic users' interaction with the recommender agent and maximize the expected long-term reward. Furthermore, we propose utilizing Spotify's ANNoy algorithm to find the most similar items to generated action by actor-network. After that, the Total Diversity Effect Ranking algorithm is used to generate the recommendations concerning relevancy and diversity. Moreover, we apply positional encoding to compute representations of the user's interaction sequence without using sequence-aligned recurrent neural networks. Extensive experiments on the MovieLens dataset demonstrate that our proposed model is able to generate a diverse while relevance recommendation list based on the user's preferences.
Abstract（参考訳）: 近年,強化学習に基づく対話型レコメンデーションシステムは,リコメンデーション手順を動的プロセスとして,また従来の手法では無視されていた即時フィードバックに基づくレコメンデーションモデルを更新するため,研究者が参加している。現存する作品は2つの大きな欠点がある。まず、Top-Nレコメンデーションリストを生成する非効率なランキング関数。第2に、レコメンデーションの正確さと多様性などの他の評価指標への不注意に注目します。本稿では,Actor-Criticアーキテクチャを用いて,推薦エージェントとの動的インタラクションをモデル化し,期待される長期報酬を最大化する深層強化学習に基づく推薦システムを提案する。さらに,spotify の annoy アルゴリズムを用いて,アクタネットワークによる生成動作と最も類似した項目を見つけることを提案する。その後、全多様性効果ランキングアルゴリズムを用いて、関連性と多様性に関する勧告を生成する。さらに、配列整列型リカレントニューラルネットワークを用いることなく、ユーザのインタラクションシーケンスの表現に位置符号化を適用する。 movielensデータセットに関する広範囲な実験により,提案モデルがユーザの好みに基づいて,多様かつ関連性のあるレコメンデーションリストを生成できることが証明された。

関連論文リスト

Tree of Preferences for Diversified Recommendation [54.183647833064136]
データバイアスの観点から、多種多様な推薦について検討する。本研究では,世界知識を活用したゼロショット推論における大規模言語モデル(LLM)の卓越した性能に着想を得て,新しいアプローチを提案する。
論文参考訳（メタデータ） (2025-12-24T04:13:17Z)
Online Clustering of Dueling Bandits [59.09590979404303]
本稿では、優先フィードバックに基づく協調的な意思決定を可能にするために、最初の「デュエルバンディットアルゴリズムのクラスタリング」を導入する。本稿では,(1)ユーザ報酬関数をコンテキストベクトルの線形関数としてモデル化する線形デューリング帯域のクラスタリング(COLDB)と,(2)ニューラルネットワークを用いて複雑な非線形ユーザ報酬関数をモデル化するニューラルデューリング帯域のクラスタリング(CONDB)の2つの新しいアルゴリズムを提案する。
論文参考訳（メタデータ） (2025-02-04T07:55:41Z)
Pre-trained Language Model and Knowledge Distillation for Lightweight Sequential Recommendation [51.25461871988366]
本稿では,事前学習言語モデルと知識蒸留に基づく逐次推薦アルゴリズムを提案する。提案アルゴリズムは,推薦精度を高め,タイムリーな推薦サービスを提供する。
論文参考訳（メタデータ） (2024-09-23T08:39:07Z)
Generative Recommender with End-to-End Learnable Item Tokenization [51.82768744368208]
ETEGRecは、アイテムのトークン化と生成的レコメンデーションを結合的なフレームワークに統合する、新しいEnd-to-End Generative Recommenderである。 ETEGRecはデュアルエンコーダ-デコーダアーキテクチャ上に構築されており、アイテムトークン化器と生成推奨器で構成されている。我々は、フレームワーク全体の安定的で効率的なエンドツーエンドトレーニングを保証するために、交互に最適化する手法を開発した。
論文参考訳（メタデータ） (2024-09-09T12:11:53Z)
Relevance meets Diversity: A User-Centric Framework for Knowledge Exploration through Recommendations [15.143224593682012]
本稿では,コプラ関数による妥当性と多様性を組み合わせた新しいレコメンデーション戦略を提案する。我々は,システムと対話しながらユーザから得た知識量のサロゲートとして多様性を利用する。我々の戦略は、最先端のライバル数社を上回っている。
論文参考訳（メタデータ） (2024-08-07T13:48:24Z)
Fisher-Weighted Merge of Contrastive Learning Models in Sequential Recommendation [0.0]
我々は、まず、フィッシャー・マージング法をシークエンシャル・レコメンデーションに適用し、それに関連する実践的な課題に対処し、解決する。提案手法の有効性を実証し, シーケンシャルラーニングおよびレコメンデーションシステムにおける最先端化の可能性を明らかにする。
論文参考訳（メタデータ） (2023-07-05T05:58:56Z)
Modeling Dynamic User Preference via Dictionary Learning for Sequential Recommendation [133.8758914874593]
ユーザの好みのダイナミックさを捉えることは、ユーザの将来の行動を予測する上で非常に重要です。浅いものも深いものも含む、既存のレコメンデーションアルゴリズムの多くは、このようなダイナミクスを独立してモデル化することが多い。本稿では、ユーザのシーケンシャルな振る舞いを、ユーザ好みの潜伏した空間に埋め込むことの問題について考察する。
論文参考訳（メタデータ） (2022-04-02T03:23:46Z)
GHRS: Graph-based Hybrid Recommendation System with Application to Movie Recommendation [0.0]
本稿では,ユーザのレーティングの類似性に関連するグラフベースモデルを用いたレコメンデータシステムを提案する。オートエンコーダの特徴抽出の利点を生かして,全ての属性を組み合わせて新しい特徴を抽出する。 The experimental results on the MovieLens dataset shows that the proposed algorithm developed many existing recommendation algorithm on recommendation accuracy。
論文参考訳（メタデータ） (2021-11-06T10:47:45Z)
Choosing the Best of Both Worlds: Diverse and Novel Recommendations through Multi-Objective Reinforcement Learning [68.45370492516531]
本稿では,Recommender Systems (RS) 設定のための拡張多目的強化学習(SMORL)を紹介する。 SMORLエージェントは、標準レコメンデーションモデルを拡張し、RLレイヤーを追加し、3つの主要な目的(正確性、多様性、新しいレコメンデーション)を同時に満たすように強制する。実世界の2つのデータセットに対する実験結果から,集約的多様性の顕著な増加,精度の適度な向上,レコメンデーションの反復性の低下,および相補的目的としての多様性と新規性の強化の重要性が示された。
論文参考訳（メタデータ） (2021-10-28T13:22:45Z)
Generative Inverse Deep Reinforcement Learning for Online Recommendation [62.09946317831129]
オンラインレコメンデーションのための新しい逆強化学習手法InvRecを提案する。 InvRecは、オンラインレコメンデーションのために、ユーザの行動から報酬関数を自動的に抽出する。
論文参考訳（メタデータ） (2020-11-04T12:12:25Z)
Towards Comprehensive Recommender Systems: Time-Aware UnifiedcRecommendations Based on Listwise Ranking of Implicit Cross-Network Data [33.17802459749589]
我々は,コールドスタートとデータ空間の問題を軽減するために,新しい深層学習に基づく統合型クロスネットワークソリューションを提案する。提案手法は精度,ノベルティ,多様性の点で優れていることを示す。人気の高いMovieLensデータセットを用いて行った実験から,提案手法が既存の最先端ランキング技術より優れていることが示唆された。
論文参考訳（メタデータ） (2020-08-25T08:08:03Z)
Self-Supervised Reinforcement Learning for Recommender Systems [77.38665506495553]
逐次リコメンデーションタスクのための自己指導型強化学習を提案する。提案手法は,2つの出力層を持つ標準レコメンデーションモデルを強化する。このようなアプローチに基づいて、自己監督型Q-ラーニング(SQN)と自己監督型アクター・クライブ(SAC)という2つのフレームワークを提案する。
論文参考訳（メタデータ） (2020-06-10T11:18:57Z)
Sequential Recommendation with Self-Attentive Multi-Adversarial Network [101.25533520688654]
逐次レコメンデーションにおける文脈情報の影響を明示的にモデル化するためのMFGAN(Multi-Factor Generative Adversarial Network)を提案する。当社のフレームワークは,複数種類の因子情報を組み込むことが柔軟であり,各因子が推奨決定にどのように貢献するかを時間とともに追跡することができる。
論文参考訳（メタデータ） (2020-05-21T12:28:59Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。