Fugu-MT 論文翻訳(概要): A Text-based Deep Reinforcement Learning Framework for Interactive Recommendation

論文の概要: A Text-based Deep Reinforcement Learning Framework for Interactive Recommendation

arxiv url: http://arxiv.org/abs/2004.06651v4
Date: Sun, 26 Jul 2020 13:03:21 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-13 10:17:03.082688
Title: A Text-based Deep Reinforcement Learning Framework for Interactive Recommendation
Title（参考訳）: 対話型推薦のためのテキストベース深層強化学習フレームワーク
Authors: Chaoyang Wang and Zhiqiang Guo and Jianjun Li and Peng Pan and Guohui Li
Abstract要約: インタラクティブレコメンデータシステム(IRS)のためのテキストベースのDeep Deterministic Policy Gradient Framework(TDDPG-Rec)を提案する。具体的には,テキスト情報を利用してアイテムやユーザを特徴空間にマッピングすることで,空間性の問題を大幅に軽減する。 TDDPG-Recは,複数のベースラインに対して,時間効率で最先端のパフォーマンスを実現する。
参考スコア（独自算出の注目度）: 15.723042747172688
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Due to its nature of learning from dynamic interactions and planning for long-run performance, reinforcement learning (RL) recently has received much attention in interactive recommender systems (IRSs). IRSs usually face the large discrete action space problem, which makes most of the existing RL-based recommendation methods inefficient. Moreover, data sparsity is another challenging problem that most IRSs are confronted with. While the textual information like reviews and descriptions is less sensitive to sparsity, existing RL-based recommendation methods either neglect or are not suitable for incorporating textual information. To address these two problems, in this paper, we propose a Text-based Deep Deterministic Policy Gradient framework (TDDPG-Rec) for IRSs. Specifically, we leverage textual information to map items and users into a feature space, which greatly alleviates the sparsity problem. Moreover, we design an effective method to construct an action candidate set. By the policy vector dynamically learned from TDDPG-Rec that expresses the user's preference, we can select actions from the candidate set effectively. Through experiments on three public datasets, we demonstrate that TDDPG-Rec achieves state-of-the-art performance over several baselines in a time-efficient manner.
Abstract（参考訳）: 動的相互作用から学習し,長期的パフォーマンスのための計画を立てることの性質から,近年,対話型推薦システム (IRS) において強化学習 (RL) が注目されている。 IRSは通常、大きな離散的なアクション空間問題に直面し、既存のRLベースのレコメンデーション手法のほとんどを非効率にする。さらに、データスパシティは、ほとんどのIRSが直面している別の難しい問題である。レビューや記述などのテキスト情報は疎結合に敏感でないが、既存のRLベースのレコメンデーション手法は無視するか、あるいはテキスト情報を組み込むのに適さない。本稿では、これらの2つの問題に対処するため、IRSのためのテキストベースのDeep Deterministic Policy Gradient framework(TDDPG-Rec)を提案する。具体的には,テキスト情報を利用してアイテムやユーザを特徴空間にマッピングすることで,空間性の問題を大幅に軽減する。さらに,アクション候補セットを構築するための効果的な手法を設計する。ユーザの好みを表すTDDPG-Recから動的に学習したポリシーベクトルにより、候補セットから効果的にアクションを選択することができる。 3つの公開データセットの実験を通じて、TDDPG-Recが複数のベースラインに対して、時間効率で最先端のパフォーマンスを達成することを示す。

関連論文リスト

DeepRec: Towards a Deep Dive Into the Item Space with Large Language Model Based Recommendation [83.21140655248624]
大型言語モデル (LLM) はレコメンダシステム (RS) に導入された。本稿では, LLM と TRM の自律的マルチターンインタラクションを実現する新しい RS である DeepRec を提案する。公開データセットの実験では、DeepRecは従来のものとLLMベースのベースラインの両方で大幅にパフォーマンスが向上している。
論文参考訳（メタデータ） (2025-05-22T15:49:38Z)
RALLRec+: Retrieval Augmented Large Language Model Recommendation with Reasoning [22.495874056980824]
本稿では,Representation Learning and textbfReasoning empowered search-textbfAugmented textbfLarge textbfLanguage model textbfRecommendation (RALLRec+)を提案する。
論文参考訳（メタデータ） (2025-03-26T11:03:34Z)
Graph Retrieval-Augmented LLM for Conversational Recommendation Systems [52.35491420330534]
G-CRS(Graph Retrieval-Augmented Large Language Model for Conversational Recommender Systems)は、グラフ検索強化世代とテキスト内学習を組み合わせた学習自由フレームワークである。 G-CRSは、タスク固有のトレーニングを必要とせず、既存の手法よりも優れたレコメンデーション性能を達成する。
論文参考訳（メタデータ） (2025-03-09T03:56:22Z)
RALLRec: Improving Retrieval Augmented Large Language Model Recommendation with Representation Learning [24.28601381739682]
大規模言語モデル (LLM) は、ユーザの振る舞いを理解するためのレコメンデーションシステムに統合されている。既存のRAGメソッドは主にテキストのセマンティクスに依存しており、しばしば最も関連性の高い項目を組み込むことができない。検索強化大言語モデル推薦(RALLRec)のための表現学習を提案する。
論文参考訳（メタデータ） (2025-02-10T02:15:12Z)
Full-Stack Optimized Large Language Models for Lifelong Sequential Behavior Comprehension in Recommendation [44.685176786857284]
データ、プロンプト、パラメータレベルの最適化を提供するフレームワークであるReLLaX(Retrieval-enhanced Large Language Model Plus)を提案する。データレベルではSemantic User Behavior Retrieval (SUBR)を導入し、シーケンスの不均一性を低減し、LLMがキー情報を抽出しやすくする。素早いレベル向上のために、我々はSPA(Soft Prompt Augmentation)を用いて協調的な知識を注入し、項目表現をレコメンデーションタスクと整合させる。パラメータレベルでは、コンポーネント間の相互作用を有効にすることで、LoRAの表現性を向上するComponent Fully-Interactive LoRA(CFLoRA)を提案する。
論文参考訳（メタデータ） (2025-01-23T03:05:13Z)
Hierarchical Reinforcement Learning for Temporal Abstraction of Listwise Recommendation [51.06031200728449]
我々はmccHRLと呼ばれる新しいフレームワークを提案し、リストワイドレコメンデーションにおける時間的抽象化のレベルを異なるものにする。階層的な枠組みの中では、ハイレベルエージェントがユーザ知覚の進化を研究し、低レベルエージェントがアイテム選択ポリシーを作成している。その結果,本手法による性能改善は,いくつかのよく知られたベースラインと比較して有意な結果が得られた。
論文参考訳（メタデータ） (2024-09-11T17:01:06Z)
An Efficient Continuous Control Perspective for Reinforcement-Learning-based Sequential Recommendation [14.506332665769746]
本稿では,UnderlinetextbfEfficient UnderlinetextbfContinuous UnderlinetextbfControl framework (ECoC)を提案する。まず、統計的に検証された仮定に基づいて、正規化されたユーザとアイテム空間から抽象化された新しい統一されたアクション表現を提案する。このプロセスでは、統合された行動の観点から戦略的な探索と方向性の制御が慎重に設計され、最終的な勧告決定に不可欠である。
論文参考訳（メタデータ） (2024-08-15T09:26:26Z)
A Thorough Performance Benchmarking on Lightweight Embedding-based Recommender Systems [67.52782366565658]
State-of-the-art recommender system (RS) は、埋め込みベクトルによって符号化される分類的特徴に依存し、結果として非常に大きな埋め込みテーブルとなる。軽量埋め込み型RSの繁栄にもかかわらず、評価プロトコルには幅広い多様性が見られる。本研究では, LERSの性能, 効率, クロスタスク転送性について, 徹底的なベンチマークによる検討を行った。
論文参考訳（メタデータ） (2024-06-25T07:45:00Z)
ERASE: Benchmarking Feature Selection Methods for Deep Recommender Systems [40.838320650137625]
本稿では,Deep Recommender Systems(DRS)のためのフェースセレクションのための包括的bEnchmaRkであるERASEについて述べる。 ERASEは11種類の特徴選択手法を徹底的に評価し、従来のアプローチとディープラーニングアプローチの両方をカバーしている。私たちのコードは簡単に再現できる。
論文参考訳（メタデータ） (2024-03-19T11:49:35Z)
Sample Efficient Preference Alignment in LLMs via Active Exploration [63.84454768573154]
良い政策を最も効率的に特定するために、人間のフィードバックを得るコンテキストをしばしば選択できるという事実を活用します。本稿では,データを効率的に選択する能動的探索アルゴリズムを提案する。提案手法は,複数の言語モデルと4つの実世界のデータセットに対する人間の嗜好の限られたサンプルを用いて,ベースラインよりも優れる。
論文参考訳（メタデータ） (2023-12-01T00:54:02Z)
Representation Learning with Large Language Models for Recommendation [34.46344639742642]
本稿では,大規模言語モデル (LLM) を用いた表現学習によるレコメンデータの強化を目的とした,モデルに依存しないフレームワーク RLMRec を提案する。 RLMRecには補助的なテキスト信号が組み込まれており、LLMが権限を持つユーザ/イテムプロファイリングパラダイムを開発し、LLMの意味空間と協調的関係信号の表現空間を整合させる。
論文参考訳（メタデータ） (2023-10-24T15:51:13Z)
Interactive Graph Convolutional Filtering [79.34979767405979]
インタラクティブ・レコメンダ・システム(IRS)は、パーソナライズされた記事レコメンデーション、ソーシャルメディア、オンライン広告など、さまざまな領域でますます利用されている。これらの問題は、コールドスタート問題とデータスポーサリティ問題によって悪化する。既存のMulti-Armed Bandit手法は、慎重に設計された探査戦略にもかかわらず、しばしば初期の段階で満足な結果を提供するのに苦労する。提案手法は,ユーザとアイテム間の協調フィルタリング性能を向上させるため,協調フィルタリングをグラフモデルに拡張する。
論文参考訳（メタデータ） (2023-09-04T09:02:31Z)
Conversational Recommendation as Retrieval: A Simple, Strong Baseline [4.737923227003888]
会話レコメンデーションシステム(CRS)は,自然言語会話を通じて適切な項目をユーザに推薦することを目的としている。ほとんどのCRSアプローチは、これらの会話によって提供されるシグナルを効果的に利用しない。 CRS項目推薦タスクに対して、代替情報検索(IR)スタイルのアプローチを提案する。
論文参考訳（メタデータ） (2023-05-23T06:21:31Z)
Towards Topic-Guided Conversational Recommender System [80.3725246715938]
textbfTG-ReDial(textbfTopic-textbfGuided textbfDialogによるtextbfRecommendation)という新しいCRSデータセットをコントリビュートする。本稿では,話題誘導型会話レコメンデーションの課題を提示し,この課題に対する効果的なアプローチを提案する。
論文参考訳（メタデータ） (2020-10-08T17:04:30Z)
Leveraging Historical Interaction Data for Improving Conversational Recommender System [105.90963882850265]
アイテムと属性に基づく嗜好シーケンスを統合するための,新しい事前学習手法を提案する。実世界の2つのデータセットの実験結果から,本手法の有効性が示された。
論文参考訳（メタデータ） (2020-08-19T03:43:50Z)
Critic Regularized Regression [70.8487887738354]
批判正規化回帰(CRR)形式を用いてデータからポリシーを学習するための新しいオフラインRLアルゴリズムを提案する。 CRRは驚くほどよく動作し、高次元の状態と行動空間を持つタスクにスケールする。
論文参考訳（メタデータ） (2020-06-26T17:50:26Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。