論文の概要: Meta Policy Learning for Cold-Start Conversational Recommendation
- arxiv url: http://arxiv.org/abs/2205.11788v1
- Date: Tue, 24 May 2022 05:06:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-25 15:10:04.290537
- Title: Meta Policy Learning for Cold-Start Conversational Recommendation
- Title(参考訳): コールドスタート会話推薦のためのメタポリシー学習
- Authors: Zhendong Chu, Hongning Wang, Yun Xiao, Bo Long, Lingfei Wu
- Abstract要約: メタ強化学習を用いて冷間開始ユーザを対象としたCRSポリシー学習について検討する。
政策適応を容易にするために,3つの相乗成分を設計する。
- 参考スコア(独自算出の注目度): 71.13044166814186
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Conversational recommender systems (CRS) explicitly solicit users'
preferences for improved recommendations on the fly. Most existing CRS
solutions employ reinforcement learning methods to train a single policy for a
population of users. However, for users new to the system, such a global policy
becomes ineffective to produce conversational recommendations, i.e., the
cold-start challenge.
In this paper, we study CRS policy learning for cold-start users via meta
reinforcement learning. We propose to learn a meta policy and adapt it to new
users with only a few trials of conversational recommendations. To facilitate
policy adaptation, we design three synergetic components. First is a
meta-exploration policy dedicated to identify user preferences via exploratory
conversations. Second is a Transformer-based state encoder to model a user's
both positive and negative feedback during the conversation. And third is an
adaptive item recommender based on the embedded states. Extensive experiments
on three datasets demonstrate the advantage of our solution in serving new
users, compared with a rich set of state-of-the-art CRS solutions.
- Abstract(参考訳): 会話レコメンデーションシステム(CRS)は、ユーザの好みを明示的に求め、即時に改善する。
既存のCRSソリューションの多くは、人口の1つのポリシーを訓練するために強化学習手法を採用している。
しかし、システムに慣れたユーザーにとって、このようなグローバルポリシーは、会話による推薦、すなわちコールドスタートの課題を生み出すのに効果がない。
本稿では,メタ強化学習によるコールドスタートユーザに対するCRSポリシー学習について検討する。
我々はメタポリシーを学習し、会話レコメンデーションのほんの少しの試行で新しいユーザーに適応することを提案する。
政策適応を容易にするために,3つの相乗成分を設計する。
第一に、探索的な会話を通じてユーザーの好みを特定するためのメタエクスプロレーションポリシーである。
2つ目はTransformerベースのステートエンコーダで、会話中にユーザの肯定的なフィードバックと否定的なフィードバックの両方をモデル化する。
そして3つ目は,組込み状態に基づいた適応アイテムレコメンダです。
3つのデータセットに関する広範な実験は、最先端のcrsソリューションの豊富なセットと比較して、新しいユーザに提供するソリューションの利点を示しています。
関連論文リスト
- Towards Empathetic Conversational Recommender Systems [77.53167131692]
本稿では,共感型会話レコメンデータ(ECR)フレームワークを提案する。
ECRには、感情対応アイテムレコメンデーションと感情対応応答生成という、2つの主要なモジュールが含まれている。
ReDialデータセットの実験は、推奨精度を高め、ユーザの満足度を向上させる上で、我々のフレームワークの有効性を検証する。
論文 参考訳(メタデータ) (2024-08-30T15:43:07Z) - Reformulating Conversational Recommender Systems as Tri-Phase Offline Policy Learning [5.453444582931813]
Tri-Phase Offline Policy Learning-based Conversational Recommender System (TCRS)
本稿では,Tri-Phase Offline Policy Learning-based Conversational Recommender System (TCRS)を紹介する。
論文 参考訳(メタデータ) (2024-08-13T10:58:29Z) - Customized Conversational Recommender Systems [45.84713970070487]
会話レコメンデータシステム(CRS)は、ユーザの現在の意図を捉え、リアルタイムなマルチターン対話によるレコメンデーションを提供することを目的としている。
本稿では,3つの視点からCRSモデルをカスタマイズした新しいCRSモデルであるCustomized Conversational Recommender System(CCRS)を提案する。
パーソナライズされたレコメンデーションを提供するために,対話コンテキストからユーザの現在あるきめ細かい意図を,ユーザ固有の嗜好のガイダンスで抽出する。
論文 参考訳(メタデータ) (2022-06-30T09:45:36Z) - Comprehensive Fair Meta-learned Recommender System [39.04926584648665]
我々は、メタ学習モデルの公平性を確保するために、CLOVERという、総合的な公正なメタ学習フレームワークを提案する。
我々のフレームワークは、異なるメタ学習レコメンデータシステムに適用可能な、汎用的なトレーニングパラダイムを提供する。
論文 参考訳(メタデータ) (2022-06-09T22:48:35Z) - Learning to Learn a Cold-start Sequential Recommender [70.5692886883067]
コールドスタート勧告は、現代のオンラインアプリケーションにおいて緊急の問題である。
メタ学習に基づくコールドスタートシーケンシャルレコメンデーションフレームワークMetaCSRを提案する。
MetaCSRは、通常のユーザの行動から共通のパターンを学ぶ能力を持っている。
論文 参考訳(メタデータ) (2021-10-18T08:11:24Z) - Learning to Ask Appropriate Questions in Conversational Recommendation [49.31942688227828]
対話型レコメンデーションのための新しいフレームワークであるKnowledge-Based Question Generation System (KBQG)を提案する。
KBQGは、構造化知識グラフから最も関連性の高い関係を識別することにより、ユーザの好みをよりきめ細かな粒度でモデル化する。
最終的には、正確な推奨は会話の順番を少なくして生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:58:10Z) - Advances and Challenges in Conversational Recommender Systems: A Survey [133.93908165922804]
現在の会話レコメンダーシステム(CRS)で使用されるテクニックの体系的なレビューを提供します。
CRS開発の主な課題を5つの方向にまとめます。
これらの研究の方向性は、情報検索(IR)、自然言語処理(NLP)、人間とコンピュータの相互作用(HCI)などの複数の研究分野を含みます。
論文 参考訳(メタデータ) (2021-01-23T08:53:15Z) - Offline Meta-level Model-based Reinforcement Learning Approach for
Cold-Start Recommendation [27.17948754183511]
強化学習は、リコメンデータシステムに対する長期的なユーザの関心を最適化する上で大きな可能性を秘めている。
既存のRLベースのレコメンデーション手法では、ユーザが堅牢なレコメンデーションポリシーを学ぶために、多数のインタラクションが必要である。
本稿では,ユーザ適応の高速化を目的としたメタレベルモデルに基づく強化学習手法を提案する。
論文 参考訳(メタデータ) (2020-12-04T08:58:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。