論文の概要: Factual and Personalized Recommendations using Language Models and
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2310.06176v1
- Date: Mon, 9 Oct 2023 21:58:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-11 21:27:24.876299
- Title: Factual and Personalized Recommendations using Language Models and
Reinforcement Learning
- Title(参考訳): 言語モデルと強化学習を用いたFactual and Personalized Recommendations
- Authors: Jihwan Jeong, Yinlam Chow, Guy Tennenholtz, Chih-Wei Hsu, Azamat
Tulepbergenov, Mohammad Ghavamzadeh, Craig Boutilier
- Abstract要約: 我々はP4LM(Compelling, Precise, Personalized, Preference-relevant Language Model)を開発した。
P4LMは、アイテムの特徴とその関連性を説明しながら、ユーザにアイテムを推奨する。
我々は、精度、魅力、パーソナライゼーションを測定する共同報酬関数を開発する。
- 参考スコア(独自算出の注目度): 38.96462170594542
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recommender systems (RSs) play a central role in connecting users to content,
products, and services, matching candidate items to users based on their
preferences. While traditional RSs rely on implicit user feedback signals,
conversational RSs interact with users in natural language. In this work, we
develop a comPelling, Precise, Personalized, Preference-relevant language model
(P4LM) that recommends items to users while putting emphasis on explaining item
characteristics and their relevance. P4LM uses the embedding space
representation of a user's preferences to generate compelling responses that
are factually-grounded and relevant w.r.t. the user's preferences. Moreover, we
develop a joint reward function that measures precision, appeal, and
personalization, which we use as AI-based feedback in a reinforcement
learning-based language model framework. Using the MovieLens 25M dataset, we
demonstrate that P4LM delivers compelling, personalized movie narratives to
users.
- Abstract(参考訳): Recommender System(RS)は、ユーザーがコンテンツ、製品、サービスに接続する上で中心的な役割を果たす。
従来のrssは暗黙のユーザフィードバック信号に依存しているが、会話型rssは自然言語でユーザと対話する。
本研究では,商品の特徴と関連性を重視しつつ,ユーザに対して商品を推奨するコンパリング,精密,パーソナライズ,嗜好関連言語モデル(P4LM)を開発する。
P4LMは、ユーザの好みの埋め込み空間表現を使用して、実際に接地され、ユーザの好みに関係のある魅力的な応答を生成する。
さらに,強化学習に基づく言語モデルフレームワークにおいて,AIに基づくフィードバックとして用いる精度,魅力,パーソナライゼーションを計測する共同報酬関数を開発した。
MovieLens 25Mデータセットを用いて、P4LMは魅力的なパーソナライズされた映画物語をユーザーに届けることを示した。
関連論文リスト
- Personalized Language Modeling from Personalized Human Feedback [55.458647587228185]
個人化された人間のフィードバックから学習するタスクを紹介し、この文脈でバニラRLHFが問題となる理由を説明する。
本稿では,ユーザモデルと言語(あるいは報酬)モデルを共同で学習する必要がある一般パーソナライズ-RLHFフレームワークを提案する。
提案手法の有効性を実証するために,注釈付き好みと注釈付き情報を用いた実世界のテキスト要約データを用いて検証を行った。
論文 参考訳(メタデータ) (2024-02-06T04:18:58Z) - Parameter-Efficient Conversational Recommender System as a Language
Processing Task [52.47087212618396]
会話レコメンデータシステム(CRS)は,自然言語会話を通じてユーザの嗜好を喚起することで,ユーザに対して関連項目を推薦することを目的としている。
先行作業では、アイテムのセマンティック情報、対話生成のための言語モデル、関連する項目のランク付けのためのレコメンデーションモジュールとして、外部知識グラフを利用することが多い。
本稿では、自然言語の項目を表現し、CRSを自然言語処理タスクとして定式化する。
論文 参考訳(メタデータ) (2024-01-25T14:07:34Z) - Interpreting User Requests in the Context of Natural Language Standing
Instructions [89.12540932734476]
我々は17のドメインにまたがる2.4K以上の対話からなる言語とプログラムのデータセットであるNLSIを開発した。
NLSIの鍵となる課題は、ある対話に適用可能なスタンディング命令のサブセットを特定することである。
論文 参考訳(メタデータ) (2023-11-16T11:19:26Z) - COLA: Improving Conversational Recommender Systems by Collaborative
Augmentation [9.99763097964222]
アイテム表現学習とユーザ嗜好モデリングの両方を改善するために,協調的拡張(COLA)手法を提案する。
すべての会話から対話型ユーザテムグラフを構築し,ユーザ認識情報によってアイテム表現を拡大する。
ユーザの嗜好モデルを改善するため,学習コーパスから類似した会話を検索し,ユーザの興味を反映した関連項目や属性を用いてユーザ表現を増強する。
論文 参考訳(メタデータ) (2022-12-15T12:37:28Z) - Customized Conversational Recommender Systems [45.84713970070487]
会話レコメンデータシステム(CRS)は、ユーザの現在の意図を捉え、リアルタイムなマルチターン対話によるレコメンデーションを提供することを目的としている。
本稿では,3つの視点からCRSモデルをカスタマイズした新しいCRSモデルであるCustomized Conversational Recommender System(CCRS)を提案する。
パーソナライズされたレコメンデーションを提供するために,対話コンテキストからユーザの現在あるきめ細かい意図を,ユーザ固有の嗜好のガイダンスで抽出する。
論文 参考訳(メタデータ) (2022-06-30T09:45:36Z) - User-Centric Conversational Recommendation with Multi-Aspect User
Modeling [47.310579802092384]
CRSタスクにおけるユーザの嗜好学習の本質に回帰するユーザ中心会話推薦(UCCR)モデルを提案する。
複数視点の選好マッパーを用いて,現在および歴史的セッションにおける異なる視点の内在的相関を学習する。
学習したマルチアスペクトのマルチビューユーザ嗜好は、レコメンデーションと対話生成に使用される。
論文 参考訳(メタデータ) (2022-04-20T07:08:46Z) - Discovering Personalized Semantics for Soft Attributes in Recommender
Systems using Concept Activation Vectors [34.56323846959459]
インタラクティブなレコメンデータシステムは、ユーザがよりリッチな方法で意図、好み、制約、コンテキストを表現することを可能にする。
課題の1つは、ユーザのセマンティックな意図を、しばしば望ましい項目を記述するために使用されるオープンエンドの用語や属性から推測することである。
このような属性のセマンティクスを捉える表現を学習し、それをレコメンデーションシステムにおけるユーザの好みや行動に結びつけるためのフレームワークを開発する。
論文 参考訳(メタデータ) (2022-02-06T18:45:15Z) - Learning Implicit User Profiles for Personalized Retrieval-Based Chatbot [29.053654530024083]
IMPChatは、ユーザのパーソナライズされた言語スタイルとパーソナライズされた好みを個別にモデリングすることで、暗黙のユーザプロファイルを学習することを目的としている。
ユーザのパーソナライズされた言語スタイルを学習するために,ユーザの過去の応答を利用して,浅い言語から深い言語モデルを構築する。
回答候補をそれぞれパーソナライズされた言語スタイルとパーソナライズされた好みとでマッチングし、2つのマッチング信号を融合して最終的なランキングスコアを決定する。
論文 参考訳(メタデータ) (2021-08-18T02:07:28Z) - A Neural Topical Expansion Framework for Unstructured Persona-oriented
Dialogue Generation [52.743311026230714]
Persona Exploration and Exploitation (PEE)は、事前に定義されたユーザペルソナ記述を意味論的に相関したコンテンツで拡張することができる。
PEEはペルソナ探索とペルソナ搾取という2つの主要なモジュールで構成されている。
提案手法は, 自動評価と人的評価の両面で, 最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2020-02-06T08:24:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。