論文の概要: Factual and Personalized Recommendations using Language Models and
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2310.06176v1
- Date: Mon, 9 Oct 2023 21:58:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-11 21:27:24.876299
- Title: Factual and Personalized Recommendations using Language Models and
Reinforcement Learning
- Title(参考訳): 言語モデルと強化学習を用いたFactual and Personalized Recommendations
- Authors: Jihwan Jeong, Yinlam Chow, Guy Tennenholtz, Chih-Wei Hsu, Azamat
Tulepbergenov, Mohammad Ghavamzadeh, Craig Boutilier
- Abstract要約: 我々はP4LM(Compelling, Precise, Personalized, Preference-relevant Language Model)を開発した。
P4LMは、アイテムの特徴とその関連性を説明しながら、ユーザにアイテムを推奨する。
我々は、精度、魅力、パーソナライゼーションを測定する共同報酬関数を開発する。
- 参考スコア(独自算出の注目度): 38.96462170594542
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recommender systems (RSs) play a central role in connecting users to content,
products, and services, matching candidate items to users based on their
preferences. While traditional RSs rely on implicit user feedback signals,
conversational RSs interact with users in natural language. In this work, we
develop a comPelling, Precise, Personalized, Preference-relevant language model
(P4LM) that recommends items to users while putting emphasis on explaining item
characteristics and their relevance. P4LM uses the embedding space
representation of a user's preferences to generate compelling responses that
are factually-grounded and relevant w.r.t. the user's preferences. Moreover, we
develop a joint reward function that measures precision, appeal, and
personalization, which we use as AI-based feedback in a reinforcement
learning-based language model framework. Using the MovieLens 25M dataset, we
demonstrate that P4LM delivers compelling, personalized movie narratives to
users.
- Abstract(参考訳): Recommender System(RS)は、ユーザーがコンテンツ、製品、サービスに接続する上で中心的な役割を果たす。
従来のrssは暗黙のユーザフィードバック信号に依存しているが、会話型rssは自然言語でユーザと対話する。
本研究では,商品の特徴と関連性を重視しつつ,ユーザに対して商品を推奨するコンパリング,精密,パーソナライズ,嗜好関連言語モデル(P4LM)を開発する。
P4LMは、ユーザの好みの埋め込み空間表現を使用して、実際に接地され、ユーザの好みに関係のある魅力的な応答を生成する。
さらに,強化学習に基づく言語モデルフレームワークにおいて,AIに基づくフィードバックとして用いる精度,魅力,パーソナライゼーションを計測する共同報酬関数を開発した。
MovieLens 25Mデータセットを用いて、P4LMは魅力的なパーソナライズされた映画物語をユーザーに届けることを示した。
関連論文リスト
- Aligning LLM Agents by Learning Latent Preference from User Edits [23.235995078727658]
本研究では,エージェントの出力に対するユーザ編集に基づいて,言語エージェントの対話的学習について検討する。
本稿では,履歴編集データに基づいてユーザの潜伏傾向を推定する学習フレームワーク PreLUDE を提案する。
本稿では,要約とメール作成という2つの対話型環境を導入し,GPT-4シミュレーションユーザを用いて評価を行う。
論文 参考訳(メタデータ) (2024-04-23T17:57:47Z) - Personalized Language Modeling from Personalized Human Feedback [49.344833339240566]
人間のフィードバックからの強化学習(Reinforcement Learning from Human Feedback, RLHF)は、人間の好みに合わせて大きな言語モデルを微調整するために一般的に用いられる。
本研究では,パーソナライズされた言語モデルを構築する手法を開発することにより,この問題に対処することを目的とする。
論文 参考訳(メタデータ) (2024-02-06T04:18:58Z) - Parameter-Efficient Conversational Recommender System as a Language
Processing Task [52.47087212618396]
会話レコメンデータシステム(CRS)は,自然言語会話を通じてユーザの嗜好を喚起することで,ユーザに対して関連項目を推薦することを目的としている。
先行作業では、アイテムのセマンティック情報、対話生成のための言語モデル、関連する項目のランク付けのためのレコメンデーションモジュールとして、外部知識グラフを利用することが多い。
本稿では、自然言語の項目を表現し、CRSを自然言語処理タスクとして定式化する。
論文 参考訳(メタデータ) (2024-01-25T14:07:34Z) - Interpreting User Requests in the Context of Natural Language Standing
Instructions [89.12540932734476]
我々は17のドメインにまたがる2.4K以上の対話からなる言語とプログラムのデータセットであるNLSIを開発した。
NLSIの鍵となる課題は、ある対話に適用可能なスタンディング命令のサブセットを特定することである。
論文 参考訳(メタデータ) (2023-11-16T11:19:26Z) - COLA: Improving Conversational Recommender Systems by Collaborative
Augmentation [9.99763097964222]
アイテム表現学習とユーザ嗜好モデリングの両方を改善するために,協調的拡張(COLA)手法を提案する。
すべての会話から対話型ユーザテムグラフを構築し,ユーザ認識情報によってアイテム表現を拡大する。
ユーザの嗜好モデルを改善するため,学習コーパスから類似した会話を検索し,ユーザの興味を反映した関連項目や属性を用いてユーザ表現を増強する。
論文 参考訳(メタデータ) (2022-12-15T12:37:28Z) - User-Centric Conversational Recommendation with Multi-Aspect User
Modeling [47.310579802092384]
CRSタスクにおけるユーザの嗜好学習の本質に回帰するユーザ中心会話推薦(UCCR)モデルを提案する。
複数視点の選好マッパーを用いて,現在および歴史的セッションにおける異なる視点の内在的相関を学習する。
学習したマルチアスペクトのマルチビューユーザ嗜好は、レコメンデーションと対話生成に使用される。
論文 参考訳(メタデータ) (2022-04-20T07:08:46Z) - Learning Implicit User Profiles for Personalized Retrieval-Based Chatbot [29.053654530024083]
IMPChatは、ユーザのパーソナライズされた言語スタイルとパーソナライズされた好みを個別にモデリングすることで、暗黙のユーザプロファイルを学習することを目的としている。
ユーザのパーソナライズされた言語スタイルを学習するために,ユーザの過去の応答を利用して,浅い言語から深い言語モデルを構築する。
回答候補をそれぞれパーソナライズされた言語スタイルとパーソナライズされた好みとでマッチングし、2つのマッチング信号を融合して最終的なランキングスコアを決定する。
論文 参考訳(メタデータ) (2021-08-18T02:07:28Z) - A Neural Topical Expansion Framework for Unstructured Persona-oriented
Dialogue Generation [52.743311026230714]
Persona Exploration and Exploitation (PEE)は、事前に定義されたユーザペルソナ記述を意味論的に相関したコンテンツで拡張することができる。
PEEはペルソナ探索とペルソナ搾取という2つの主要なモジュールで構成されている。
提案手法は, 自動評価と人的評価の両面で, 最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2020-02-06T08:24:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。