Fugu-MT 論文翻訳(概要): Factual and Personalized Recommendations using Language Models and Reinforcement Learning

論文の概要: Factual and Personalized Recommendations using Language Models and Reinforcement Learning

arxiv url: http://arxiv.org/abs/2310.06176v1
Date: Mon, 9 Oct 2023 21:58:55 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-11 21:27:24.876299
Title: Factual and Personalized Recommendations using Language Models and Reinforcement Learning
Title（参考訳）: 言語モデルと強化学習を用いたFactual and Personalized Recommendations
Authors: Jihwan Jeong, Yinlam Chow, Guy Tennenholtz, Chih-Wei Hsu, Azamat Tulepbergenov, Mohammad Ghavamzadeh, Craig Boutilier
Abstract要約: 我々はP4LM(Compelling, Precise, Personalized, Preference-relevant Language Model)を開発した。 P4LMは、アイテムの特徴とその関連性を説明しながら、ユーザにアイテムを推奨する。我々は、精度、魅力、パーソナライゼーションを測定する共同報酬関数を開発する。
参考スコア（独自算出の注目度）: 38.96462170594542
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Recommender systems (RSs) play a central role in connecting users to content, products, and services, matching candidate items to users based on their preferences. While traditional RSs rely on implicit user feedback signals, conversational RSs interact with users in natural language. In this work, we develop a comPelling, Precise, Personalized, Preference-relevant language model (P4LM) that recommends items to users while putting emphasis on explaining item characteristics and their relevance. P4LM uses the embedding space representation of a user's preferences to generate compelling responses that are factually-grounded and relevant w.r.t. the user's preferences. Moreover, we develop a joint reward function that measures precision, appeal, and personalization, which we use as AI-based feedback in a reinforcement learning-based language model framework. Using the MovieLens 25M dataset, we demonstrate that P4LM delivers compelling, personalized movie narratives to users.
Abstract（参考訳）: Recommender System(RS)は、ユーザーがコンテンツ、製品、サービスに接続する上で中心的な役割を果たす。従来のrssは暗黙のユーザフィードバック信号に依存しているが、会話型rssは自然言語でユーザと対話する。本研究では,商品の特徴と関連性を重視しつつ,ユーザに対して商品を推奨するコンパリング,精密,パーソナライズ,嗜好関連言語モデル(P4LM)を開発する。 P4LMは、ユーザの好みの埋め込み空間表現を使用して、実際に接地され、ユーザの好みに関係のある魅力的な応答を生成する。さらに,強化学習に基づく言語モデルフレームワークにおいて,AIに基づくフィードバックとして用いる精度,魅力,パーソナライゼーションを計測する共同報酬関数を開発した。 MovieLens 25Mデータセットを用いて、P4LMは魅力的なパーソナライズされた映画物語をユーザーに届けることを示した。

関連論文リスト

Reasoning-Based Personalized Generation for Users with Sparse Data [120.94029850012045]
スパースコンテキスト下でパーソナライズされたテキスト生成を強化する新しいフレームワークであるGraSPerを紹介する。 GraSPerは、ユーザが将来的に対話する可能性のあるアイテムを予測することで、ユーザコンテキストを初めて強化する。推論アライメントによって、これらのインタラクションのためのテキストを生成して、拡張されたコンテキストを豊かにする。最終的に、実際の履歴と合成履歴の両方に基づいて、パーソナライズされた出力を生成する。
論文参考訳（メタデータ） (2026-01-31T01:54:23Z)
Learning Pluralistic User Preferences through Reinforcement Learning Fine-tuned Summaries [13.187789731783095]
本稿では,各ユーザの好み,特徴,過去の会話をテキストベースで要約する新しいフレームワークを提案する。これらの要約は報酬モデルを定義し、各ユーザが評価する応答のタイプについてパーソナライズされた予測を可能にする。提案手法は,新規ユーザや多様な会話トピックに対して堅牢であることを示す。
論文参考訳（メタデータ） (2025-07-17T23:48:51Z)
Know Me, Respond to Me: Benchmarking LLMs for Dynamic User Profiling and Personalized Responses at Scale [51.9706400130481]
大規模言語モデル(LLM)は、幅広いタスクでユーザのためのパーソナライズされたアシスタントとして登場した。 PERSONAMEMは180以上のユーザ-LLMインタラクション履歴を持つキュレートされたユーザプロファイルを備えている。 LLMチャットボットのユーザプロファイルの現在状況に応じて,最も適切な応答を識別する能力を評価する。
論文参考訳（メタデータ） (2025-04-19T08:16:10Z)
Unveiling User Preferences: A Knowledge Graph and LLM-Driven Approach for Conversational Recommendation [55.5687800992432]
本稿では,Large Language Models (LLMs) とKGs (KGs) を相乗化するプラグイン・アンド・プレイフレームワークを提案する。これにより、LLMはKGエンティティを簡潔な自然言語記述に変換することができ、ドメイン固有の知識を理解できるようになる。
論文参考訳（メタデータ） (2024-11-16T11:47:21Z)
Towards Empathetic Conversational Recommender Systems [77.53167131692]
本稿では,共感型会話レコメンデータ(ECR)フレームワークを提案する。 ECRには、感情対応アイテムレコメンデーションと感情対応応答生成という、2つの主要なモジュールが含まれている。 ReDialデータセットの実験は、推奨精度を高め、ユーザの満足度を向上させる上で、我々のフレームワークの有効性を検証する。
論文参考訳（メタデータ） (2024-08-30T15:43:07Z)
Large Language Model Driven Recommendation [34.45328907249946]
言語主導のレコメンデーションの出現は、リコメンデーションのための自然言語(NL)インタラクションの使用を解放した。この章では、LLMの一般NL能力が、高度にパーソナライズされたRSを構築する新しい機会を導く方法について論じる。
論文参考訳（メタデータ） (2024-08-20T15:36:24Z)
Aligning LLM Agents by Learning Latent Preference from User Edits [23.235995078727658]
本研究では,エージェントの出力に対するユーザ編集に基づいて,言語エージェントの対話的学習について検討する。本稿では,履歴編集データに基づいてユーザの潜伏傾向を推定する学習フレームワーク PreLUDE を提案する。本稿では,要約とメール作成という2つの対話型環境を導入し,GPT-4シミュレーションユーザを用いて評価を行う。
論文参考訳（メタデータ） (2024-04-23T17:57:47Z)
Personalized Language Modeling from Personalized Human Feedback [49.344833339240566]
人間のフィードバックからの強化学習(Reinforcement Learning from Human Feedback, RLHF)は、人間の好みに合わせて大きな言語モデルを微調整するために一般的に用いられる。本研究では,パーソナライズされた言語モデルを構築する手法を開発することにより,この問題に対処することを目的とする。
論文参考訳（メタデータ） (2024-02-06T04:18:58Z)
Parameter-Efficient Conversational Recommender System as a Language Processing Task [52.47087212618396]
会話レコメンデータシステム(CRS)は,自然言語会話を通じてユーザの嗜好を喚起することで,ユーザに対して関連項目を推薦することを目的としている。先行作業では、アイテムのセマンティック情報、対話生成のための言語モデル、関連する項目のランク付けのためのレコメンデーションモジュールとして、外部知識グラフを利用することが多い。本稿では、自然言語の項目を表現し、CRSを自然言語処理タスクとして定式化する。
論文参考訳（メタデータ） (2024-01-25T14:07:34Z)
Interpreting User Requests in the Context of Natural Language Standing Instructions [89.12540932734476]
我々は17のドメインにまたがる2.4K以上の対話からなる言語とプログラムのデータセットであるNLSIを開発した。 NLSIの鍵となる課題は、ある対話に適用可能なスタンディング命令のサブセットを特定することである。
論文参考訳（メタデータ） (2023-11-16T11:19:26Z)
COLA: Improving Conversational Recommender Systems by Collaborative Augmentation [9.99763097964222]
アイテム表現学習とユーザ嗜好モデリングの両方を改善するために,協調的拡張(COLA)手法を提案する。すべての会話から対話型ユーザテムグラフを構築し,ユーザ認識情報によってアイテム表現を拡大する。ユーザの嗜好モデルを改善するため,学習コーパスから類似した会話を検索し,ユーザの興味を反映した関連項目や属性を用いてユーザ表現を増強する。
論文参考訳（メタデータ） (2022-12-15T12:37:28Z)
Learning Implicit User Profiles for Personalized Retrieval-Based Chatbot [29.053654530024083]
IMPChatは、ユーザのパーソナライズされた言語スタイルとパーソナライズされた好みを個別にモデリングすることで、暗黙のユーザプロファイルを学習することを目的としている。ユーザのパーソナライズされた言語スタイルを学習するために,ユーザの過去の応答を利用して,浅い言語から深い言語モデルを構築する。回答候補をそれぞれパーソナライズされた言語スタイルとパーソナライズされた好みとでマッチングし、2つのマッチング信号を融合して最終的なランキングスコアを決定する。
論文参考訳（メタデータ） (2021-08-18T02:07:28Z)
A Neural Topical Expansion Framework for Unstructured Persona-oriented Dialogue Generation [52.743311026230714]
Persona Exploration and Exploitation (PEE)は、事前に定義されたユーザペルソナ記述を意味論的に相関したコンテンツで拡張することができる。 PEEはペルソナ探索とペルソナ搾取という2つの主要なモジュールで構成されている。提案手法は, 自動評価と人的評価の両面で, 最先端のベースラインを上回っている。
論文参考訳（メタデータ） (2020-02-06T08:24:33Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。