論文の概要: Generating Synthetic Data for Conversational Music Recommendation Using
Random Walks and Language Models
- arxiv url: http://arxiv.org/abs/2301.11489v1
- Date: Fri, 27 Jan 2023 01:54:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-30 16:38:49.455266
- Title: Generating Synthetic Data for Conversational Music Recommendation Using
Random Walks and Language Models
- Title(参考訳): ランダムウォークと言語モデルを用いた会話音楽推薦のための合成データ生成
- Authors: Megan Leszczynski, Ravi Ganti, Shu Zhang, Krisztian Balog, Filip
Radlinski, Fernando Pereira, Arun Tejasvi Chaganty
- Abstract要約: 本稿では,キュレートされたアイテムコレクションをアイテム検索会話に変換することによって,合成学習データを生成する新しい手法を提案する。
我々は,100万以上の会話を伴う対話型音楽レコメンデーションデータセットを作成することで,我々のアプローチを実証する。
合成データを用いてCRSをトレーニングし、オフラインおよびオンライン評価において、標準検索基準線を著しく上回った。
- 参考スコア(独自算出の注目度): 75.97239817611448
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Conversational recommendation systems (CRSs) enable users to use natural
language feedback to control their recommendations, overcoming many of the
challenges of traditional recommendation systems. However, the practical
adoption of CRSs remains limited due to a lack of rich and diverse
conversational training data that pairs user utterances with recommendations.
To address this problem, we introduce a new method to generate synthetic
training data by transforming curated item collections, such as playlists or
movie watch lists, into item-seeking conversations. First, we use a biased
random walk to generate a sequence of slates, or sets of item recommendations;
then, we use a language model to generate corresponding user utterances. We
demonstrate our approach by generating a conversational music recommendation
dataset with over one million conversations, which were found to be consistent
with relevant recommendations by a crowdsourced evaluation. Using the synthetic
data to train a CRS, we significantly outperform standard retrieval baselines
in offline and online evaluations.
- Abstract(参考訳): 会話レコメンデーションシステム(CRS)は、ユーザーが自然言語フィードバックを使ってレコメンデーションを制御することができ、従来のレコメンデーションシステムの課題の多くを克服する。
しかし、ユーザ発話とレコメンデーションを組み合わせたリッチで多様な会話訓練データがないため、CRSの実践的採用は依然として限られている。
この問題に対処するために,プレイリストや映画視聴リストなどのキュレーションされたアイテムコレクションを項目閲覧会話に変換することで,合成学習データを生成する新しい手法を提案する。
まず、偏りのあるランダムウォークを用いて一連のスレートや項目のレコメンデーションを生成し、次に、言語モデルを用いて対応するユーザの発話を生成する。
我々は,100万以上の会話を伴う対話型音楽レコメンデーションデータセットを作成し,クラウドソースによる評価により,関連するレコメンデーションと一致していることを示す。
CRSをトレーニングするために合成データを用いることで、オフラインおよびオンライン評価において標準検索基準よりも大幅に優れる。
関連論文リスト
- Generating Data with Text-to-Speech and Large-Language Models for Conversational Speech Recognition [48.527630771422935]
複数話者対話型ASRのための合成データ生成パイプラインを提案する。
我々は、電話と遠隔会話音声設定のためのWhisper ASRモデルを微調整して評価を行う。
論文 参考訳(メタデータ) (2024-08-17T14:47:05Z) - Retrieval-Augmented Conversational Recommendation with Prompt-based Semi-Structured Natural Language State Tracking [16.37636420517529]
大規模言語モデル(LLM)では、ユーザ好みの発話とユーザ生成レビューにおける複雑な言語との間の常識的な接続を解き放つことができます。
RA-RecはConvRecの対話状態トラッキングシステムで、ビデオ、オープンソースのGitHubリポジトリ、インタラクティブなGoogle Colabノートブックで紹介されている。
論文 参考訳(メタデータ) (2024-05-25T15:41:26Z) - Effective and Efficient Conversation Retrieval for Dialogue State Tracking with Implicit Text Summaries [48.243879779374836]
LLM (Large Language Models) を用いたDST (Few-shot dialogue state tracking) では,会話検索を効果的かつ効率的に行うことで,学習の迅速化を図っている。
従来は検索キーやクエリとして生の対話コンテキストを使用していた。
会話のテキスト要約に基づいて会話検索を行う。
LLMに基づく会話要約器がクエリとキー生成に採用され、効果的な内部製品探索が可能となる。
論文 参考訳(メタデータ) (2024-02-20T14:31:17Z) - Parameter-Efficient Conversational Recommender System as a Language
Processing Task [52.47087212618396]
会話レコメンデータシステム(CRS)は,自然言語会話を通じてユーザの嗜好を喚起することで,ユーザに対して関連項目を推薦することを目的としている。
先行作業では、アイテムのセマンティック情報、対話生成のための言語モデル、関連する項目のランク付けのためのレコメンデーションモジュールとして、外部知識グラフを利用することが多い。
本稿では、自然言語の項目を表現し、CRSを自然言語処理タスクとして定式化する。
論文 参考訳(メタデータ) (2024-01-25T14:07:34Z) - AUGUST: an Automatic Generation Understudy for Synthesizing
Conversational Recommendation Datasets [56.052803235932686]
本稿では,大規模かつ高品質なレコメンデーションダイアログを生成する新しい自動データセット合成手法を提案する。
i)従来のレコメンデーションデータセットからの豊富なパーソナライズされたユーザプロファイル、(ii)知識グラフからの豊富な外部知識、(iii)人間対人間会話レコメンデーションデータセットに含まれる会話能力。
論文 参考訳(メタデータ) (2023-06-16T05:27:14Z) - Conversational Recommendation as Retrieval: A Simple, Strong Baseline [4.737923227003888]
会話レコメンデーションシステム(CRS)は,自然言語会話を通じて適切な項目をユーザに推薦することを目的としている。
ほとんどのCRSアプローチは、これらの会話によって提供されるシグナルを効果的に利用しない。
CRS項目推薦タスクに対して、代替情報検索(IR)スタイルのアプローチを提案する。
論文 参考訳(メタデータ) (2023-05-23T06:21:31Z) - Beyond Single Items: Exploring User Preferences in Item Sets with the
Conversational Playlist Curation Dataset [20.42354123651454]
私たちはこのタスクを会話アイテムセットキュレーションと呼びます。
本稿では,会話環境におけるアイテムセットのリアルな嗜好を効率的に収集する新しいデータ収集手法を提案する。
我々は、それが他の方法では表現されない好みを表現することにつながることを示している。
論文 参考訳(メタデータ) (2023-03-13T00:39:04Z) - PLACES: Prompting Language Models for Social Conversation Synthesis [103.94325597273316]
我々は、プロンプトを用いてソーシャルな会話データセットを合成するために、専門家による会話の小さなセットをコンテキスト内例として使用します。
人工会話の徹底的な評価を,人間による会話と比較して行った。
論文 参考訳(メタデータ) (2023-02-07T05:48:16Z) - COLA: Improving Conversational Recommender Systems by Collaborative
Augmentation [9.99763097964222]
アイテム表現学習とユーザ嗜好モデリングの両方を改善するために,協調的拡張(COLA)手法を提案する。
すべての会話から対話型ユーザテムグラフを構築し,ユーザ認識情報によってアイテム表現を拡大する。
ユーザの嗜好モデルを改善するため,学習コーパスから類似した会話を検索し,ユーザの興味を反映した関連項目や属性を用いてユーザ表現を増強する。
論文 参考訳(メタデータ) (2022-12-15T12:37:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。