論文の概要: Talk the Walk: Synthetic Data Generation for Conversational Music
Recommendation
- arxiv url: http://arxiv.org/abs/2301.11489v2
- Date: Sat, 8 Jul 2023 21:41:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-11 22:28:07.926441
- Title: Talk the Walk: Synthetic Data Generation for Conversational Music
Recommendation
- Title(参考訳): talk the walk: 対話型音楽推薦のための合成データ生成
- Authors: Megan Leszczynski, Ravi Ganti, Shu Zhang, Krisztian Balog, Filip
Radlinski, Fernando Pereira, Arun Tejasvi Chaganty
- Abstract要約: 本稿では, 商品コレクションに符号化されたドメイン知識を活用することで, リアルな高品質な会話データを合成する技術であるTalkTheWalkを提案する。
TalkTheWalkを音楽レコメンデーションに適用し、100万以上の多様なプレイリストのキュレーション会話を生成します。
人間による評価では、会話は関連する項目集合と一貫した発話を含んでおり、このタスクのための小さな人間による会話データの品質とほぼ一致している。
- 参考スコア(独自算出の注目度): 75.97239817611448
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recommendation systems are ubiquitous yet often difficult for users to
control and adjust when recommendation quality is poor. This has motivated the
development of conversational recommendation systems (CRSs), with control over
recommendations provided through natural language feedback. However, building
conversational recommendation systems requires conversational training data
involving user utterances paired with items that cover a diverse range of
preferences. Such data has proved challenging to collect scalably using
conventional methods like crowdsourcing. We address it in the context of
item-set recommendation, noting the increasing attention to this task motivated
by use cases like music, news and recipe recommendation. We present a new
technique, TalkTheWalk, that synthesizes realistic high-quality conversational
data by leveraging domain expertise encoded in widely available curated item
collections, showing how these can be transformed into corresponding item set
curation conversations. Specifically, TalkTheWalk generates a sequence of
hypothetical yet plausible item sets returned by a system, then uses a language
model to produce corresponding user utterances. Applying TalkTheWalk to music
recommendation, we generate over one million diverse playlist curation
conversations. A human evaluation shows that the conversations contain
consistent utterances with relevant item sets, nearly matching the quality of
small human-collected conversational data for this task. At the same time, when
the synthetic corpus is used to train a CRS, it improves Hits@100 by 10.5
points on a benchmark dataset over standard baselines and is preferred over the
top-performing baseline in an online evaluation.
- Abstract(参考訳): レコメンデーションシステムはユビキタスだが,レコメンデーション品質の低さをユーザがコントロールし,調整することが難しい場合が多い。
これにより会話レコメンデーションシステム(CRS)の開発が動機となり、自然言語フィードバックによるレコメンデーションの制御が可能となった。
しかし、会話レコメンデーションシステムを構築するには、さまざまな好みをカバーする項目と組み合わせたユーザの発話を含む会話トレーニングデータが必要である。
このようなデータは、クラウドソーシングのような従来の手法を使って、まとまりなく収集することは困難である。
本研究は,音楽,ニュース,レシピレコメンデーションといったユースケースによって動機付けられた,このタスクに対する関心の高まりに注目し,アイテムセットレコメンデーションの文脈で対処する。
本稿では,広く利用可能なアイテムコレクションに符号化されたドメイン知識を活用して,現実的な高品質な会話データを合成するTalkTheWalkを提案する。
具体的には、TalkTheWalkは、システムによって返される仮説的だが実証可能な一連のアイテムを生成し、その後、言語モデルを使用して対応するユーザの発話を生成する。
TalkTheWalkを音楽レコメンデーションに適用すると、100万以上の多様なプレイリストのキュレーション会話が生成される。
人間による評価では、会話には関連する項目集合と一貫した発話が含まれており、このタスクのための小さな人間の会話データの品質とほぼ一致している。
同時に、合成コーパスを使用してcrsをトレーニングする場合、標準ベースラインよりもベンチマークデータセットのhis@100を10.5ポイント改善し、オンライン評価において最高パフォーマンスのベースラインよりも好まれる。
関連論文リスト
- Generating Data with Text-to-Speech and Large-Language Models for Conversational Speech Recognition [48.527630771422935]
複数話者対話型ASRのための合成データ生成パイプラインを提案する。
我々は、電話と遠隔会話音声設定のためのWhisper ASRモデルを微調整して評価を行う。
論文 参考訳(メタデータ) (2024-08-17T14:47:05Z) - Retrieval-Augmented Conversational Recommendation with Prompt-based Semi-Structured Natural Language State Tracking [16.37636420517529]
大規模言語モデル(LLM)では、ユーザ好みの発話とユーザ生成レビューにおける複雑な言語との間の常識的な接続を解き放つことができます。
RA-RecはConvRecの対話状態トラッキングシステムで、ビデオ、オープンソースのGitHubリポジトリ、インタラクティブなGoogle Colabノートブックで紹介されている。
論文 参考訳(メタデータ) (2024-05-25T15:41:26Z) - Effective and Efficient Conversation Retrieval for Dialogue State Tracking with Implicit Text Summaries [48.243879779374836]
LLM (Large Language Models) を用いたDST (Few-shot dialogue state tracking) では,会話検索を効果的かつ効率的に行うことで,学習の迅速化を図っている。
従来は検索キーやクエリとして生の対話コンテキストを使用していた。
会話のテキスト要約に基づいて会話検索を行う。
LLMに基づく会話要約器がクエリとキー生成に採用され、効果的な内部製品探索が可能となる。
論文 参考訳(メタデータ) (2024-02-20T14:31:17Z) - Parameter-Efficient Conversational Recommender System as a Language
Processing Task [52.47087212618396]
会話レコメンデータシステム(CRS)は,自然言語会話を通じてユーザの嗜好を喚起することで,ユーザに対して関連項目を推薦することを目的としている。
先行作業では、アイテムのセマンティック情報、対話生成のための言語モデル、関連する項目のランク付けのためのレコメンデーションモジュールとして、外部知識グラフを利用することが多い。
本稿では、自然言語の項目を表現し、CRSを自然言語処理タスクとして定式化する。
論文 参考訳(メタデータ) (2024-01-25T14:07:34Z) - AUGUST: an Automatic Generation Understudy for Synthesizing
Conversational Recommendation Datasets [56.052803235932686]
本稿では,大規模かつ高品質なレコメンデーションダイアログを生成する新しい自動データセット合成手法を提案する。
i)従来のレコメンデーションデータセットからの豊富なパーソナライズされたユーザプロファイル、(ii)知識グラフからの豊富な外部知識、(iii)人間対人間会話レコメンデーションデータセットに含まれる会話能力。
論文 参考訳(メタデータ) (2023-06-16T05:27:14Z) - Conversational Recommendation as Retrieval: A Simple, Strong Baseline [4.737923227003888]
会話レコメンデーションシステム(CRS)は,自然言語会話を通じて適切な項目をユーザに推薦することを目的としている。
ほとんどのCRSアプローチは、これらの会話によって提供されるシグナルを効果的に利用しない。
CRS項目推薦タスクに対して、代替情報検索(IR)スタイルのアプローチを提案する。
論文 参考訳(メタデータ) (2023-05-23T06:21:31Z) - Beyond Single Items: Exploring User Preferences in Item Sets with the
Conversational Playlist Curation Dataset [20.42354123651454]
私たちはこのタスクを会話アイテムセットキュレーションと呼びます。
本稿では,会話環境におけるアイテムセットのリアルな嗜好を効率的に収集する新しいデータ収集手法を提案する。
我々は、それが他の方法では表現されない好みを表現することにつながることを示している。
論文 参考訳(メタデータ) (2023-03-13T00:39:04Z) - PLACES: Prompting Language Models for Social Conversation Synthesis [103.94325597273316]
我々は、プロンプトを用いてソーシャルな会話データセットを合成するために、専門家による会話の小さなセットをコンテキスト内例として使用します。
人工会話の徹底的な評価を,人間による会話と比較して行った。
論文 参考訳(メタデータ) (2023-02-07T05:48:16Z) - COLA: Improving Conversational Recommender Systems by Collaborative
Augmentation [9.99763097964222]
アイテム表現学習とユーザ嗜好モデリングの両方を改善するために,協調的拡張(COLA)手法を提案する。
すべての会話から対話型ユーザテムグラフを構築し,ユーザ認識情報によってアイテム表現を拡大する。
ユーザの嗜好モデルを改善するため,学習コーパスから類似した会話を検索し,ユーザの興味を反映した関連項目や属性を用いてユーザ表現を増強する。
論文 参考訳(メタデータ) (2022-12-15T12:37:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。