論文の概要: Talk the Walk: Synthetic Data Generation for Conversational Music
Recommendation
- arxiv url: http://arxiv.org/abs/2301.11489v3
- Date: Sat, 18 Nov 2023 04:26:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-22 20:38:27.793289
- Title: Talk the Walk: Synthetic Data Generation for Conversational Music
Recommendation
- Title(参考訳): talk the walk: 対話型音楽推薦のための合成データ生成
- Authors: Megan Leszczynski, Shu Zhang, Ravi Ganti, Krisztian Balog, Filip
Radlinski, Fernando Pereira, Arun Tejasvi Chaganty
- Abstract要約: 本稿では,広く利用可能なアイテムコレクションにおいて,符号化された専門知識を活用することで,現実的な高品質な会話データを生成するTalkWalkを提案する。
人間の収集したデータセットで100万以上の多様な会話を生成します。
- 参考スコア(独自算出の注目度): 62.019437228000776
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recommender systems are ubiquitous yet often difficult for users to control,
and adjust if recommendation quality is poor. This has motivated conversational
recommender systems (CRSs), with control provided through natural language
feedback. However, as with most application domains, building robust CRSs
requires training data that reflects system usage$\unicode{x2014}$here
conversations with user utterances paired with items that cover a wide range of
preferences. This has proved challenging to collect scalably using conventional
methods. We address the question of whether it can be generated synthetically,
building on recent advances in natural language. We evaluate in the setting of
item set recommendation, noting the increasing attention to this task motivated
by use cases like music, news, and recipe recommendation. We present
TalkTheWalk, which synthesizes realistic high-quality conversational data by
leveraging domain expertise encoded in widely available curated item
collections, generating a sequence of hypothetical yet plausible item sets,
then using a language model to produce corresponding user utterances. We
generate over one million diverse playlist curation conversations in the music
domain, and show these contain consistent utterances with relevant item sets
nearly matching the quality of an existing but small human-collected dataset
for this task. We demonstrate the utility of the generated synthetic dataset on
a conversational item retrieval task and show that it improves over both
unsupervised baselines and systems trained on a real dataset.
- Abstract(参考訳): レコメンデーションシステムは、ユーザーが制御し、レコメンデーション品質が低ければ調整することが困難であることが多い。
これは会話レコメンデーションシステム(CRS)を動機付け、自然言語フィードバックによる制御を提供する。
しかし、ほとんどのアプリケーションドメインと同様に、ロバストなCRSを構築するには、システム利用を反映したトレーニングデータが必要であり、$\unicode{x2014}$here conversation with user utterances with paired with items that cover of various ranges。
これは従来の手法でスカラを収集することの難しさを証明している。
我々は,近年の自然言語の進歩に基づいて,合成可能かどうかという課題に対処する。
本研究は,音楽,ニュース,レシピレコメンデーションといったユースケースによって動機付けられた課題に注目が集まることに着目し,項目セットレコメンデーションの設定において評価を行う。
本研究では,広く利用可能なアイテムコレクションに符号化されたドメイン知識を活用し,仮説的だが実証可能なアイテムセットのシーケンスを生成し,それに対応するユーザ発話を生成する言語モデルを用いて,現実的な高品質な会話データを合成するTalkTheWalkを提案する。
我々は音楽分野において100万以上の多様なプレイリストキュレーション会話を生成し、これらが関連する項目セットとほぼ一致するような一貫性のある発話を含むことを示す。
対話項目検索タスクにおいて生成した合成データセットの有用性を実証し、教師なしベースラインと実際のデータセットで訓練されたシステムの両方で改善されていることを示す。
関連論文リスト
- Retrieval-Augmented Conversational Recommendation with Prompt-based Semi-Structured Natural Language State Tracking [16.37636420517529]
大規模言語モデル(LLM)では、ユーザ好みの発話とユーザ生成レビューにおける複雑な言語との間の常識的な接続を解き放つことができます。
RA-RecはConvRecの対話状態トラッキングシステムで、ビデオ、オープンソースのGitHubリポジトリ、インタラクティブなGoogle Colabノートブックで紹介されている。
論文 参考訳(メタデータ) (2024-05-25T15:41:26Z) - Effective and Efficient Conversation Retrieval for Dialogue State Tracking with Implicit Text Summaries [48.243879779374836]
LLM (Large Language Models) を用いたDST (Few-shot dialogue state tracking) では,会話検索を効果的かつ効率的に行うことで,学習の迅速化を図っている。
従来は検索キーやクエリとして生の対話コンテキストを使用していた。
会話のテキスト要約に基づいて会話検索を行う。
LLMに基づく会話要約器がクエリとキー生成に採用され、効果的な内部製品探索が可能となる。
論文 参考訳(メタデータ) (2024-02-20T14:31:17Z) - Parameter-Efficient Conversational Recommender System as a Language
Processing Task [52.47087212618396]
会話レコメンデータシステム(CRS)は,自然言語会話を通じてユーザの嗜好を喚起することで,ユーザに対して関連項目を推薦することを目的としている。
先行作業では、アイテムのセマンティック情報、対話生成のための言語モデル、関連する項目のランク付けのためのレコメンデーションモジュールとして、外部知識グラフを利用することが多い。
本稿では、自然言語の項目を表現し、CRSを自然言語処理タスクとして定式化する。
論文 参考訳(メタデータ) (2024-01-25T14:07:34Z) - AUGUST: an Automatic Generation Understudy for Synthesizing
Conversational Recommendation Datasets [56.052803235932686]
本稿では,大規模かつ高品質なレコメンデーションダイアログを生成する新しい自動データセット合成手法を提案する。
i)従来のレコメンデーションデータセットからの豊富なパーソナライズされたユーザプロファイル、(ii)知識グラフからの豊富な外部知識、(iii)人間対人間会話レコメンデーションデータセットに含まれる会話能力。
論文 参考訳(メタデータ) (2023-06-16T05:27:14Z) - Conversational Recommendation as Retrieval: A Simple, Strong Baseline [4.737923227003888]
会話レコメンデーションシステム(CRS)は,自然言語会話を通じて適切な項目をユーザに推薦することを目的としている。
ほとんどのCRSアプローチは、これらの会話によって提供されるシグナルを効果的に利用しない。
CRS項目推薦タスクに対して、代替情報検索(IR)スタイルのアプローチを提案する。
論文 参考訳(メタデータ) (2023-05-23T06:21:31Z) - Multi-grained Hypergraph Interest Modeling for Conversational
Recommendation [75.65483522949857]
複雑な履歴データの下でユーザの興味を捉えるために, マルチグラデーション・ハイパーグラフ・インフォメーション・モデリング手法を提案する。
提案手法では,まず,ユーザの過去の対話セッションをモデル化し,セッションベースハイパーグラフを作成するためにハイパーグラフ構造を用いる。
さらに,2種類のハイパーグラフに対して多粒度ハイパーグラフの畳み込みを行い,拡張表現を用いて関心を意識したCRSを開発する。
論文 参考訳(メタデータ) (2023-05-04T13:13:44Z) - Beyond Single Items: Exploring User Preferences in Item Sets with the
Conversational Playlist Curation Dataset [20.42354123651454]
私たちはこのタスクを会話アイテムセットキュレーションと呼びます。
本稿では,会話環境におけるアイテムセットのリアルな嗜好を効率的に収集する新しいデータ収集手法を提案する。
我々は、それが他の方法では表現されない好みを表現することにつながることを示している。
論文 参考訳(メタデータ) (2023-03-13T00:39:04Z) - PLACES: Prompting Language Models for Social Conversation Synthesis [103.94325597273316]
我々は、プロンプトを用いてソーシャルな会話データセットを合成するために、専門家による会話の小さなセットをコンテキスト内例として使用します。
人工会話の徹底的な評価を,人間による会話と比較して行った。
論文 参考訳(メタデータ) (2023-02-07T05:48:16Z) - COLA: Improving Conversational Recommender Systems by Collaborative
Augmentation [9.99763097964222]
アイテム表現学習とユーザ嗜好モデリングの両方を改善するために,協調的拡張(COLA)手法を提案する。
すべての会話から対話型ユーザテムグラフを構築し,ユーザ認識情報によってアイテム表現を拡大する。
ユーザの嗜好モデルを改善するため,学習コーパスから類似した会話を検索し,ユーザの興味を反映した関連項目や属性を用いてユーザ表現を増強する。
論文 参考訳(メタデータ) (2022-12-15T12:37:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。