論文の概要: AUGUST: an Automatic Generation Understudy for Synthesizing
Conversational Recommendation Datasets
- arxiv url: http://arxiv.org/abs/2306.09631v1
- Date: Fri, 16 Jun 2023 05:27:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-19 14:58:52.844747
- Title: AUGUST: an Automatic Generation Understudy for Synthesizing
Conversational Recommendation Datasets
- Title(参考訳): AUGUST:会話推薦データセットの合成のための自動生成基盤
- Authors: Yu Lu, Junwei Bao, Zichen Ma, Xiaoguang Han, Youzheng Wu, Shuguang
Cui, Xiaodong He
- Abstract要約: 本稿では,大規模かつ高品質なレコメンデーションダイアログを生成する新しい自動データセット合成手法を提案する。
i)従来のレコメンデーションデータセットからの豊富なパーソナライズされたユーザプロファイル、(ii)知識グラフからの豊富な外部知識、(iii)人間対人間会話レコメンデーションデータセットに含まれる会話能力。
- 参考スコア(独自算出の注目度): 56.052803235932686
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: High-quality data is essential for conversational recommendation systems and
serves as the cornerstone of the network architecture development and training
strategy design. Existing works contribute heavy human efforts to manually
labeling or designing and extending recommender dialogue templates. However,
they suffer from (i) the limited number of human annotators results in that
datasets can hardly capture rich and large-scale cases in the real world, (ii)
the limited experience and knowledge of annotators account for the
uninformative corpus and inappropriate recommendations. In this paper, we
propose a novel automatic dataset synthesis approach that can generate both
large-scale and high-quality recommendation dialogues through a data2text
generation process, where unstructured recommendation conversations are
generated from structured graphs based on user-item information from the real
world. In doing so, we comprehensively exploit: (i) rich personalized user
profiles from traditional recommendation datasets, (ii) rich external knowledge
from knowledge graphs, and (iii) the conversation ability contained in
human-to-human conversational recommendation datasets. Extensive experiments
validate the benefit brought by the automatically synthesized data under
low-resource scenarios and demonstrate the promising potential to facilitate
the development of a more effective conversational recommendation system.
- Abstract(参考訳): 高品質なデータは会話型レコメンデーションシステムにおいて必須であり、ネットワークアーキテクチャの開発とトレーニング戦略設計の基盤となる。
既存の作業は、レコメンデーションダイアログテンプレートを手作業でラベル付けしたり、設計したり、拡張したりするために、人間の努力に大きく貢献する。
しかし 彼らは苦しむのです
(i)人間のアノテータの数が限られているため、データセットは現実世界のリッチで大規模なケースをほとんど捕捉できない。
(ii) 注釈者の限られた経験と知識は、不適切なコーパスと不適切な推奨を説明する。
本稿では,実世界からのユーザ情報に基づいて構造化グラフから非構造化推薦対話を生成するdata2text生成プロセスを通じて,大規模かつ高品質な推薦対話を生成できる新しいデータセット合成手法を提案する。
そのために私たちは包括的に利用します
(i)従来のレコメンデーションデータセットからのパーソナライズされたユーザープロファイル。
(二)知識グラフからの豊かな外部知識、及び
(iii)人間同士の会話レコメンデーションデータセットに含まれる会話能力。
大規模な実験は、低リソースシナリオ下で自動的に合成されたデータによってもたらされる利点を検証し、より効果的な対話レコメンデーションシステムの開発を促進する可能性を示す。
関連論文リスト
- CI-Bench: Benchmarking Contextual Integrity of AI Assistants on Synthetic Data [7.357348564300953]
CI-Benchは、モデル推論中に個人情報を保護するAIアシスタントの能力を評価するための包括的なベンチマークである。
対話やメールを含む自然なコミュニケーションを生成するための,新しい,スケーラブルなマルチステップデータパイプラインを提案する。
我々は、AIアシスタントを定式化し、評価し、パーソナルアシスタントタスクに向けたさらなる研究と注意深いトレーニングの必要性を実証する。
論文 参考訳(メタデータ) (2024-09-20T21:14:36Z) - Knowledge Graphs and Pre-trained Language Models enhanced Representation Learning for Conversational Recommender Systems [58.561904356651276]
本稿では,対話型推薦システムのためのエンティティの意味理解を改善するために,知識強化型エンティティ表現学習(KERL)フレームワークを紹介する。
KERLは知識グラフと事前訓練された言語モデルを使用して、エンティティの意味的理解を改善する。
KERLはレコメンデーションとレスポンス生成の両方のタスクで最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-12-18T06:41:23Z) - Multi-grained Hypergraph Interest Modeling for Conversational
Recommendation [75.65483522949857]
複雑な履歴データの下でユーザの興味を捉えるために, マルチグラデーション・ハイパーグラフ・インフォメーション・モデリング手法を提案する。
提案手法では,まず,ユーザの過去の対話セッションをモデル化し,セッションベースハイパーグラフを作成するためにハイパーグラフ構造を用いる。
さらに,2種類のハイパーグラフに対して多粒度ハイパーグラフの畳み込みを行い,拡張表現を用いて関心を意識したCRSを開発する。
論文 参考訳(メタデータ) (2023-05-04T13:13:44Z) - Learning towards Selective Data Augmentation for Dialogue Generation [52.540330534137794]
すべての事例が増補作業に有益である訳ではなく、増補に適した事例は以下の2つの属性に従うべきであると我々は主張する。
応答生成タスクに対してSDA(Selective Data Augmentation framework)を提案する。
論文 参考訳(メタデータ) (2023-03-17T01:26:39Z) - Quick Starting Dialog Systems with Paraphrase Generation [0.0]
本稿では,既存の事例からより多くのデータを人工的に生成することで,対話エージェント作成のコストと労力を削減する手法を提案する。
提案手法は,人間の努力がほとんどないダイアログシステムを起動し,実際のエンドユーザーとの対話を可能にするのに十分なレベルの性能を実現する。
論文 参考訳(メタデータ) (2022-04-06T02:35:59Z) - C2-CRS: Coarse-to-Fine Contrastive Learning for Conversational
Recommender System [47.18484863699936]
本稿では,会話レコメンデータシステムのためのデータセマンティックフュージョンを改善するための,新しいコントラスト学習フレームワークを提案する。
提案手法では,まず異なるデータ信号から多粒度意味単位を抽出し,次に,関連した多形意味単位を粗い方法で整列させる。
2つの公開CRSデータセットを用いた実験により,提案手法の有効性が示唆された。
論文 参考訳(メタデータ) (2022-01-04T11:39:41Z) - COOKIE: A Dataset for Conversational Recommendation over Knowledge
Graphs in E-commerce [64.95907840457471]
我々は,COOKIEと呼ばれる電子商取引プラットフォームにおける知識グラフに対する対話的推薦のための新しいデータセットを提案する。
データセットはAmazonのレビューコーパスから構築され、ユーザエージェント対話とカスタムナレッジグラフを統合してレコメンデーションする。
論文 参考訳(メタデータ) (2020-08-21T00:11:31Z) - Improving Conversational Recommender Systems via Knowledge Graph based
Semantic Fusion [77.21442487537139]
対話型レコメンデータシステム(CRS)は,対話型対話を通じて高品質なアイテムをユーザに推薦することを目的としている。
まず、会話データ自体にユーザの好みを正確に理解するための十分なコンテキスト情報がない。
第二に、自然言語表現とアイテムレベルのユーザ嗜好の間には意味的なギャップがある。
論文 参考訳(メタデータ) (2020-07-08T11:14:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。