論文の概要: SalesBot 2.0: A Human-Like Intent-Guided Chit-Chat Dataset
- arxiv url: http://arxiv.org/abs/2308.14266v1
- Date: Mon, 28 Aug 2023 02:48:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-29 15:55:51.626007
- Title: SalesBot 2.0: A Human-Like Intent-Guided Chit-Chat Dataset
- Title(参考訳): SalesBot 2.0:人間らしいインテントガイド付きチップチャットデータセット
- Authors: Wen-Yu Chang, Yun-Nung Chen
- Abstract要約: 本稿では,大規模言語モデル(LLM)の共通知識を適切なプロンプトによって活用することにより,公開データの改訂版であるSalesBot 2.0を構築することを目的とする。
詳細なアノテーションを備えた新たにリリースされた大規模なデータセットは、トピック間のスムーズな移行を示し、自然性や一貫性の観点からは人間らしくなっている。
- 参考スコア(独自算出の注目度): 28.257630375747606
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In recent research on dialogue systems and corpora, there has been a
significant focus on two distinct categories: task-oriented (TOD) and
open-domain (chit-chat) dialogues. TOD systems aim to satisfy specific user
goals, such as finding a movie to watch, whereas open-domain systems primarily
focus on generating engaging conversations. A recent study by Chiu et al.
(2022) introduced SalesBot, which provides simulators and a dataset with
one-turn transition from chit-chat to task-oriented dialogues. However, the
previously generated data solely relied on BlenderBot, which raised concerns
about its long-turn naturalness and consistency during a conversation. To
address this issue, this paper aims to build SalesBot 2.0, a revised version of
the published data, by leveraging the commonsense knowledge of large language
models (LLMs) through proper prompting. The objective is to gradually bridge
the gap between chit-chat and TOD towards better naturalness and consistency.
The newly released large-scale dataset with detailed annotations exhibits
smoother transitions between topics and is more human-like in terms of
naturalness and consistency. It can serve as a valuable resource for both
academic research and commercial applications. Furthermore, our proposed
framework can be applied to generate numerous dialogues with various target
intents.
- Abstract(参考訳): 近年,対話システムとコーパスの研究において,タスク指向(TOD)とオープンドメイン(チップチャット)の2つの異なるカテゴリに注目が集まっている。
TODシステムは、見る映画を見つけるなどの特定のユーザー目標を達成することを目的としており、一方、オープンドメインシステムは、主にエンゲージメントな会話を生成することに焦点を当てている。
chiuらによる最近の研究(2022年)では、chit-chatからタスク指向の対話へワンターンで遷移するシミュレータとデータセットを提供するsalesbotが紹介されている。
しかし、以前に生成されたデータはBlenderBotにのみ依存しており、会話中にその長期的な自然性と一貫性に関する懸念が持ち上がった。
本論文は,大規模言語モデル(LLM)の共通知識を適切なプロンプトによって活用することにより,公開データの改訂版であるSalesBot 2.0を構築することを目的とする。
目的は、チトチャットとTODのギャップを徐々に埋めて、自然性と一貫性を向上することにある。
詳細なアノテーションを備えた新たにリリースされた大規模なデータセットは、トピック間のスムーズな移行を示し、自然性や一貫性の観点からは人間らしくなっている。
学術研究と商業応用の双方にとって貴重な資源として機能する。
さらに,提案手法を応用して,ターゲット意図の多種多様な対話を生成することができる。
関連論文リスト
- Injecting Salesperson's Dialogue Strategies in Large Language Models with Chain-of-Thought Reasoning [23.919423630938226]
SalesBotは、Chit-chatからタスク指向のシナリオへ移行し、セールスエージェントをトレーニングする対話をシミュレートする。
最初のデータはスムーズなトランジションとコヒーレントなロングターンダイアログを欠いていたため、セールス・カストマー相互作用の自然性が低かった。
営業担当者のインタラクションを学習し,チェーン・オブ・ソート(CoT)推論を用いた新しいモデル「SalesAgent」を紹介した。
論文 参考訳(メタデータ) (2024-04-29T10:12:04Z) - SpokenWOZ: A Large-Scale Speech-Text Benchmark for Spoken Task-Oriented
Dialogue Agents [72.42049370297849]
SpokenWOZは音声TODのための大規模音声テキストデータセットである。
SpokenWOZでは、クロスターンスロットと推論スロット検出が新たな課題である。
論文 参考訳(メタデータ) (2023-05-22T13:47:51Z) - Information Extraction and Human-Robot Dialogue towards Real-life Tasks:
A Baseline Study with the MobileCS Dataset [52.22314870976088]
SereTODチャレンジは、実際のユーザとChina Mobileのカスタマーサービススタッフの実際のダイアログ書き起こしで構成されるMobileCSデータセットを編成してリリースする。
MobileCSデータセットに基づいて、SereTODチャレンジには2つのタスクがあり、対話システム自体の構築を評価するだけでなく、ダイアログの書き起こしからの情報も抽出する。
本稿では主に,MobileCSデータセットを用いた2つのタスクのベースラインスタディを示す。
論文 参考訳(メタデータ) (2022-09-27T15:30:43Z) - KETOD: Knowledge-Enriched Task-Oriented Dialogue [77.59814785157877]
対話システム研究における既存の研究は、主にタスク指向の対話とチャットを独立したドメインとして扱う。
本研究では,タスク指向対話と知識ベースチップチャットを一つのモデルに効果的に統合する方法について検討する。
論文 参考訳(メタデータ) (2022-05-11T16:01:03Z) - SalesBot: Transitioning from Chit-Chat to Task-Oriented Dialogues [22.89699254073016]
ソーシャルチャットからタスク指向対話へのスムーズな移行は、ビジネスチャンスの引き金になる上で重要である。
本稿では,人間の介在なく多数の対話を自動生成するフレームワークを提案する。
公表されたデータは、将来の研究方向と商業活動のガイドとなる大きな可能性を秘めている。
論文 参考訳(メタデータ) (2022-04-22T09:31:13Z) - A Model-Agnostic Data Manipulation Method for Persona-based Dialogue
Generation [107.82729587882397]
現在のペルソナベースの対話データセットのスケールアップには費用がかかる。
このタスクの各データサンプルは、従来の対話データよりも複雑である。
本稿では,ペルソナをベースとした対話生成モデルにおいて,モデルに依存しないデータ操作手法を提案する。
論文 参考訳(メタデータ) (2022-04-21T03:49:54Z) - Few-Shot Bot: Prompt-Based Learning for Dialogue Systems [58.27337673451943]
ごく少数の例を使って会話を学ぶことは、会話型AIにおける大きな課題である。
現在の最良の会話モデルは、良いチャットシャッター(例:BlenderBot)またはゴール指向システム(例:MinTL)である。
グラデーションベースの微調整を必要とせず、学習の唯一の源としていくつかの例を用いるプロンプトベースの数ショット学習を提案する。
論文 参考訳(メタデータ) (2021-10-15T14:36:45Z) - Pchatbot: A Large-Scale Dataset for Personalized Chatbot [49.16746174238548]
本稿では,Weibo と Judicial のフォーラムから収集した2つのサブセットを含む大規模対話データセットである Pchatbot を紹介する。
生データセットを対話システムに適応させるため、匿名化などのプロセスを通じて生データセットを精巧に正規化する。
Pchatbotのスケールは、既存の中国のデータセットよりも大幅に大きく、データ駆動モデルの恩恵を受ける可能性がある。
論文 参考訳(メタデータ) (2020-09-28T12:49:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。