論文の概要: A Slot Is Not Built in One Utterance: Spoken Language Dialogs with
Sub-Slots
- arxiv url: http://arxiv.org/abs/2203.10759v1
- Date: Mon, 21 Mar 2022 07:10:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-22 13:39:38.633640
- Title: A Slot Is Not Built in One Utterance: Spoken Language Dialogs with
Sub-Slots
- Title(参考訳): スロットは1つの発話で構築されない:サブスロット付き音声言語ダイアログ
- Authors: Sai Zhang, Yuwei Hu, Yuchuan Wu, Jiaman Wu, Yongbin Li, Jian Sun,
Caixia Yuan and Xiaojie Wang
- Abstract要約: 本稿では,SSTOD(Sub-Slot based Task-Oriented Dialog)というタスクを新たに定義する。
データセットには、中国名、電話番号、ID番号、ナンバープレート番号の4つのドメインから合計40Kのダイアログと500Kの発話が含まれている。
我々はSSTODに新たな言語現象と対話的方法を見いだし、タスクのためのダイアログエージェントを構築する上で重要な課題を提起する。
- 参考スコア(独自算出の注目度): 67.69407159704328
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A slot value might be provided segment by segment over multiple-turn
interactions in a dialog, especially for some important information such as
phone numbers and names. It is a common phenomenon in daily life, but little
attention has been paid to it in previous work. To fill the gap, this paper
defines a new task named Sub-Slot based Task-Oriented Dialog (SSTOD) and builds
a Chinese dialog dataset SSD for boosting research on SSTOD. The dataset
includes a total of 40K dialogs and 500K utterances from four different
domains: Chinese names, phone numbers, ID numbers and license plate numbers.
The data is well annotated with sub-slot values, slot values, dialog states and
actions. We find some new linguistic phenomena and interactive manners in SSTOD
which raise critical challenges of building dialog agents for the task. We test
three state-of-the-art dialog models on SSTOD and find they cannot handle the
task well on any of the four domains. We also investigate an improved model by
involving slot knowledge in a plug-in manner. More work should be done to meet
the new challenges raised from SSTOD which widely exists in real-life
applications. The dataset and code are publicly available via
https://github.com/shunjiu/SSTOD.
- Abstract(参考訳): スロット値は、特に電話番号や名前などの重要な情報に対して、ダイアログ内の複数ターンインタラクションをセグメント毎にセグメント的に提供することができる。
日常生活に共通する現象であるが、それ以前の作品ではほとんど注目されていない。
このギャップを埋めるために,SSTOD(Sub-Slot based Task-Oriented Dialog)という新しいタスクを定義し,SSTODの研究を促進するための中国語ダイアログデータセットSSDを構築した。
データセットには、中国名、電話番号、ID番号、ナンバープレート番号の4つのドメインから合計40Kのダイアログと500Kの発話が含まれている。
データはサブスロット値、スロット値、ダイアログ状態、アクションで注釈付けされている。
我々はSSTODに新たな言語現象と対話的方法を見いだし、タスクのためのダイアログエージェントを構築する上で重要な課題を提起する。
我々はsstod上で3つの最先端ダイアログモデルをテストし、4つのドメインのいずれかでタスクをうまく処理できないことを発見した。
また,プラグイン方式でスロット知識を組み込んだ改良モデルについても検討する。
現実のアプリケーションに広く存在するSSTODから引き起こされた新たな課題を満たすために、さらなる作業を行う必要がある。
データセットとコードはhttps://github.com/shunjiu/sstodで公開されている。
関連論文リスト
- DialogStudio: Towards Richest and Most Diverse Unified Dataset
Collection for Conversational AI [92.29874802394167]
DialogStudioは対話データセットの最大かつ最も多様なコレクションである。
本コレクションは,オープンドメイン対話,タスク指向対話,自然言語理解,対話レコメンデーション,対話要約,知識基底対話などのデータを含む。
論文 参考訳(メタデータ) (2023-07-19T17:57:53Z) - SpokenWOZ: A Large-Scale Speech-Text Benchmark for Spoken Task-Oriented
Dialogue Agents [72.42049370297849]
SpokenWOZは音声TODのための大規模音声テキストデータセットである。
SpokenWOZでは、クロスターンスロットと推論スロット検出が新たな課題である。
論文 参考訳(メタデータ) (2023-05-22T13:47:51Z) - CGoDial: A Large-Scale Benchmark for Chinese Goal-oriented Dialog
Evaluation [75.60156479374416]
CGoDialは、Goal指向のダイアログ評価のための、新しい挑戦的で包括的な中国のベンチマークである。
96,763のダイアログセッションと574,949のダイアログがすべて含まれており、異なる知識ソースを持つ3つのデータセットをカバーする。
学術ベンチマークと音声対話のシナリオのギャップを埋めるために、実際の会話からデータを収集したり、クラウドソーシングを通じて既存のデータセットに音声機能を追加する。
論文 参考訳(メタデータ) (2022-11-21T16:21:41Z) - What Did You Say? Task-Oriented Dialog Datasets Are Not Conversational!? [4.022057598291766]
我々は,MultiWOZ,SGD,SMCalFlowの対話効果と文脈効果の分類を概説する。
我々は、MultiWOZのターンの4%未満、SGDのターンの10%が会話型であるのに対して、SMCalFlowは現在のリリースでは会話型ではないことを発見した。
論文 参考訳(メタデータ) (2022-03-07T14:26:23Z) - Dialog without Dialog Data: Learning Visual Dialog Agents from VQA Data [75.7372052716556]
『ダイアログなしダイアログ』ではエージェントが言語レベルの監督なしに新しいタスクに適応できるダイアログモデルを開発する必要がある。
意図と言語を分解することにより、新しいタスクを微調整した後の言語的ドリフトを最小限に抑える。
論文 参考訳(メタデータ) (2020-07-24T19:35:57Z) - CrossWOZ: A Large-Scale Chinese Cross-Domain Task-Oriented Dialogue
Dataset [58.910961297314415]
CrossWOZは、中国のCross-Domain Wizard-of-Ozタスク指向データセットとしては初めての大規模である。
6K対話セッションと、ホテル、レストラン、アトラクション、メトロ、タクシーを含む5つのドメインの102K発話が含まれている。
論文 参考訳(メタデータ) (2020-02-27T03:06:35Z) - Goal-Oriented Multi-Task BERT-Based Dialogue State Tracker [0.1864131501304829]
State Tracking(DST)は、AlexaやSiriなどの仮想アシスタントの中核的なコンポーネントである。
本研究では,GOaL指向マルチタスクBERTベースの対話状態トラッカー(GOLOMB)を提案する。
論文 参考訳(メタデータ) (2020-02-05T22:56:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。