論文の概要: A Survey of Intent Classification and Slot-Filling Datasets for
Task-Oriented Dialog
- arxiv url: http://arxiv.org/abs/2207.13211v1
- Date: Tue, 26 Jul 2022 23:20:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-28 13:23:39.338003
- Title: A Survey of Intent Classification and Slot-Filling Datasets for
Task-Oriented Dialog
- Title(参考訳): タスク指向ダイアログにおけるインテント分類とスロットフィリングデータセットの検討
- Authors: Stefan Larson, Kevin Leach
- Abstract要約: この分野の文献の多くは、比較的少数のベンチマークデータセットの分析に限られている。
我々は、意図分類とスロット充足のタスクのための公開データセットの調査を行った。
- 参考スコア(独自算出の注目度): 4.224157527132053
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Interest in dialog systems has grown substantially in the past decade. By
extension, so too has interest in developing and improving intent
classification and slot-filling models, which are two components that are
commonly used in task-oriented dialog systems. Moreover, good evaluation
benchmarks are important in helping to compare and analyze systems that
incorporate such models. Unfortunately, much of the literature in the field is
limited to analysis of relatively few benchmark datasets. In an effort to
promote more robust analyses of task-oriented dialog systems, we have conducted
a survey of publicly available datasets for the tasks of intent classification
and slot-filling. We catalog the important characteristics of each dataset, and
offer discussion on the applicability, strengths, and weaknesses of each. Our
goal is that this survey aids in increasing the accessibility of these
datasets, which we hope will enable their use in future evaluations of intent
classification and slot-filling models for task-oriented dialog systems.
- Abstract(参考訳): ダイアログシステムへの関心は過去10年間で大きく高まっている。
拡張によって、タスク指向ダイアログシステムで一般的に使用される2つのコンポーネントであるインテント分類とスロット充足モデルの開発と改善にも関心がある。
さらに、優れた評価ベンチマークは、そのようなモデルを組み込んだシステムを比較し分析する上で重要である。
残念ながら、この分野の文献の多くは、比較的少数のベンチマークデータセットの分析に限られている。
タスク指向ダイアログシステムのより堅牢な分析を促進するために,我々は,インテント分類とスロットフィルングのタスクに対して利用可能なデータセットを調査した。
各データセットの重要な特徴をカタログ化し、それぞれの適用性、強度、弱点について議論する。
我々の目標は、これらのデータセットのアクセシビリティを高めることであり、タスク指向ダイアログシステムにおける意図分類とスロット充足モデルの将来的な評価に活用できることを願っている。
関連論文リスト
- Rank2Tell: A Multimodal Driving Dataset for Joint Importance Ranking and
Reasoning [19.43430577960824]
本稿では,重要度をランク付けするマルチモーダル・エゴ中心のデータセットである Rank2Tell を紹介し,その重要性の理由を述べる。
クローズドでオープンな様々な視覚的質問応答を用いて、複雑な交通シナリオにおいて、データセットは様々な重要なオブジェクトの様々な意味、空間的、時間的、関係的な属性の密接なアノテーションを提供する。
論文 参考訳(メタデータ) (2023-09-12T20:51:07Z) - SuperDialseg: A Large-scale Dataset for Supervised Dialogue Segmentation [55.82577086422923]
文書地上対話の助けを借りて,対話のセグメンテーションポイントを実現可能な定義を提供する。
我々は,9,478の対話を含むSuperDialsegと呼ばれる大規模教師付きデータセットをリリースする。
また、対話セグメンテーションタスクの5つのカテゴリにまたがる18のモデルを含むベンチマークも提供する。
論文 参考訳(メタデータ) (2023-05-15T06:08:01Z) - CGoDial: A Large-Scale Benchmark for Chinese Goal-oriented Dialog
Evaluation [75.60156479374416]
CGoDialは、Goal指向のダイアログ評価のための、新しい挑戦的で包括的な中国のベンチマークである。
96,763のダイアログセッションと574,949のダイアログがすべて含まれており、異なる知識ソースを持つ3つのデータセットをカバーする。
学術ベンチマークと音声対話のシナリオのギャップを埋めるために、実際の会話からデータを収集したり、クラウドソーシングを通じて既存のデータセットに音声機能を追加する。
論文 参考訳(メタデータ) (2022-11-21T16:21:41Z) - Weakly Supervised Data Augmentation Through Prompting for Dialogue
Understanding [103.94325597273316]
本稿では,弱教師付きフィルタを適用して拡張品質を反復する手法を提案する。
我々は、デイリーダイアログにおける感情と行動の分類タスクと、Facebook Multilingual Task-Oriented Dialogueにおける意図の分類タスクについて評価した。
特にDailyDialogでは、真理データの10%を使用して、100%のデータを使用する現在の最先端モデルよりも優れています。
論文 参考訳(メタデータ) (2022-10-25T17:01:30Z) - Taxonomy of Abstractive Dialogue Summarization: Scenarios, Approaches
and Future Directions [14.85592662663867]
この調査は、シナリオから抽象的な対話を要約するための既存の研究を包括的に調査する。
タスクは入力ダイアログの種類、すなわちオープンドメインとタスク指向の2つの幅広いカテゴリに分類される。
既存のテクニックを3方向に分類し、対話機能を注入し、補助訓練タスクを設計し、追加データを使用する。
論文 参考訳(メタデータ) (2022-10-18T14:33:03Z) - Dialogue Term Extraction using Transfer Learning and Topological Data
Analysis [0.8185867455104834]
我々は、純粋にデータ駆動方式で対話におけるドメイン、スロット、値の認識を可能にするさまざまな機能を探究する。
各特徴セットの有用性を検討するために、広く使われているMultiWOZデータセットに基づいてシードモデルを訓練する。
提案手法は,単語の埋め込みのみに依存する従来の手法よりも優れている。
論文 参考訳(メタデータ) (2022-08-22T17:04:04Z) - Slot Self-Attentive Dialogue State Tracking [22.187581131353948]
スロット相関を自動的に学習できるスロット自己認識機構を提案する。
2つのマルチドメインタスク指向対話データセットの包括的な実験を行います。
論文 参考訳(メタデータ) (2021-01-22T22:48:51Z) - RADDLE: An Evaluation Benchmark and Analysis Platform for Robust
Task-oriented Dialog Systems [75.87418236410296]
我々はraddleベンチマーク、コーパスのコレクション、および様々なドメインのモデルのパフォーマンスを評価するためのツールを紹介します。
RADDLEは強力な一般化能力を持つモデルを好んで奨励するように設計されている。
先行学習と微調整に基づく最近の最先端システムの評価を行い,異種ダイアログコーパスに基づく基礎的な事前学習が,ドメインごとの個別モデルをトレーニングするよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-12-29T08:58:49Z) - Predicting Themes within Complex Unstructured Texts: A Case Study on
Safeguarding Reports [66.39150945184683]
本稿では,教師付き分類手法を用いた保護レポートにおいて,主テーマの自動識別の問題に焦点をあてる。
この結果から,ラベル付きデータに制限のある複雑なタスクであっても,深層学習モデルが対象知識の振る舞いをシミュレートする可能性が示唆された。
論文 参考訳(メタデータ) (2020-10-27T19:48:23Z) - A Survey on Text Classification: From Shallow to Deep Learning [83.47804123133719]
過去10年は、ディープラーニングが前例のない成功を収めたために、この分野の研究が急増している。
本稿では,1961年から2021年までの最先端のアプローチを見直し,そのギャップを埋める。
特徴抽出と分類に使用されるテキストとモデルに基づいて,テキスト分類のための分類を作成する。
論文 参考訳(メタデータ) (2020-08-02T00:09:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。