論文の概要: TOD-DA: Towards Boosting the Robustness of Task-oriented Dialogue
Modeling on Spoken Conversations
- arxiv url: http://arxiv.org/abs/2112.12441v1
- Date: Thu, 23 Dec 2021 10:04:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-24 14:52:34.933321
- Title: TOD-DA: Towards Boosting the Robustness of Task-oriented Dialogue
Modeling on Spoken Conversations
- Title(参考訳): TOD-DA:音声対話におけるタスク指向対話モデリングのロバスト性向上に向けて
- Authors: Xin Tian, Xinxian Huang, Dongfeng He, Yingzhan Lin, Siqi Bao, Huang
He, Liankai Huang, Qiang Ju, Xiyuan Zhang, Jian Xie, Shuqi Sun, Fan Wang, Hua
Wu, Haifeng Wang
- Abstract要約: 本稿では,音声対話におけるタスク指向対話モデリングの堅牢性を高めるために,新しいモデルに依存しないデータ拡張パラダイムを提案する。
本手法は,音声対話におけるタスク指向対話モデリングのベンチマークであるDSTC10 Track2の両タスクにおいて,第1位となった。
- 参考スコア(独自算出の注目度): 24.245354500835465
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Task-oriented dialogue systems have been plagued by the difficulties of
obtaining large-scale and high-quality annotated conversations. Furthermore,
most of the publicly available datasets only include written conversations,
which are insufficient to reflect actual human behaviors in practical spoken
dialogue systems. In this paper, we propose Task-oriented Dialogue Data
Augmentation (TOD-DA), a novel model-agnostic data augmentation paradigm to
boost the robustness of task-oriented dialogue modeling on spoken
conversations. The TOD-DA consists of two modules: 1) Dialogue Enrichment to
expand training data on task-oriented conversations for easing data sparsity
and 2) Spoken Conversation Simulator to imitate oral style expressions and
speech recognition errors in diverse granularities for bridging the gap between
written and spoken conversations. With such designs, our approach ranked first
in both tasks of DSTC10 Track2, a benchmark for task-oriented dialogue modeling
on spoken conversations, demonstrating the superiority and effectiveness of our
proposed TOD-DA.
- Abstract(参考訳): タスク指向対話システムは、大規模で高品質な注釈付き会話を得ることの難しさに悩まされてきた。
さらに、一般に入手可能なデータセットのほとんどは、実際の対話システムにおける実際の人間の行動を反映しない、書かれた会話のみを含んでいる。
本稿では,タスク指向対話モデルの頑健性を高めるための新しいモデル非依存データ拡張パラダイムであるタスク指向対話データ拡張(tod-da)を提案する。
TOD-DAは2つのモジュールから構成される。
1【タスク指向会話の訓練データの拡大によるデータ疎結合の緩和】
2) 音声対話シミュレータは, 文章と会話のギャップを埋めるために, 多様な粒度の音声表現や音声認識誤りを模倣する。
そこで本手法は,音声対話におけるタスク指向対話モデリングのベンチマークであるDSTC10 Track2の両タスクにおいて第1位となり,提案したTOD-DAの優位性と有効性を示した。
関連論文リスト
- MP2D: An Automated Topic Shift Dialogue Generation Framework Leveraging
Knowledge Graphs [15.876075659237722]
Multi-Passage to Dialogue (MP2D) は、自然なトピック遷移を伴う質問応答データセットを生成する。
MP2Dは対話内のトピックの流れをマッピングし、人間の会話のダイナミクスを効果的に反映する。
本研究では,トピックシフト対話のための新しいベンチマークTS-WikiDialogを紹介する。
論文 参考訳(メタデータ) (2024-03-09T06:28:48Z) - Adapting Text-based Dialogue State Tracker for Spoken Dialogues [20.139351605832665]
本稿では,DSTC11における音声認識対話システム技術課題トラックに参画した,高度に成功を収めたモデルの構築に向けた技術的取り組みについて述べる。
本モデルは,(1)音声音声とテキスト音声のギャップを埋める自動音声認識誤差補正,(2)スロット記述を用いてスロットと値を推定するテキストベース対話システム(D3ST),(3)推定スロット値の誤差を復元する後処理の3つの主要モジュールから構成される。
論文 参考訳(メタデータ) (2023-08-29T06:27:58Z) - SpokenWOZ: A Large-Scale Speech-Text Benchmark for Spoken Task-Oriented
Dialogue Agents [72.42049370297849]
SpokenWOZは音声TODのための大規模音声テキストデータセットである。
SpokenWOZでは、クロスターンスロットと推論スロット検出が新たな課題である。
論文 参考訳(メタデータ) (2023-05-22T13:47:51Z) - Dialog Acts for Task-Driven Embodied Agents [10.275619475149433]
エージェントは自然言語の理解タスク記述で対話し、適切なフォローアップ質問をすることができる必要がある。
このような対話をモデル化するためのダイアログのセットを提案し、3000以上のタスク指向の会話を含むTEAChデータセットに注釈を付ける。
この注釈付きデータセットを、与えられた発話のダイアログ動作にタグ付けし、ダイアログ履歴を与えられた次の応答のダイアログ動作を予測する訓練モデルに使用し、ダイアログ動作を使用してエージェントの非ダイアログ動作をガイドする。
論文 参考訳(メタデータ) (2022-09-26T18:41:28Z) - KETOD: Knowledge-Enriched Task-Oriented Dialogue [77.59814785157877]
対話システム研究における既存の研究は、主にタスク指向の対話とチャットを独立したドメインとして扱う。
本研究では,タスク指向対話と知識ベースチップチャットを一つのモデルに効果的に統合する方法について検討する。
論文 参考訳(メタデータ) (2022-05-11T16:01:03Z) - UniDS: A Unified Dialogue System for Chit-Chat and Task-oriented
Dialogues [59.499965460525694]
上記の2つのスキルを備えた統合対話システム(UniDS)を提案する。
我々は、チャットとタスク指向の対話の両方に対応可能な統合対話データスキーマを設計する。
我々は、事前訓練されたチャット対話モデルから混合対話データでUniDSを訓練する。
論文 参考訳(メタデータ) (2021-10-15T11:56:47Z) - "How Robust r u?": Evaluating Task-Oriented Dialogue Systems on Spoken
Conversations [87.95711406978157]
本研究は、音声タスク指向会話における新しいベンチマークを示す。
マルチドメイン対話状態追跡と知識基底型対話モデルについて検討する。
我々のデータセットは,タスク指向対話システムの音声によるベンチマークを可能にする。
論文 参考訳(メタデータ) (2021-09-28T04:51:04Z) - Filling the Gap of Utterance-aware and Speaker-aware Representation for
Multi-turn Dialogue [76.88174667929665]
マルチターン対話は、2つ以上の異なる話者の役割から複数の発話からなる。
既存の検索に基づくマルチターン対話モデルでは、事前訓練された言語モデル(PrLM)をエンコーダとして、対話を粗く表現する。
本稿では,対話履歴に係わる効果的な発話認識表現と話者認識表現をモデル化することにより,そのようなギャップを埋める新しいモデルを提案する。
論文 参考訳(メタデータ) (2020-09-14T15:07:19Z) - TOD-BERT: Pre-trained Natural Language Understanding for Task-Oriented
Dialogue [113.45485470103762]
本研究では,言語モデリングのためのタスク指向対話データセットを,人間とマルチターンの9つに統合する。
事前学習時の対話動作をモデル化するために,ユーザトークンとシステムトークンをマスク付き言語モデルに組み込む。
論文 参考訳(メタデータ) (2020-04-15T04:09:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。