論文の概要: BiToD: A Bilingual Multi-Domain Dataset For Task-Oriented Dialogue
Modeling
- arxiv url: http://arxiv.org/abs/2106.02787v1
- Date: Sat, 5 Jun 2021 03:38:42 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-08 18:17:41.920719
- Title: BiToD: A Bilingual Multi-Domain Dataset For Task-Oriented Dialogue
Modeling
- Title(参考訳): BiToD:タスク指向対話モデリングのためのバイリンガルマルチドメインデータセット
- Authors: Zhaojiang Lin, Andrea Madotto, Genta Indra Winata, Peng Xu, Feijun
Jiang, Yuxiang Hu, Chen Shi, Pascale Fung
- Abstract要約: BiToDは、エンドツーエンドのタスク指向対話モデリングのための最初のバイリンガルなマルチドメインデータセットである。
BiToDには、大規模で現実的なバイリンガル知識ベースを持つ7k以上のマルチドメイン対話(144k発声)が含まれている。
- 参考スコア(独自算出の注目度): 52.99188200886738
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Task-oriented dialogue (ToD) benchmarks provide an important avenue to
measure progress and develop better conversational agents. However, existing
datasets for end-to-end ToD modeling are limited to a single language,
hindering the development of robust end-to-end ToD systems for multilingual
countries and regions. Here we introduce BiToD, the first bilingual
multi-domain dataset for end-to-end task-oriented dialogue modeling. BiToD
contains over 7k multi-domain dialogues (144k utterances) with a large and
realistic bilingual knowledge base. It serves as an effective benchmark for
evaluating bilingual ToD systems and cross-lingual transfer learning
approaches. We provide state-of-the-art baselines under three evaluation
settings (monolingual, bilingual, and cross-lingual). The analysis of our
baselines in different settings highlights 1) the effectiveness of training a
bilingual ToD system compared to two independent monolingual ToD systems, and
2) the potential of leveraging a bilingual knowledge base and cross-lingual
transfer learning to improve the system performance under low resource
condition.
- Abstract(参考訳): タスク指向対話(ToD)ベンチマークは、進捗を測定し、より良い対話エージェントを開発するための重要な道を提供する。
しかし、エンドツーエンドのToDモデリングのための既存のデータセットは単一の言語に限られており、多言語国や地域向けの堅牢なエンドツーエンドのToDシステムの開発を妨げる。
本稿では,タスク指向対話モデリングのためのバイリンガル・マルチドメイン・データセットであるBiToDを紹介する。
BiToDには、大規模で現実的なバイリンガル知識ベースを持つ7k以上のマルチドメイン対話(144k発話)が含まれている。
バイリンガルなToDシステムと言語間移動学習アプローチを評価するための効果的なベンチマークとして機能する。
3つの評価条件(単言語、バイリンガル、クロスリンガル)の下、最先端のベースラインを提供する。
2つの独立した単言語ToDシステムと比較して,1)バイリンガルToDシステムのトレーニングの有効性,2)低資源環境下でのシステム性能を向上させるために,バイリンガル知識ベースとクロスリンガルトランスファー学習を活用する可能性を明らかにする。
関連論文リスト
- IndoToD: A Multi-Domain Indonesian Benchmark For End-to-End
Task-Oriented Dialogue Systems [26.094144160398447]
本稿ではインドネシアのマルチドメインToDベンチマークであるIndoToDを紹介する。
2つの英語のToDデータセットをインドネシア語に拡張し、4つの異なるドメインをデレキシライズしてアノテーションのサイズを効率的に削減する。
高品質なデータ収集を保証するため、対話を手動で翻訳するためにネイティブな話者を雇います。
論文 参考訳(メタデータ) (2023-11-02T03:01:53Z) - A Systematic Study of Performance Disparities in Multilingual
Task-Oriented Dialogue Systems [68.76102493999134]
マルチリンガルなタスク指向対話システム間に存在するタスクパフォーマンスの相違を,実証的に分析し,分析する。
我々は現在のToDシステムにおける適応と本質的バイアスの存在を証明した。
本稿では,新しい言語に対するToDデータ収集とシステム開発へのアプローチについて,実践的なヒントを提供する。
論文 参考訳(メタデータ) (2023-10-19T16:41:44Z) - Multi2WOZ: A Robust Multilingual Dataset and Conversational Pretraining
for Task-Oriented Dialog [67.20796950016735]
Multi2WOZデータセットは、中国語、ドイツ語、アラビア語、ロシア語の4つの言語にまたがる。
本稿では,任意の下流TODタスクに対する言語間移動を容易にすることを目的とした,事前学習言語モデル(PrLM)の多言語会話特化のための新しいフレームワークを提案する。
実験の結果,目標言語における(I)会話の特殊化と,(II)具体的なTODタスクのための少数ショット転送の組み合わせが,ほとんどの場合,最高の性能を示すことがわかった。
論文 参考訳(メタデータ) (2022-05-20T18:35:38Z) - Cross-Lingual Dialogue Dataset Creation via Outline-Based Generation [70.81596088969378]
言語間アウトラインに基づく対話データセット(COD)は、自然言語の理解を可能にする。
CODは、4つの異なる言語で対話状態の追跡とエンドツーエンドの対話モデリングと評価を可能にする。
論文 参考訳(メタデータ) (2022-01-31T18:11:21Z) - GlobalWoZ: Globalizing MultiWoZ to Develop Multilingual Task-Oriented
Dialogue Systems [66.92182084456809]
本稿では,英語のToDデータセットから大規模多言語ToDデータセットであるGlobalWoZを生成する新しいデータキュレーション手法を提案する。
本手法は,対話テンプレートの翻訳と,対象国におけるローカルエンティティの充填に基づく。
我々はデータセットと強力なベースラインのセットを公開し、実際のユースケースにおける多言語ToDシステムの学習を奨励します。
論文 参考訳(メタデータ) (2021-10-14T19:33:04Z) - Crossing the Conversational Chasm: A Primer on Multilingual
Task-Oriented Dialogue Systems [51.328224222640614]
大規模な学習済みニューラルネットワークモデルに基づく最新のTODモデルは、データ空腹です。
ToDのユースケースのデータ取得は高価で面倒だ。
論文 参考訳(メタデータ) (2021-04-17T15:19:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。