論文の概要: IndoToD: A Multi-Domain Indonesian Benchmark For End-to-End
Task-Oriented Dialogue Systems
- arxiv url: http://arxiv.org/abs/2311.00958v1
- Date: Thu, 2 Nov 2023 03:01:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2023-11-03 15:04:32.477798
- Title: IndoToD: A Multi-Domain Indonesian Benchmark For End-to-End
Task-Oriented Dialogue Systems
- Title(参考訳): indotod:エンドツーエンドタスク指向対話システムのためのマルチドメインインドネシアベンチマーク
- Authors: Muhammad Dehan Al Kautsar, Rahmah Khoirussyifa' Nurdini, Samuel
Cahyawijaya, Genta Indra Winata, Ayu Purwarianti
- Abstract要約: 本稿ではインドネシアのマルチドメインToDベンチマークであるIndoToDを紹介する。
2つの英語のToDデータセットをインドネシア語に拡張し、4つの異なるドメインをデレキシライズしてアノテーションのサイズを効率的に削減する。
高品質なデータ収集を保証するため、対話を手動で翻訳するためにネイティブな話者を雇います。
- 参考スコア(独自算出の注目度): 26.094144160398447
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Task-oriented dialogue (ToD) systems have been mostly created for
high-resource languages, such as English and Chinese. However, there is a need
to develop ToD systems for other regional or local languages to broaden their
ability to comprehend the dialogue contexts in various languages. This paper
introduces IndoToD, an end-to-end multi domain ToD benchmark in Indonesian. We
extend two English ToD datasets to Indonesian, comprising four different
domains by delexicalization to efficiently reduce the size of annotations. To
ensure a high-quality data collection, we hire native speakers to manually
translate the dialogues. Along with the original English datasets, these new
Indonesian datasets serve as an effective benchmark for evaluating Indonesian
and English ToD systems as well as exploring the potential benefits of
cross-lingual and bilingual transfer learning approaches.
- Abstract(参考訳): タスク指向対話(ToD)システムは、主に英語や中国語などの高リソース言語向けに作成されている。
しかし,様々な言語で会話の文脈を理解する能力を広げるために,他の地域言語や地域言語のためのToDシステムを開発する必要がある。
本稿ではインドネシアのマルチドメインToDベンチマークであるIndoToDを紹介する。
2つの英語todデータセットを4つの異なるドメインからなるインドネシアに拡張し,アノテーションのサイズを効率的に削減した。
高品質なデータ収集を保証するため、対話を手動で翻訳するためにネイティブスピーカーを採用。
オリジナルの英語データセットとともに、これらのインドネシアのデータセットは、インドネシア語と英語のtodシステムを評価するための効果的なベンチマークとなり、言語間およびバイリンガルのトランスファー学習アプローチの潜在的な利点を探求する。
関連論文リスト
- A Systematic Study of Performance Disparities in Multilingual
Task-Oriented Dialogue Systems [68.76102493999134]
マルチリンガルなタスク指向対話システム間に存在するタスクパフォーマンスの相違を,実証的に分析し,分析する。
我々は現在のToDシステムにおける適応と本質的バイアスの存在を証明した。
本稿では,新しい言語に対するToDデータ収集とシステム開発へのアプローチについて,実践的なヒントを提供する。
論文 参考訳(メタデータ) (2023-10-19T16:41:44Z) - Cross-lingual Data Augmentation for Document-grounded Dialog Systems in
Low Resource Languages [0.0]
本稿では,逆トレーニング検索 (Retriever and Re-ranker) と Fid (Fusion-in-decoder) ジェネレータを含む新しいパイプラインCLEM (Cross-Lingual Enhanced Model) を提案する。
また,ハイリソース言語をさらに活用するために,翻訳学習による多言語間のアライメントを実現する革新的なアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-05-24T09:40:52Z) - Multi2WOZ: A Robust Multilingual Dataset and Conversational Pretraining
for Task-Oriented Dialog [67.20796950016735]
Multi2WOZデータセットは、中国語、ドイツ語、アラビア語、ロシア語の4つの言語にまたがる。
本稿では,任意の下流TODタスクに対する言語間移動を容易にすることを目的とした,事前学習言語モデル(PrLM)の多言語会話特化のための新しいフレームワークを提案する。
実験の結果,目標言語における(I)会話の特殊化と,(II)具体的なTODタスクのための少数ショット転送の組み合わせが,ほとんどの場合,最高の性能を示すことがわかった。
論文 参考訳(メタデータ) (2022-05-20T18:35:38Z) - Cross-Lingual Dialogue Dataset Creation via Outline-Based Generation [70.81596088969378]
言語間アウトラインに基づく対話データセット(COD)は、自然言語の理解を可能にする。
CODは、4つの異なる言語で対話状態の追跡とエンドツーエンドの対話モデリングと評価を可能にする。
論文 参考訳(メタデータ) (2022-01-31T18:11:21Z) - GlobalWoZ: Globalizing MultiWoZ to Develop Multilingual Task-Oriented
Dialogue Systems [66.92182084456809]
本稿では,英語のToDデータセットから大規模多言語ToDデータセットであるGlobalWoZを生成する新しいデータキュレーション手法を提案する。
本手法は,対話テンプレートの翻訳と,対象国におけるローカルエンティティの充填に基づく。
我々はデータセットと強力なベースラインのセットを公開し、実際のユースケースにおける多言語ToDシステムの学習を奨励します。
論文 参考訳(メタデータ) (2021-10-14T19:33:04Z) - BiToD: A Bilingual Multi-Domain Dataset For Task-Oriented Dialogue
Modeling [52.99188200886738]
BiToDは、エンドツーエンドのタスク指向対話モデリングのための最初のバイリンガルなマルチドメインデータセットである。
BiToDには、大規模で現実的なバイリンガル知識ベースを持つ7k以上のマルチドメイン対話(144k発声)が含まれている。
論文 参考訳(メタデータ) (2021-06-05T03:38:42Z) - Crossing the Conversational Chasm: A Primer on Multilingual
Task-Oriented Dialogue Systems [51.328224222640614]
大規模な学習済みニューラルネットワークモデルに基づく最新のTODモデルは、データ空腹です。
ToDのユースケースのデータ取得は高価で面倒だ。
論文 参考訳(メタデータ) (2021-04-17T15:19:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。