論文の概要: Crossing the Conversational Chasm: A Primer on Multilingual
Task-Oriented Dialogue Systems
- arxiv url: http://arxiv.org/abs/2104.08570v1
- Date: Sat, 17 Apr 2021 15:19:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-20 14:13:24.823590
- Title: Crossing the Conversational Chasm: A Primer on Multilingual
Task-Oriented Dialogue Systems
- Title(参考訳): 会話カオスの交差:多言語タスク指向対話システムにおける素数
- Authors: Evgeniia Razumovskaia, Goran Glava\v{s}, Olga Majewska, Anna Korhonen,
Ivan Vuli\'c
- Abstract要約: 大規模な学習済みニューラルネットワークモデルに基づく最新のTODモデルは、データ空腹です。
ToDのユースケースのデータ取得は高価で面倒だ。
- 参考スコア(独自算出の注目度): 51.328224222640614
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite the fact that natural language conversations with machines represent
one of the central objectives of AI, and despite the massive increase of
research and development efforts in conversational AI, task-oriented dialogue
(ToD) -- i.e., conversations with an artificial agent with the aim of
completing a concrete task -- is currently limited to a few narrow domains
(e.g., food ordering, ticket booking) and a handful of major languages (e.g.,
English, Chinese). In this work, we provide an extensive overview of existing
efforts in multilingual ToD and analyse the factors preventing the development
of truly multilingual ToD systems. We identify two main challenges that
combined hinder the faster progress in multilingual ToD: (1) current
state-of-the-art ToD models based on large pretrained neural language models
are data hungry; at the same time (2) data acquisition for ToD use cases is
expensive and tedious. Most existing approaches to multilingual ToD thus rely
on (zero- or few-shot) cross-lingual transfer from resource-rich languages (in
ToD, this is basically only English), either by means of (i) machine
translation or (ii) multilingual representation spaces. However, such
approaches are currently not a viable solution for a large number of
low-resource languages without parallel data and/or limited monolingual
corpora. Finally, we discuss critical challenges and potential solutions by
drawing parallels between ToD and other cross-lingual and multilingual NLP
research.
- Abstract(参考訳): 自然言語と機械との会話がAIの中心的な目的の1つであり、会話型AIにおける研究・開発努力の膨大な増加にもかかわらず、タスク指向対話(ToD) - すなわち、具体的なタスクを完了しようとする人工知能エージェントとの会話 - は現在、限られた領域(食品注文、チケット予約など)といくつかの主要言語(例えば、英語、中国語)に限定されている。
本稿では,多言語ToDにおける既存の取り組みを概観し,真に多言語ToDシステムの開発を妨げる要因を解析する。
1) 大規模な事前訓練されたニューラルネットワークモデルに基づく現在の最先端のToDモデルは、データ空腹である; 同時に、(2) ToDのユースケースのためのデータ取得は高価で面倒である。
したがって、Multilingual ToD への既存のアプローチは、リソース豊富な言語(ToD では、基本的には英語のみ)からの(ゼロまたは少数ショットの)クロスリンガル変換に依存しており、これは (i) 機械翻訳または (ii) マルチリンガル表現空間によって行われる。
しかし、そのようなアプローチは、並列データや限定的な単言語コーパスを持たない多数の低リソース言語にとって、現在実現可能なソリューションではない。
最後に, tod と他の言語間および多言語間nlp研究との並列性を引き出すことにより, 課題と潜在的な解決策について論じる。
関連論文リスト
- A Systematic Study of Performance Disparities in Multilingual
Task-Oriented Dialogue Systems [68.76102493999134]
マルチリンガルなタスク指向対話システム間に存在するタスクパフォーマンスの相違を,実証的に分析し,分析する。
我々は現在のToDシステムにおける適応と本質的バイアスの存在を証明した。
本稿では,新しい言語に対するToDデータ収集とシステム開発へのアプローチについて,実践的なヒントを提供する。
論文 参考訳(メタデータ) (2023-10-19T16:41:44Z) - Multi2WOZ: A Robust Multilingual Dataset and Conversational Pretraining
for Task-Oriented Dialog [67.20796950016735]
Multi2WOZデータセットは、中国語、ドイツ語、アラビア語、ロシア語の4つの言語にまたがる。
本稿では,任意の下流TODタスクに対する言語間移動を容易にすることを目的とした,事前学習言語モデル(PrLM)の多言語会話特化のための新しいフレームワークを提案する。
実験の結果,目標言語における(I)会話の特殊化と,(II)具体的なTODタスクのための少数ショット転送の組み合わせが,ほとんどの場合,最高の性能を示すことがわかった。
論文 参考訳(メタデータ) (2022-05-20T18:35:38Z) - Overcoming Language Disparity in Online Content Classification with
Multimodal Learning [22.73281502531998]
大規模言語モデルは、テキスト検出と分類タスクのための最先端のソリューションを開発するための標準となっている。
高度な計算技術と資源の開発は、英語に不相応に焦点が当てられている。
マルチモーダル機械学習を用いて画像に含まれる情報を統合するという約束を探求する。
論文 参考訳(メタデータ) (2022-05-19T17:56:02Z) - Cross-Lingual Dialogue Dataset Creation via Outline-Based Generation [70.81596088969378]
言語間アウトラインに基づく対話データセット(COD)は、自然言語の理解を可能にする。
CODは、4つの異なる言語で対話状態の追跡とエンドツーエンドの対話モデリングと評価を可能にする。
論文 参考訳(メタデータ) (2022-01-31T18:11:21Z) - GlobalWoZ: Globalizing MultiWoZ to Develop Multilingual Task-Oriented
Dialogue Systems [66.92182084456809]
本稿では,英語のToDデータセットから大規模多言語ToDデータセットであるGlobalWoZを生成する新しいデータキュレーション手法を提案する。
本手法は,対話テンプレートの翻訳と,対象国におけるローカルエンティティの充填に基づく。
我々はデータセットと強力なベースラインのセットを公開し、実際のユースケースにおける多言語ToDシステムの学習を奨励します。
論文 参考訳(メタデータ) (2021-10-14T19:33:04Z) - BiToD: A Bilingual Multi-Domain Dataset For Task-Oriented Dialogue
Modeling [52.99188200886738]
BiToDは、エンドツーエンドのタスク指向対話モデリングのための最初のバイリンガルなマルチドメインデータセットである。
BiToDには、大規模で現実的なバイリンガル知識ベースを持つ7k以上のマルチドメイン対話(144k発声)が含まれている。
論文 参考訳(メタデータ) (2021-06-05T03:38:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。