論文の概要: AllWOZ: Towards Multilingual Task-Oriented Dialog Systems for All
- arxiv url: http://arxiv.org/abs/2112.08333v1
- Date: Wed, 15 Dec 2021 18:30:51 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-16 14:45:23.969906
- Title: AllWOZ: Towards Multilingual Task-Oriented Dialog Systems for All
- Title(参考訳): AllWOZ:多言語タスク指向対話システムを目指して
- Authors: Lei Zuo, Kun Qian, Bowen Yang, Zhou Yu
- Abstract要約: 本稿では8言語をカバーする多言語タスク指向顧客サービスダイアログであるAllWOZを提案する。
メタ学習にmT5を適用することで,多言語データセットのベンチマークを作成する。
- 参考スコア(独自算出の注目度): 41.10368284872525
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A commonly observed problem of the state-of-the-art natural language
technologies, such as Amazon Alexa and Apple Siri, is that their services do
not extend to most developing countries' citizens due to language barriers.
Such populations suffer due to the lack of available resources in their
languages to build NLP products. This paper presents AllWOZ, a multilingual
multi-domain task-oriented customer service dialog dataset covering eight
languages: English, Mandarin, Korean, Vietnamese, Hindi, French, Portuguese,
and Thai. Furthermore, we create a benchmark for our multilingual dataset by
applying mT5 with meta-learning.
- Abstract(参考訳): Amazon AlexaやApple Siriのような最先端の自然言語技術の一般的な問題は、彼らのサービスが言語障壁のためにほとんどの途上国の市民に拡張されないことである。
このような人口は、NLP製品を作るための言語に資源が不足しているために苦しんでいる。
本稿では,英語,マンダリン,韓国語,ベトナム語,ヒンディー語,フランス語,ポルトガル語,タイ語を含む8言語を対象とした多言語多言語タスク指向顧客サービスダイアログであるAllWOZを提案する。
さらに,メタ学習にmT5を適用することで,多言語データセットのベンチマークを作成する。
関連論文リスト
- SeaLLMs 3: Open Foundation and Chat Multilingual Large Language Models for Southeast Asian Languages [77.75535024869224]
東南アジアの言語に合わせたSeaLLMsモデルファミリーの最新版SeaLLMs 3を紹介します。
SeaLLMs 3は、英語、中国語、インドネシア語、ベトナム語、タイ語、タガログ語、マレー語、ビルマ語、クメール語、ラオス語、タミル語、ジャワ語など、この地域で話される言語全般をカバーすることで、このギャップを埋めることを目指している。
我々のモデルは、世界的知識、数学的推論、翻訳、命令の追従といったタスクに優れており、同様の大きさのモデルで最先端の性能を達成する。
論文 参考訳(メタデータ) (2024-07-29T03:26:22Z) - MULTI3NLU++: A Multilingual, Multi-Intent, Multi-Domain Dataset for
Natural Language Understanding in Task-Oriented Dialogue [115.32009638844059]
英語のみのNLU++データセットを拡張して、手動による翻訳を高、中、低リソース言語に含めます。
Multi3NLU++はそのマルチインテント特性のため、複雑で自然なユーザ目標を表現している。
我々はMulti3NLU++を用いて、インテント検出やスロットラベリングといった自然言語理解タスクに対して、最先端の多言語モデルをベンチマークする。
論文 参考訳(メタデータ) (2022-12-20T17:34:25Z) - Making a MIRACL: Multilingual Information Retrieval Across a Continuum
of Languages [62.730361829175415]
MIRACLは、WSDM 2023 Cupチャレンジのために構築した多言語データセットです。
18の言語にまたがるアドホック検索に焦点を当てている。
我々の目標は、言語連続体における検索を改善する研究を加速させることです。
論文 参考訳(メタデータ) (2022-10-18T16:47:18Z) - NusaX: Multilingual Parallel Sentiment Dataset for 10 Indonesian Local
Languages [100.59889279607432]
インドネシアにおける言語の資源開発に重点を置いている。
インドネシアのほとんどの言語は絶滅危惧種に分類され、一部は絶滅している。
インドネシアで10の低リソース言語を対象とした,最初の並列リソースを開発した。
論文 参考訳(メタデータ) (2022-05-31T17:03:50Z) - ViWOZ: A Multi-Domain Task-Oriented Dialogue Systems Dataset For
Low-resource Language [0.0]
ViWOZはベトナム初のマルチターン、マルチドメインタスク指向データセットである。
データセットは合計で5,000の対話で構成され、その中には60,946の完全注釈付き発話が含まれている。
これらの特徴により、VWOZデータセットは、多言語タスク指向対話システムの構築に関する将来の研究を可能にする。
論文 参考訳(メタデータ) (2022-03-15T09:22:04Z) - Towards Building ASR Systems for the Next Billion Users [15.867823754118422]
インド亜大陸からの低資源言語のためのASRシステム構築に貢献する。
まず、40言語を対象に、17,000時間の生音声データをキュレートする。
この生の音声データを用いて、40のインドの言語に対して、いくつかのwav2vecスタイルモデルを事前訓練する。
論文 参考訳(メタデータ) (2021-11-06T19:34:33Z) - GlobalWoZ: Globalizing MultiWoZ to Develop Multilingual Task-Oriented
Dialogue Systems [66.92182084456809]
本稿では,英語のToDデータセットから大規模多言語ToDデータセットであるGlobalWoZを生成する新しいデータキュレーション手法を提案する。
本手法は,対話テンプレートの翻訳と,対象国におけるローカルエンティティの充填に基づく。
我々はデータセットと強力なベースラインのセットを公開し、実際のユースケースにおける多言語ToDシステムの学習を奨励します。
論文 参考訳(メタデータ) (2021-10-14T19:33:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。