論文の概要: EVI: Multilingual Spoken Dialogue Tasks and Dataset for Knowledge-Based
Enrolment, Verification, and Identification
- arxiv url: http://arxiv.org/abs/2204.13496v1
- Date: Thu, 28 Apr 2022 13:39:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-29 19:36:01.489374
- Title: EVI: Multilingual Spoken Dialogue Tasks and Dataset for Knowledge-Based
Enrolment, Verification, and Identification
- Title(参考訳): EVI:知識に基づく指導・検証・識別のための多言語対話タスクとデータセット
- Authors: Georgios P. Spithourakis, Ivan Vuli\'c, Micha{\l} Lis, I\~nigo
Casanueva, Pawe{\l} Budzianowski
- Abstract要約: 3つの認証タスクとその評価プロトコルを形式化する。
EVIは、英語、ポーランド語、フランス語で5,506の対話が可能な、難解な多言語データセットである。
- 参考スコア(独自算出の注目度): 49.77911492230467
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Knowledge-based authentication is crucial for task-oriented spoken dialogue
systems that offer personalised and privacy-focused services. Such systems
should be able to enrol (E), verify (V), and identify (I) new and recurring
users based on their personal information, e.g. postcode, name, and date of
birth. In this work, we formalise the three authentication tasks and their
evaluation protocols, and we present EVI, a challenging spoken multilingual
dataset with 5,506 dialogues in English, Polish, and French. Our proposed
models set the first competitive benchmarks, explore the challenges of
multilingual natural language processing of spoken dialogue, and set directions
for future research.
- Abstract(参考訳): ナレッジベースの認証は、パーソナライズされたプライバシー重視のサービスを提供するタスク指向の対話システムにとって不可欠である。
このようなシステムは、(e) を問う、(v) を検証し、(i) 個人情報(例えば、郵便番号、名前、生年月日)に基づいて新規かつ定期的なユーザーを特定することができるべきである。
本稿では,3つの認証タスクとその評価プロトコルを定式化し,英語,ポーランド語,フランス語で5,506の対話を有する多言語音声データセットeviを提案する。
提案したモデルは,最初の競合ベンチマークを設定し,音声対話の多言語自然言語処理の課題を探究し,今後の研究に向けた方向性を定めている。
関連論文リスト
- Learning from Implicit User Feedback, Emotions and Demographic Information in Task-Oriented and Document-Grounded Dialogues [52.95506649193427]
FEDIは、この情報に注釈を付けた最初の英語タスク指向および文書地上対話データセットである。
Flan-T5、GPT-2、Llama 2の実験では、タスクの完了と実際の一貫性に特に肯定的な影響が示されている。
論文 参考訳(メタデータ) (2024-01-17T14:52:26Z) - Applying Multilingual Models to Question Answering (QA) [0.0]
本研究では,英語,フィンランド語,日本語の3言語を対象とした質問応答課題(QA)に基づいて,単言語および多言語言語モデルの性能について検討する。
我々は,(1)質問が応答可能かどうかを判断するタスクのモデルを開発し,(2)IOBタグを用いたコンテキスト内の回答テキストを識別する。
論文 参考訳(メタデータ) (2022-12-04T21:58:33Z) - Multi2WOZ: A Robust Multilingual Dataset and Conversational Pretraining
for Task-Oriented Dialog [67.20796950016735]
Multi2WOZデータセットは、中国語、ドイツ語、アラビア語、ロシア語の4つの言語にまたがる。
本稿では,任意の下流TODタスクに対する言語間移動を容易にすることを目的とした,事前学習言語モデル(PrLM)の多言語会話特化のための新しいフレームワークを提案する。
実験の結果,目標言語における(I)会話の特殊化と,(II)具体的なTODタスクのための少数ショット転送の組み合わせが,ほとんどの場合,最高の性能を示すことがわかった。
論文 参考訳(メタデータ) (2022-05-20T18:35:38Z) - Cross-Lingual Dialogue Dataset Creation via Outline-Based Generation [70.81596088969378]
言語間アウトラインに基づく対話データセット(COD)は、自然言語の理解を可能にする。
CODは、4つの異なる言語で対話状態の追跡とエンドツーエンドの対話モデリングと評価を可能にする。
論文 参考訳(メタデータ) (2022-01-31T18:11:21Z) - BiToD: A Bilingual Multi-Domain Dataset For Task-Oriented Dialogue
Modeling [52.99188200886738]
BiToDは、エンドツーエンドのタスク指向対話モデリングのための最初のバイリンガルなマルチドメインデータセットである。
BiToDには、大規模で現実的なバイリンガル知識ベースを持つ7k以上のマルチドメイン対話(144k発声)が含まれている。
論文 参考訳(メタデータ) (2021-06-05T03:38:42Z) - Cross-lingual Approaches for Task-specific Dialogue Act Recognition [1.8352113484137629]
言語間モデルを利用して、少数のアノテーションで特定のタスクに対する対話行動認識を可能にする。
対話行動認識のための伝達学習手法を設計し、2つの異なる言語とドメインで検証する。
論文 参考訳(メタデータ) (2020-05-19T07:44:48Z) - TOD-BERT: Pre-trained Natural Language Understanding for Task-Oriented
Dialogue [113.45485470103762]
本研究では,言語モデリングのためのタスク指向対話データセットを,人間とマルチターンの9つに統合する。
事前学習時の対話動作をモデル化するために,ユーザトークンとシステムトークンをマスク付き言語モデルに組み込む。
論文 参考訳(メタデータ) (2020-04-15T04:09:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。