論文の概要: Dial HEALTHDIAL for Advice: A Multilingual and Multi-Parallel Spoken Dialogue Dataset for Knowledge-Grounded Information Seeking
- arxiv url: http://arxiv.org/abs/2605.30107v1
- Date: Thu, 28 May 2026 15:47:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 02:45:56.447536
- Title: Dial HEALTHDIAL for Advice: A Multilingual and Multi-Parallel Spoken Dialogue Dataset for Knowledge-Grounded Information Seeking
- Title(参考訳): Dial HEALTHDIAL for Advice:知識情報検索のための多言語・多言語音声対話データセット
- Authors: Songbo Hu, Yinhong Liu, Ej Zhou, Evgeniia Razumovskaia, Xiaobin Wang, Alexander Fraser, Ivan Vulić, Anna Korhonen,
- Abstract要約: 本研究では,RAGに基づく音声対話システムの開発と評価を目的とした大規模・多言語・マルチ並列データセットであるHEALTHDIALを紹介する。
このデータセットは、WHO(World Health Organization)の信頼できるコンテンツに基づく6000の情報検索対話(言語毎1500語)と、多様な方言の母語話者から記録された163時間のユーザスピーチで構成されている。
- 参考スコア(独自算出の注目度): 72.66384771245389
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Creating spoken dialogue datasets is methodologically challenging, and these challenges are amplified when the goal is to build multilingual, multi-parallel datasets at scale. This work introduces HEALTHDIAL, a large-scale, multilingual, and multi-parallel dataset for developing and evaluating retrieval-augmented generation (RAG)-based spoken dialogue systems. The dataset comprises 6,000 information-seeking dialogues (1,500 per language) grounded in trusted content from the World Health Organization (WHO) and 163 hours of user speech recorded from native speakers of diverse dialects across four official WHO languages: Arabic, Chinese, English, and Spanish. Each speaker is annotated with demographic (e.g., gender, age) and sociolinguistic (e.g., primary language, region of origin) variables. We report benchmark results across key dialogue tasks, which reveal consistent performance disparities across languages, even among high-resource ones. To support future research, we release the dataset, a prototype system, and a toolkit for data collection and system evaluation.
- Abstract(参考訳): 音声対話データセットの作成は方法論的に困難であり、大規模にマルチリンガルでマルチ並列なデータセットを構築することを目標とする場合には、これらの課題が増幅される。
本研究では,RAGに基づく音声対話システムの開発と評価を目的とした大規模・多言語・マルチ並列データセットであるHEALTHDIALを紹介する。
このデータセットは、世界保健機関(WHO)の信頼できるコンテンツに基づく6000の情報検索対話(言語毎1500語)と、4つの公式WHO言語(アラビア語、中国語、英語、スペイン語)にわたる多様な方言の母語話者から記録された163時間のユーザースピーチで構成されている。
各話者は、人口統計学(例えば、性別、年齢)と社会言語学(例えば、一次言語、原産地)の変数で注釈付けされる。
本稿では,主要な対話タスク間のベンチマーク結果について報告する。
今後の研究を支援するため、データセット、プロトタイプシステム、データ収集およびシステム評価のためのツールキットをリリースする。
関連論文リスト
- The Belebele Benchmark: a Parallel Reading Comprehension Dataset in 122 Language Variants [80.4837840962273]
私たちは122の言語変種にまたがるデータセットであるBelebeleを紹介します。
このデータセットは、高、中、低リソース言語におけるテキストモデルの評価を可能にする。
論文 参考訳(メタデータ) (2023-08-31T17:43:08Z) - Multi3WOZ: A Multilingual, Multi-Domain, Multi-Parallel Dataset for
Training and Evaluating Culturally Adapted Task-Oriented Dialog Systems [64.40789703661987]
Multi3WOZは、新しいマルチ言語、マルチドメイン、マルチ並列ToDデータセットである。
大規模で、4つの言語で文化的に適応したダイアログを提供する。
最終データセットを生成する複雑なボトムアップデータ収集プロセスについて述べる。
論文 参考訳(メタデータ) (2023-07-26T08:29:42Z) - ViWOZ: A Multi-Domain Task-Oriented Dialogue Systems Dataset For
Low-resource Language [0.0]
ViWOZはベトナム初のマルチターン、マルチドメインタスク指向データセットである。
データセットは合計で5,000の対話で構成され、その中には60,946の完全注釈付き発話が含まれている。
これらの特徴により、VWOZデータセットは、多言語タスク指向対話システムの構築に関する将来の研究を可能にする。
論文 参考訳(メタデータ) (2022-03-15T09:22:04Z) - Cross-Lingual Dialogue Dataset Creation via Outline-Based Generation [70.81596088969378]
言語間アウトラインに基づく対話データセット(COD)は、自然言語の理解を可能にする。
CODは、4つの異なる言語で対話状態の追跡とエンドツーエンドの対話モデリングと評価を可能にする。
論文 参考訳(メタデータ) (2022-01-31T18:11:21Z) - GlobalWoZ: Globalizing MultiWoZ to Develop Multilingual Task-Oriented
Dialogue Systems [66.92182084456809]
本稿では,英語のToDデータセットから大規模多言語ToDデータセットであるGlobalWoZを生成する新しいデータキュレーション手法を提案する。
本手法は,対話テンプレートの翻訳と,対象国におけるローカルエンティティの充填に基づく。
我々はデータセットと強力なベースラインのセットを公開し、実際のユースケースにおける多言語ToDシステムの学習を奨励します。
論文 参考訳(メタデータ) (2021-10-14T19:33:04Z) - Cross-lingual Intermediate Fine-tuning improves Dialogue State Tracking [84.50302759362698]
我々は、事前訓練された多言語モデルの中間微調整により、伝達学習プロセスを強化する。
我々は、パラレルおよび会話型の映画字幕データセットを使用して、言語間中間タスクを設計する。
パラレルなMultiWoZデータセットとMultilingual WoZデータセットの精度を20%向上させる。
論文 参考訳(メタデータ) (2021-09-28T11:22:38Z) - RiSAWOZ: A Large-Scale Multi-Domain Wizard-of-Oz Dataset with Rich
Semantic Annotations for Task-Oriented Dialogue Modeling [35.75880078666584]
RiSAWOZ は、Rich Semantic s を用いた大規模マルチドメインの Chinese Wizard-of-Oz データセットである。
11.2Kのヒューマン・ツー・ヒューマン(H2H)マルチターン・アノテート・ダイアログを含み、12ドメインにまたがる150K以上の発話がある。
論文 参考訳(メタデータ) (2020-10-17T08:18:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。