論文の概要: MeDiaQA: A Question Answering Dataset on Medical Dialogues
- arxiv url: http://arxiv.org/abs/2108.08074v1
- Date: Wed, 18 Aug 2021 09:57:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-19 20:38:32.538932
- Title: MeDiaQA: A Question Answering Dataset on Medical Dialogues
- Title(参考訳): mediaqa: 医療対話に関する質問応答データセット
- Authors: Huqun Suri and Qi Zhang and Wenhua Huo and Yan Liu and Chunsheng Guan
- Abstract要約: MeDiaQAは、実際のオンライン医療対話に基づいて構築された、新しい質問応答(QA)データセットである。
これには、患者と医師の間で120kの発話で11k以上の対話を行うために、人間によって注釈付けされた22kの多重選択質問が含まれている。
MeDia-BERTは64.3%の精度で、人間のパフォーマンスは93%の精度で達成されている。
- 参考スコア(独自算出の注目度): 8.152991655930718
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we introduce MeDiaQA, a novel question answering(QA) dataset,
which constructed on real online Medical Dialogues. It contains 22k
multiple-choice questions annotated by human for over 11k dialogues with 120k
utterances between patients and doctors, covering 150 specialties of diseases,
which are collected from haodf.com and dxy.com. MeDiaQA is the first QA dataset
where reasoning over medical dialogues, especially their quantitative contents.
The dataset has the potential to test the computing, reasoning and
understanding ability of models across multi-turn dialogues, which is
challenging compared with the existing datasets. To address the challenges, we
design MeDia-BERT, and it achieves 64.3% accuracy, while human performance of
93% accuracy, which indicates that there still remains a large room for
improvement.
- Abstract(参考訳): 本稿では,実際のオンライン・メディカル・ダイアログ上に構築された質問応答(QA)データセットであるMeDiaQAを紹介する。
haodf.comとdxy.comから収集した150の専門疾患をカバーする、患者と医師の間での120kの発話を含む1k以上の対話に対して、人間によって注釈された22kのマルチチョイス質問を含んでいる。
MeDiaQAは、医療対話、特に量的内容に関する推論を行う最初のQAデータセットである。
データセットには、マルチターン対話におけるモデルのコンピューティング、推論、理解能力をテストする可能性があり、既存のデータセットと比較すると難しい。
この問題に対処するため、メディアバートを設計し、64.3%の精度を実現しますが、人間のパフォーマンスは93%の精度です。
関連論文リスト
- MediTOD: An English Dialogue Dataset for Medical History Taking with Comprehensive Annotations [23.437292621092823]
本研究は,医学史研究のための英語における医師と患者との対話のデータセットであるMedictoDを紹介する。
医療領域に合わせたアンケートに基づくラベリング手法を考案する。
そして、医療専門家は高品質の包括的なアノテーションでデータセットを作成する。
論文 参考訳(メタデータ) (2024-10-18T06:38:22Z) - emrQA-msquad: A Medical Dataset Structured with the SQuAD V2.0 Framework, Enriched with emrQA Medical Information [2.2083091880368855]
emrQA-msquadデータセットは、医学用語の複雑さに対処するために開発された。
Span抽出タスク専用の医療データセットが導入され、システムの堅牢性が強化された。
BERT、RoBERTa、Tiny RoBERTaといったモデルの微調整により、F1スコアの範囲での応答精度は0.75から1.00に向上した。
論文 参考訳(メタデータ) (2024-04-18T10:06:00Z) - Towards Conversational Diagnostic AI [32.84876349808714]
本稿では,診断対話に最適化されたLarge Language Model (LLM)ベースのAIシステムであるAMIE(Articulate Medical Intelligence Explorer)を紹介する。
AMIEは、さまざまな疾患条件にまたがって学習をスケールするための自動フィードバック機構を備えた、セルフプレイベースのシミュレート環境を使用する。
AMIEの診断精度は, 専門医によると32例中28例, 患者アクターでは26例中24例で高い成績を示した。
論文 参考訳(メタデータ) (2024-01-11T04:25:06Z) - PMC-LLaMA: Towards Building Open-source Language Models for Medicine [62.39105735933138]
大規模言語モデル(LLM)は、自然言語理解において顕著な能力を示した。
LLMは、ドメイン固有の知識が不足しているため、医学的応用のような正確性を必要とする領域で苦労している。
PMC-LLaMAと呼ばれる医療応用に特化した強力なオープンソース言語モデルの構築手順について述べる。
論文 参考訳(メタデータ) (2023-04-27T18:29:05Z) - CDialog: A Multi-turn Covid-19 Conversation Dataset for Entity-Aware
Dialog Generation [18.047064216849204]
われわれは,CDialog と命名された Covid-19 病に関連する高品質な医療用ダイアログデータセットを公表した。
本稿では,CDialogデータセットに基づく新しい医用ダイアログシステムを提案する。
論文 参考訳(メタデータ) (2022-11-16T11:07:34Z) - "My nose is running.""Are you also coughing?": Building A Medical
Diagnosis Agent with Interpretable Inquiry Logics [80.55587329326046]
本稿では,DSMDの対話マネージャを実装するための,より解釈可能な意思決定プロセスを提案する。
推論を行うために、非常に透明なコンポーネントを持つモデルを考案する。
実験の結果,診断精度は7.7%,10.0%,3.0%向上した。
論文 参考訳(メタデータ) (2022-04-29T09:02:23Z) - QAConv: Question Answering on Informative Conversations [85.2923607672282]
ビジネスメールやパネルディスカッション,作業チャネルなど,情報的な会話に重点を置いています。
合計で、スパンベース、フリーフォーム、および回答不能な質問を含む34,204のQAペアを収集します。
論文 参考訳(メタデータ) (2021-05-14T15:53:05Z) - Where's the Question? A Multi-channel Deep Convolutional Neural Network
for Question Identification in Textual Data [83.89578557287658]
本稿では,実際の質問を分離する目的で,新しい多チャンネル深層畳み込みニューラルネットワークアーキテクチャであるQuest-CNNを提案する。
提案するニューラルネットワークと他のディープニューラルネットワークの総合的な性能比較分析を行った。
提案したQuest-CNNは、透析ケア設定におけるデータエントリレビュー対話のデータセットと一般的なドメインデータセットの両方において、最高のF1スコアを達成した。
論文 参考訳(メタデータ) (2020-10-15T15:11:22Z) - MedDG: An Entity-Centric Medical Consultation Dataset for Entity-Aware
Medical Dialogue Generation [86.38736781043109]
MedDGという12種類の消化器疾患に関連する大規模医用対話データセットを構築し,公開する。
MedDGデータセットに基づく2種類の医療対話タスクを提案する。1つは次のエンティティ予測であり、もう1つは医師の反応生成である。
実験結果から,プレトレイン言語モデルと他のベースラインは,両方のタスクに苦戦し,データセットの性能が劣ることがわかった。
論文 参考訳(メタデータ) (2020-10-15T03:34:33Z) - On the Generation of Medical Dialogues for COVID-19 [60.63485429268256]
新型コロナウイルス関連の症状を患ったり、危険因子に晒されたりする人は、医師に相談する必要がある。
医療専門家が不足しているため、多くの人がオンライン相談を受けることができない。
本研究の目的は、新型コロナウイルス関連の相談を提供する医療対話システムの構築である。
論文 参考訳(メタデータ) (2020-05-11T21:23:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。