論文の概要: MedDG: An Entity-Centric Medical Consultation Dataset for Entity-Aware
Medical Dialogue Generation
- arxiv url: http://arxiv.org/abs/2010.07497v2
- Date: Sun, 31 Jul 2022 06:04:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-07 02:50:03.102014
- Title: MedDG: An Entity-Centric Medical Consultation Dataset for Entity-Aware
Medical Dialogue Generation
- Title(参考訳): meddg:エンティティ対応医療対話生成のためのエンティティ中心医療相談データセット
- Authors: Wenge Liu, Jianheng Tang, Yi Cheng, Wenjie Li, Yefeng Zheng, Xiaodan
Liang
- Abstract要約: MedDGという12種類の消化器疾患に関連する大規模医用対話データセットを構築し,公開する。
MedDGデータセットに基づく2種類の医療対話タスクを提案する。1つは次のエンティティ予測であり、もう1つは医師の反応生成である。
実験結果から,プレトレイン言語モデルと他のベースラインは,両方のタスクに苦戦し,データセットの性能が劣ることがわかった。
- 参考スコア(独自算出の注目度): 86.38736781043109
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Developing conversational agents to interact with patients and provide
primary clinical advice has attracted increasing attention due to its huge
application potential, especially in the time of COVID-19 Pandemic. However,
the training of end-to-end neural-based medical dialogue system is restricted
by an insufficient quantity of medical dialogue corpus. In this work, we make
the first attempt to build and release a large-scale high-quality Medical
Dialogue dataset related to 12 types of common Gastrointestinal diseases named
MedDG, with more than 17K conversations collected from the online health
consultation community. Five different categories of entities, including
diseases, symptoms, attributes, tests, and medicines, are annotated in each
conversation of MedDG as additional labels. To push forward the future research
on building expert-sensitive medical dialogue system, we proposes two kinds of
medical dialogue tasks based on MedDG dataset. One is the next entity
prediction and the other is the doctor response generation. To acquire a clear
comprehension on these two medical dialogue tasks, we implement several
state-of-the-art benchmarks, as well as design two dialogue models with a
further consideration on the predicted entities. Experimental results show that
the pre-train language models and other baselines struggle on both tasks with
poor performance in our dataset, and the response quality can be enhanced with
the help of auxiliary entity information. From human evaluation, the simple
retrieval model outperforms several state-of-the-art generative models,
indicating that there still remains a large room for improvement on generating
medically meaningful responses.
- Abstract(参考訳): 患者と対話し、主要な臨床アドバイスを提供するための会話エージェントの開発は、特にCOVID-19パンデミックの時代に、その大きな応用可能性のために注目を集めている。
しかし、エンドツーエンドの医療対話システムの訓練は、不十分な量の医療対話コーパスによって制限される。
本研究では,オンライン・ヘルス・コンサルテーション・コミュニティから1万7千以上の会話を収集し,meddgと呼ばれる12種類の共通消化器疾患に関連する大規模高品質医療対話データセットを構築し,公開する試みを行った。
疾患、症状、属性、検査、薬品を含む5つの異なるカテゴリーのエンティティは、追加ラベルとしてMedDGの会話毎に注釈付けされる。
専門家に敏感な医療対話システムの構築に向けた今後の研究を進めるために,MedDGデータセットに基づく2種類の医療対話タスクを提案する。
1つは次のエンティティ予測であり、もう1つは医師の反応生成である。
これら2つの医療対話タスクを明確に理解するために,最先端のベンチマークを複数実装するとともに,予測された実体を考慮に入れた2つの対話モデルの設計を行った。
実験の結果,プレトレイン言語モデルやベースラインは,データセットの性能が劣るタスクと,補助的なエンティティ情報を用いて応答品質を向上させることができることがわかった。
人的評価から, 簡易検索モデルは最先端生成モデルよりも優れており, 医学的に有意義な応答を生成するための改善の余地が依然として残っていることを示唆する。
関連論文リスト
- MediTOD: An English Dialogue Dataset for Medical History Taking with Comprehensive Annotations [23.437292621092823]
本研究は,医学史研究のための英語における医師と患者との対話のデータセットであるMedictoDを紹介する。
医療領域に合わせたアンケートに基づくラベリング手法を考案する。
そして、医療専門家は高品質の包括的なアノテーションでデータセットを作成する。
論文 参考訳(メタデータ) (2024-10-18T06:38:22Z) - Medical Vision-Language Pre-Training for Brain Abnormalities [96.1408455065347]
本稿では,PubMedなどの公共リソースから,医用画像・テキスト・アライメントデータを自動的に収集する方法を示す。
特に,まず大きな脳画像テキストデータセットを収集することにより,事前学習プロセスの合理化を図るパイプラインを提案する。
また,医療領域におけるサブフィギュアをサブキャプションにマッピングするというユニークな課題についても検討した。
論文 参考訳(メタデータ) (2024-04-27T05:03:42Z) - Customizing General-Purpose Foundation Models for Medical Report
Generation [64.31265734687182]
ラベル付き医用画像-レポートペアの不足は、ディープニューラルネットワークや大規模ニューラルネットワークの開発において大きな課題となっている。
本稿では,コンピュータビジョンと自然言語処理の基盤モデル (FM) として,市販の汎用大規模事前学習モデルのカスタマイズを提案する。
論文 参考訳(メタデータ) (2023-06-09T03:02:36Z) - Medical Dialogue Generation via Dual Flow Modeling [9.328694317877169]
医療対話システム(MDS)は、患者に診断や処方薬などの医療サービスを提供することを目的としている。
これまでの研究は主に、上記医療機関を重要な対話履歴情報として抽出することでこの問題に対処した。
本研究は, 医療機関と医師の対話行動の推移を各ターンで捉えることも重要であると論じる。
論文 参考訳(メタデータ) (2023-05-29T14:23:34Z) - CDialog: A Multi-turn Covid-19 Conversation Dataset for Entity-Aware
Dialog Generation [18.047064216849204]
われわれは,CDialog と命名された Covid-19 病に関連する高品質な医療用ダイアログデータセットを公表した。
本稿では,CDialogデータセットに基づく新しい医用ダイアログシステムを提案する。
論文 参考訳(メタデータ) (2022-11-16T11:07:34Z) - Medical Dialogue Response Generation with Pivotal Information Recalling [27.351688914399013]
本稿では,Pivotal Information Recalling (MedPIR) を用いた医療応答生成モデルを提案する。
MedPIRは知識対応対話グラフエンコーダとリコール強化ジェネレータの2つのコンポーネント上に構築されている。
2つの大規模医療対話データセットによる実験結果から,MedPIRはBLEUスコアと医療機関F1測定において,強いベースラインを上回ります。
論文 参考訳(メタデータ) (2022-06-17T08:11:10Z) - A Benchmark for Automatic Medical Consultation System: Frameworks, Tasks
and Datasets [70.32630628211803]
本稿では,医師と患者との対話理解とタスク指向インタラクションという,医療相談の自動化を支援する2つの枠組みを提案する。
マルチレベルな微粒なアノテーションを付加した新しい大規模医療対話データセットが導入された。
本稿では,各タスクに対するベンチマーク結果のセットを報告し,データセットのユーザビリティを示し,今後の研究のベースラインを設定する。
論文 参考訳(メタデータ) (2022-04-19T16:43:21Z) - M^2-MedDialog: A Dataset and Benchmarks for Multi-domain Multi-service
Medical Dialogues [25.58066103487436]
医療対話システム(MDS)は、様々な専門的な医療サービスを持つ医師や患者を支援することを目的としている。
大規模な対話には、複数の医療サービスときめ細かい医療ラベルの両方が含まれているようなデータセットはありません。
まずM2-MedDialog(M2-MedDialog)データベースを構築する。
論文 参考訳(メタデータ) (2021-09-01T15:24:54Z) - Semi-Supervised Variational Reasoning for Medical Dialogue Generation [70.838542865384]
医療対話生成には,患者の状態と医師の行動の2つの重要な特徴がある。
医療対話生成のためのエンドツーエンドの変分推論手法を提案する。
行動分類器と2つの推論検出器から構成される医師政策ネットワークは、拡張推論能力のために提案される。
論文 参考訳(メタデータ) (2021-05-13T04:14:35Z) - On the Generation of Medical Dialogues for COVID-19 [60.63485429268256]
新型コロナウイルス関連の症状を患ったり、危険因子に晒されたりする人は、医師に相談する必要がある。
医療専門家が不足しているため、多くの人がオンライン相談を受けることができない。
本研究の目的は、新型コロナウイルス関連の相談を提供する医療対話システムの構築である。
論文 参考訳(メタデータ) (2020-05-11T21:23:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。