論文の概要: M^2-MedDialog: A Dataset and Benchmarks for Multi-domain Multi-service
Medical Dialogues
- arxiv url: http://arxiv.org/abs/2109.00430v1
- Date: Wed, 1 Sep 2021 15:24:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-02 14:31:58.338152
- Title: M^2-MedDialog: A Dataset and Benchmarks for Multi-domain Multi-service
Medical Dialogues
- Title(参考訳): m^2-meddialog:マルチドメインマルチサービス医療対話のためのデータセットとベンチマーク
- Authors: Guojun Yan and Jiahuan Pei and Pengjie Ren and Zhumin Chen and
Zhaochun Ren and Huasheng Liang
- Abstract要約: 医療対話システム(MDS)は、様々な専門的な医療サービスを持つ医師や患者を支援することを目的としている。
大規模な対話には、複数の医療サービスときめ細かい医療ラベルの両方が含まれているようなデータセットはありません。
まずM2-MedDialog(M2-MedDialog)データベースを構築する。
- 参考スコア(独自算出の注目度): 25.58066103487436
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Medical dialogue systems (MDSs) aim to assist doctors and patients with a
range of professional medical services, i.e., diagnosis, consultation, and
treatment. However, one-stop MDS is still unexplored because: (1) no dataset
has so large-scale dialogues contains both multiple medical services and
fine-grained medical labels (i.e., intents, slots, values); (2) no model has
addressed a MDS based on multiple-service conversations in a unified framework.
In this work, we first build a Multiple-domain Multiple-service medical
dialogue (M^2-MedDialog)dataset, which contains 1,557 conversations between
doctors and patients, covering 276 types of diseases, 2,468 medical entities,
and 3 specialties of medical services. To the best of our knowledge, it is the
only medical dialogue dataset that includes both multiple medical services and
fine-grained medical labels. Then, we formulate a one-stop MDS as a
sequence-to-sequence generation problem. We unify a MDS with causal language
modeling and conditional causal language modeling, respectively. Specifically,
we employ several pretrained models (i.e., BERT-WWM, BERT-MED, GPT2, and MT5)
and their variants to get benchmarks on M^2-MedDialog dataset. We also propose
pseudo labeling and natural perturbation methods to expand M2-MedDialog dataset
and enhance the state-of-the-art pretrained models. We demonstrate the results
achieved by the benchmarks so far through extensive experiments on
M2-MedDialog. We release the dataset, the code, as well as the evaluation
scripts to facilitate future research in this important research direction.
- Abstract(参考訳): 医療対話システム(MDS)は、専門的な医療サービス(診断、相談、治療など)を扱う医師や患者を支援することを目的としている。
1つのデータセットには、複数の医療サービスと詳細な医療ラベル(インテント、スロット、値)の両方が含まれており、(2)統合されたフレームワークにおける複数のサービス会話に基づくMDSに対処するモデルは存在しない。
本研究は、まず、医師と患者との1,557件の会話を含むマルチドメイン医療対話(M^2-MedDialog)データセットを構築し、276種類の疾患、2,468の医療機関、および3種類の医療サービスをカバーした。
私たちの知る限りでは、複数の医療サービスときめ細かい医療ラベルの両方を含む唯一の医療対話データセットです。
次に、シーケンス・ツー・シーケンス生成問題としてワンストップMDSを定式化する。
我々は,MDSにそれぞれ因果言語モデリングと条件付き因果言語モデリングを統合する。
具体的には、事前訓練されたモデル(BERT-WWM、BERT-MED、GPT2、MT5)とそれらの変種を用いて、M^2-MedDialogデータセットのベンチマークを取得する。
また,m2-meddialogデータセットの拡張と最先端事前学習モデルの拡張のために,擬似ラベリングと自然摂動法を提案する。
M2-MedDialogに関する広範な実験を通じて,これまでのベンチマークの結果を実証した。
我々は、この重要な研究方向の今後の研究を促進するために、データセット、コード、および評価スクリプトをリリースする。
関連論文リスト
- MediTOD: An English Dialogue Dataset for Medical History Taking with Comprehensive Annotations [23.437292621092823]
本研究は,医学史研究のための英語における医師と患者との対話のデータセットであるMedictoDを紹介する。
医療領域に合わせたアンケートに基づくラベリング手法を考案する。
そして、医療専門家は高品質の包括的なアノテーションでデータセットを作成する。
論文 参考訳(メタデータ) (2024-10-18T06:38:22Z) - RuleAlign: Making Large Language Models Better Physicians with Diagnostic Rule Alignment [54.91736546490813]
本稿では,大規模言語モデルと特定の診断規則との整合性を考慮したルールアラインフレームワークを提案する。
患者と医師間の規則に基づくコミュニケーションを含む医療対話データセットを開発した。
実験の結果,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2024-08-22T17:44:40Z) - Towards Generalist Foundation Model for Radiology by Leveraging
Web-scale 2D&3D Medical Data [66.9359934608229]
この研究はRadFMと呼ばれるRadlogy Foundation Modelの開発を開始することを目的としている。
われわれの知る限りでは、これは2Dスキャンと3Dスキャンによる、最初の大規模で高品質な医療用ビジュアル言語データセットである。
本稿では,モダリティ認識,疾患診断,視覚的質問応答,レポート生成,合理的診断の5つのタスクからなる新しい評価ベンチマークRadBenchを提案する。
論文 参考訳(メタデータ) (2023-08-04T17:00:38Z) - Med-Flamingo: a Multimodal Medical Few-shot Learner [58.85676013818811]
医療領域に適応したマルチモーダル・数ショット学習者であるMed-Flamingoを提案する。
OpenFlamingo-9Bに基づいて、出版物や教科書からの医療画像テキストデータのペア化とインターリーブ化を継続する。
本研究は,医療用VQA(ジェネレーティブ医療用VQA)の最初の人間評価である。
論文 参考訳(メタデータ) (2023-07-27T20:36:02Z) - Medical Dialogue Generation via Dual Flow Modeling [9.328694317877169]
医療対話システム(MDS)は、患者に診断や処方薬などの医療サービスを提供することを目的としている。
これまでの研究は主に、上記医療機関を重要な対話履歴情報として抽出することでこの問題に対処した。
本研究は, 医療機関と医師の対話行動の推移を各ターンで捉えることも重要であると論じる。
論文 参考訳(メタデータ) (2023-05-29T14:23:34Z) - CDialog: A Multi-turn Covid-19 Conversation Dataset for Entity-Aware
Dialog Generation [18.047064216849204]
われわれは,CDialog と命名された Covid-19 病に関連する高品質な医療用ダイアログデータセットを公表した。
本稿では,CDialogデータセットに基づく新しい医用ダイアログシステムを提案する。
論文 参考訳(メタデータ) (2022-11-16T11:07:34Z) - "My nose is running.""Are you also coughing?": Building A Medical
Diagnosis Agent with Interpretable Inquiry Logics [80.55587329326046]
本稿では,DSMDの対話マネージャを実装するための,より解釈可能な意思決定プロセスを提案する。
推論を行うために、非常に透明なコンポーネントを持つモデルを考案する。
実験の結果,診断精度は7.7%,10.0%,3.0%向上した。
論文 参考訳(メタデータ) (2022-04-29T09:02:23Z) - MedDG: An Entity-Centric Medical Consultation Dataset for Entity-Aware
Medical Dialogue Generation [86.38736781043109]
MedDGという12種類の消化器疾患に関連する大規模医用対話データセットを構築し,公開する。
MedDGデータセットに基づく2種類の医療対話タスクを提案する。1つは次のエンティティ予測であり、もう1つは医師の反応生成である。
実験結果から,プレトレイン言語モデルと他のベースラインは,両方のタスクに苦戦し,データセットの性能が劣ることがわかった。
論文 参考訳(メタデータ) (2020-10-15T03:34:33Z) - On the Generation of Medical Dialogues for COVID-19 [60.63485429268256]
新型コロナウイルス関連の症状を患ったり、危険因子に晒されたりする人は、医師に相談する必要がある。
医療専門家が不足しているため、多くの人がオンライン相談を受けることができない。
本研究の目的は、新型コロナウイルス関連の相談を提供する医療対話システムの構築である。
論文 参考訳(メタデータ) (2020-05-11T21:23:43Z) - MedDialog: Two Large-scale Medical Dialogue Datasets [27.619211324563498]
我々はMedDialog-ENとMedDialog-CNという2つの大規模医療対話データセットを構築した。
MedDialog-ENは、患者と医師間の0.3万の会話と0.5万の発話を含む、英国のデータセットである。
MedDialog-CNは、1100万の会話と400万の発話を含む中国のデータセットである。
論文 参考訳(メタデータ) (2020-04-07T13:07:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。