論文の概要: ECG-Expert-QA: A Benchmark for Evaluating Medical Large Language Models in Heart Disease Diagnosis
- arxiv url: http://arxiv.org/abs/2502.17475v3
- Date: Mon, 07 Apr 2025 09:59:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-08 14:08:03.737678
- Title: ECG-Expert-QA: A Benchmark for Evaluating Medical Large Language Models in Heart Disease Diagnosis
- Title(参考訳): ECG-Expert-QA : 心臓疾患診断における医学的大言語モデルの評価基準
- Authors: Xu Wang, Jiaju Kang, Puyu Han, Yubao Zhao, Qian Liu, Liwenfei He, Lingqiong Zhang, Lingyun Dai, Yongcheng Wang, Jie Tao,
- Abstract要約: ECG-Expert-QAは、心電図(ECG)の解釈における診断能力を評価するための包括的なデータセットである。
実際の臨床心電図データと、体系的に生成された合成ケースを組み合わせることで、12の必須の診断タスクをカバーしている。
主要なイノベーションは、対話型医療AIシステムの開発を可能にするマルチターン対話のサポートである。
- 参考スコア(独自算出の注目度): 8.059062779882554
- License:
- Abstract: We present ECG-Expert-QA, a comprehensive multimodal dataset for evaluating diagnostic capabilities in electrocardiogram (ECG) interpretation. It combines real-world clinical ECG data with systematically generated synthetic cases, covering 12 essential diagnostic tasks and totaling 47,211 expert-validated QA pairs. These encompass diverse clinical scenarios, from basic rhythm recognition to complex diagnoses involving rare conditions and temporal changes. A key innovation is the support for multi-turn dialogues, enabling the development of conversational medical AI systems that emulate clinician-patient or interprofessional interactions. This allows for more realistic assessment of AI models' clinical reasoning, diagnostic accuracy, and knowledge integration. Constructed through a knowledge-guided framework with strict quality control, ECG-Expert-QA ensures linguistic and clinical consistency, making it a high-quality resource for advancing AI-assisted ECG interpretation. It challenges models with tasks like identifying subtle ischemic changes and interpreting complex arrhythmias in context-rich scenarios. To promote research transparency and collaboration, the dataset, accompanying code, and prompts are publicly released at https://github.com/Zaozzz/ECG-Expert-QA
- Abstract(参考訳): 心電図(ECG)の解釈における診断能力を評価するための総合的マルチモーダルデータセットECG-Expert-QAを提案する。
実際の臨床ECGデータと体系的に生成された合成ケースを組み合わせ、12の必須診断タスクをカバーし、47,211人の専門家によるQAペアを集計する。
これらは、基本的なリズム認識から、稀な状態や時間的変化を含む複雑な診断まで、さまざまな臨床シナリオを含んでいる。
重要なイノベーションはマルチターン対話のサポートであり、臨床医と患者または専門家間の相互作用をエミュレートする会話型医療AIシステムの開発を可能にする。
これにより、AIモデルの臨床的推論、診断精度、知識統合をより現実的に評価することができる。
厳格な品質管理を備えた知識誘導フレームワークを通じて構築されたECG-Expert-QAは、言語的および臨床的整合性を確保し、AI支援ECG解釈を促進するための高品質なリソースとなる。
微妙な虚血変化の特定や、コンテキストリッチなシナリオにおける複雑な不整脈の解釈といったタスクでモデルに挑戦する。
研究の透明性とコラボレーションを促進するため、データセット、付随するコード、プロンプトはhttps://github.com/Zaozzz/ECG-Expert-QAで公開されている。
関連論文リスト
- Medchain: Bridging the Gap Between LLM Agents and Clinical Practice through Interactive Sequential Benchmarking [58.25862290294702]
臨床ワークフローの5つの重要な段階をカバーする12,163の臨床症例のデータセットであるMedChainを提示する。
フィードバック機構とMCase-RAGモジュールを統合したAIシステムであるMedChain-Agentも提案する。
論文 参考訳(メタデータ) (2024-12-02T15:25:02Z) - Clinical Evaluation of Medical Image Synthesis: A Case Study in Wireless Capsule Endoscopy [63.39037092484374]
本研究は,人工知能(AI)モデルを用いた医用合成データ生成の臨床評価に焦点を当てた。
本論文は,a) 医用専門家による合成画像の体系的評価のためのプロトコルを提示し,b) 高分解能WCE画像合成のための新しい変分オートエンコーダモデルであるTIDE-IIを評価する。
その結果、TIDE-IIは臨床的に関連性のあるWCE画像を生成し、データの不足に対処し、診断ツールの強化に役立つことがわかった。
論文 参考訳(メタデータ) (2024-10-31T19:48:50Z) - Electrocardiogram-Language Model for Few-Shot Question Answering with Meta Learning [19.513904491604794]
心電図(ECG)の解釈には専門知識が必要である。
本研究は,数発のECG質問応答のための新しいマルチモーダルメタラーニング手法を提案する。
論文 参考訳(メタデータ) (2024-10-18T13:48:01Z) - GMAI-MMBench: A Comprehensive Multimodal Evaluation Benchmark Towards General Medical AI [67.09501109871351]
LVLM(Large Vision-Language Model)は、画像、テキスト、生理学的信号などの多様なデータタイプを扱うことができる。
GMAI-MMBenchは、よく分類されたデータ構造と、これまででもっとも包括的な一般医療用AIベンチマークである。
38の医療画像モダリティ、18の臨床関連タスク、18の部門、視覚質問回答(VQA)フォーマットの4つの知覚的粒度からなる284のデータセットで構成されている。
論文 参考訳(メタデータ) (2024-08-06T17:59:21Z) - medIKAL: Integrating Knowledge Graphs as Assistants of LLMs for Enhanced Clinical Diagnosis on EMRs [13.806201934732321]
medIKALは、診断能力を高めるために、LLM(Large Language Models)と知識グラフ(KG)を組み合わせる。
medIKALは、そのタイプに基づいて医療記録のエンティティに重み付けされた重要性を割り当て、KG内の候補疾患の正確な局在を可能にする。
新たに導入した中国のEMRデータセットの広範な実験により,medIKALの有効性を検証した。
論文 参考訳(メタデータ) (2024-06-20T13:56:52Z) - AI Hospital: Benchmarking Large Language Models in a Multi-agent Medical Interaction Simulator [69.51568871044454]
我々は,emphDoctorをプレイヤとして,NPC間の動的医療相互作用をシミュレーションするフレームワークであるtextbfAI Hospitalを紹介した。
この設定は臨床シナリオにおけるLCMの現実的な評価を可能にする。
高品質な中国の医療記録とNPCを利用したマルチビュー医療評価ベンチマークを開発した。
論文 参考訳(メタデータ) (2024-02-15T06:46:48Z) - ChatRadio-Valuer: A Chat Large Language Model for Generalizable
Radiology Report Generation Based on Multi-institution and Multi-system Data [115.0747462486285]
ChatRadio-Valuerは、一般化可能な表現を学習する自動放射線学レポート生成のための調整されたモデルである。
本研究で利用した臨床データセットは,textbf332,673の顕著な総計を含む。
ChatRadio-Valuerは、最先端のモデル、特にChatGPT(GPT-3.5-Turbo)やGPT-4などより一貫して優れている。
論文 参考訳(メタデータ) (2023-10-08T17:23:17Z) - Leveraging Medical Knowledge Graphs Into Large Language Models for Diagnosis Prediction: Design and Application Study [6.10474409373543]
自動診断におけるLarge Language Models (LLMs) の習熟度を高めるための革新的なアプローチを提案する。
我々は,国立医科大学統一医療言語システム(UMLS)からKGを抽出した。
我々のアプローチは説明可能な診断経路を提供し、AIによる診断決定支援システムの実現に近づいている。
論文 参考訳(メタデータ) (2023-08-28T06:05:18Z) - ECG-QA: A Comprehensive Question Answering Dataset Combined With
Electrocardiogram [12.167108953668464]
ECG-QAは、ECG分析用に特別に設計された最初のデータセットである。
データセットには70の質問テンプレートが含まれており、幅広い臨床関連ECGトピックをカバーしている。
我々のデータセットには、異なる2つのECGの比較分析を必要とするものを含む、多様なECG解釈質問が含まれている。
論文 参考訳(メタデータ) (2023-06-21T07:14:57Z) - Automated Cardiovascular Record Retrieval by Multimodal Learning between
Electrocardiogram and Clinical Report [28.608260758775316]
本稿では,Large Language Models (LLM) と Vision-Transformer (ViT) モデルにおける最近のブレークスルーを活用し,ECGの解釈に新たなアプローチを導入する。
入力ECGデータに基づいて,最も類似した症例を自動的に同定する手法を提案する。
本研究は,未開発地域において診断サービスを提供する上で重要な資源となる可能性がある。
論文 参考訳(メタデータ) (2023-04-13T06:32:25Z) - Inheritance-guided Hierarchical Assignment for Clinical Automatic
Diagnosis [50.15205065710629]
臨床診断は、臨床ノートに基づいて患者に診断符号を割り当てることを目的としており、臨床意思決定において重要な役割を担っている。
本稿では,臨床自動診断のための継承誘導階層と共起グラフの伝播を組み合わせた新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-01-27T13:16:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。