論文の概要: ECG-R1: Protocol-Guided and Modality-Agnostic MLLM for Reliable ECG Interpretation
- arxiv url: http://arxiv.org/abs/2602.04279v1
- Date: Wed, 04 Feb 2026 07:17:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-05 19:45:11.419365
- Title: ECG-R1: Protocol-Guided and Modality-Agnostic MLLM for Reliable ECG Interpretation
- Title(参考訳): ECG-R1:信頼できるECG解釈のためのプロトコルガイドおよびモダリティ非依存MLLM
- Authors: Jiarui Jin, Haoyu Wang, Xingliang Wu, Xiaocheng Fang, Xiang Lan, Zihan Wang, Deyun Zhang, Bo Liu, Yingying Zhang, Xian Wu, Hongyan Li, Shenda Hong,
- Abstract要約: 既存のマルチモーダル大言語モデル(MLLM)は、ECGの解釈には信頼できないままである。
ECG-R1は、信頼できるECG解釈のために設計されたMLLMの最初の推論である。
コードとデータはhrefhttp://ai.heartvoice.com.cn/ECG-R1hereで公開されている。
- 参考スコア(独自算出の注目度): 36.244601234085856
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Electrocardiography (ECG) serves as an indispensable diagnostic tool in clinical practice, yet existing multimodal large language models (MLLMs) remain unreliable for ECG interpretation, often producing plausible but clinically incorrect analyses. To address this, we propose ECG-R1, the first reasoning MLLM designed for reliable ECG interpretation via three innovations. First, we construct the interpretation corpus using \textit{Protocol-Guided Instruction Data Generation}, grounding interpretation in measurable ECG features and monograph-defined quantitative thresholds and diagnostic logic. Second, we present a modality-decoupled architecture with \textit{Interleaved Modality Dropout} to improve robustness and cross-modal consistency when either the ECG signal or ECG image is missing. Third, we present \textit{Reinforcement Learning with ECG Diagnostic Evidence Rewards} to strengthen evidence-grounded ECG interpretation. Additionally, we systematically evaluate the ECG interpretation capabilities of proprietary, open-source, and medical MLLMs, and provide the first quantitative evidence that severe hallucinations are widespread, suggesting that the public should not directly trust these outputs without independent verification. Code and data are publicly available at \href{https://github.com/PKUDigitalHealth/ECG-R1}{here}, and an online platform can be accessed at \href{http://ai.heartvoice.com.cn/ECG-R1/}{here}.
- Abstract(参考訳): 心電図 (ECG) は臨床診断に欠かせないツールであるが、既存の多モード大言語モデル (MLLM) はECGの解釈には信頼できないままであり、しばしば可塑性だが臨床的に正しくない分析を生んでいる。
そこで本研究では,3つのイノベーションを通じて,信頼性の高いECG解釈のためのMLLMを最初に提案するECG-R1を提案する。
まず,<textit{Protocol-Guided Instruction Data Generation} を用いた解釈コーパスを構築し,測定可能なECG特徴とモノグラフ定義量しきい値と診断ロジックの基底となる。
第2に、ECG信号またはECG画像の欠落時にロバスト性および相互整合性を改善するために、textit{Interleaved Modality Dropout} を用いたモダリティ分離アーキテクチャを提案する。
第3に,エビデンス基底のECG解釈を強化するために,ECG診断エビデンス・リワードを用いた「textit{Reinforcement Learning」を提案する。
さらに、我々は、プロプライエタリ、オープンソース、医療MLLMのECG解釈能力を体系的に評価し、重度の幻覚が広まるという最初の定量的証拠を提供する。
コードとデータは \href{https://github.com/PKUDigitalHealth/ECG-R1}{here} で公開されており、オンラインプラットフォームは \href{http://ai.heartvoice.com.cn/ECG-R1/}{here} でアクセスできる。
関連論文リスト
- Simulator and Experience Enhanced Diffusion Model for Comprehensive ECG Generation [52.19347532840774]
本稿では,心電図生成のための新しい生理シミュレータSE-Diffを提案する。
SE-Diffは、軽量常微分方程式(ODE)ベースのECGシミュレータをビートデコーダを介して拡散過程に統合する。
実世界のECGデータセットに対する大規模な実験により、SE-Diffは信号の忠実度とテキスト-ECGセマンティックアライメントの両方を改善している。
論文 参考訳(メタデータ) (2025-11-13T02:57:10Z) - UniECG: Understanding and Generating ECG in One Unified Model [26.641666246045133]
我々は、エビデンスベースのECG解釈とテキスト条件のECG生成タスクを同時に行うことができるECGの最初の統一モデルUniECGを提案する。
UniECGは、ユーザ入力に基づいてECGを自動で解釈または生成することを選択し、現在のECGモデルの能力境界を大幅に拡張することができる。
論文 参考訳(メタデータ) (2025-09-23T03:15:53Z) - ECG-aBcDe: Overcoming Model Dependence, Encoding ECG into a Universal Language for Any LLM [7.632459372363093]
大型言語モデル (LLMs) は心電図 (ECG) 解析において大きな可能性を秘めている。
現在の方法はモデル固有のECGエンコーダに悩まされており、LLM間の転送を妨げる。
我々は、ECG信号を任意のLLMで容易に解釈可能な普遍的なECG言語に変換する新しい符号化法ECG-aBcDeを紹介する。
論文 参考訳(メタデータ) (2025-09-16T03:41:02Z) - MEETI: A Multimodal ECG Dataset from MIMIC-IV-ECG with Signals, Images, Features and Interpretations [12.00096975933262]
心電図(ECG)は、非侵襲的不整脈、心筋虚血、伝導障害の診断を可能にする、現代の心血管ケアにおける基礎的な役割を担っている。
既存のECGデータセットの多くは、単一のモダリティデータのみを提供するか、あるいは少なくとも2つのモダリティを提供するため、さまざまなECG情報を現実世界の設定で理解し統合することのできるモデルを構築するのが難しくなる。
我々は、原波形データ、高解像度プロット画像、および大規模言語モデルによって生成された詳細なテキスト解釈を同期する最初の大規模ECGデータセットであるMEETIを紹介する。
論文 参考訳(メタデータ) (2025-07-21T05:32:44Z) - Heartcare Suite: Multi-dimensional Understanding of ECG with Raw Multi-lead Signal Modeling [50.58126509704037]
医療スイート(Heartcare Suite)は、微細心電図(ECG)の理解のためのフレームワークである。
Heartcare-220Kは高品質で構造化され、包括的なマルチモーダルECGデータセットである。
Heartcare-Benchは、ECGシナリオにおける医療マルチモーダル大言語モデル(Med-MLLM)の最適化を導くためのベンチマークである。
論文 参考訳(メタデータ) (2025-06-06T07:56:41Z) - GEM: Empowering MLLM for Grounded ECG Understanding with Time Series and Images [44.50428701650495]
GEMは,第1回MLLM統合ECG時系列,第12回リードECG画像,地上および臨床のECG解釈のためのテキストである。
GEMは、3つのコアイノベーションを通じて機能的解析、エビデンス駆動推論、および臨床医のような診断プロセスを可能にする。
基礎心電図理解におけるMLLMの能力を評価するために,臨床動機付けのベンチマークであるグラウンドドECGタスクを提案する。
論文 参考訳(メタデータ) (2025-03-08T05:48:53Z) - Learning General Representation of 12-Lead Electrocardiogram with a Joint-Embedding Predictive Architecture [0.0]
本稿では,12誘導ECG分析のための自己教師型学習モデルECG-JEPAを紹介する。
隠れた潜在空間で予測することで、ECGデータのセマンティック表現を学習する。
ECG-JEPAは、ECG分類や特徴予測を含む様々な下流タスクで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-10-11T06:30:48Z) - ECG-FM: An Open Electrocardiogram Foundation Model [3.8270632390229777]
本稿では,ECG分析のためのオープン基盤モデルであるECG-FMについて述べる。
ECG-FMは、コントラストと生成的自己教師付き学習のハイブリッドアプローチを用いて事前訓練されたトランスフォーマーベースのモデルである。
我々は,ECG-FMがロバストで,ラベル効率が高く,機能的に識別可能であることを確認した。
論文 参考訳(メタデータ) (2024-08-09T17:06:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。