論文の概要: anyECG-chat: A Generalist ECG-MLLM for Flexible ECG Input and Multi-Task Understanding
- arxiv url: http://arxiv.org/abs/2506.00942v1
- Date: Sun, 01 Jun 2025 10:17:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-05 01:42:09.234105
- Title: anyECG-chat: A Generalist ECG-MLLM for Flexible ECG Input and Multi-Task Understanding
- Title(参考訳): anyECG-chat:フレキシブルECG入力とマルチタスク理解のための汎用ECG-MLLM
- Authors: Haitao Li, Ziyu Li, Yiheng Mao, Ziyi Liu, Zhoujian Sun, Zhengxing Huang,
- Abstract要約: マルチモーダルな大言語モデル(MLLM)は、心電図(ECG)解析への関心を喚起している。
既存のECGにフォーカスしたMLLMは、レポート生成タスクに重点を置いており、多くの場合、単一の12リードの短いECG入力(10秒)に制限される。
動的長のECG入力と複数のECG入力をサポートする anyECG-chat モデルを提案する。
- 参考スコア(独自算出の注目度): 20.290531515033518
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The advent of multimodal large language models (MLLMs) has sparked interest in their application to electrocardiogram (ECG) analysis. However, existing ECG-focused MLLMs primarily focus on report generation tasks, often limited to single 12-lead, short-duration (10s) ECG inputs, thereby underutilizing the potential of MLLMs. To this end, we aim to develop a MLLM for ECG analysis that supports a broader range of tasks and more flexible ECG inputs. However, existing ECG-QA datasets are often monotonous. To address this gap, we first constructed the anyECG dataset, which encompasses a wide variety of tasks, including report generation, abnormal waveform localization, and open-ended question answering. In addition to standard hospital ECGs, we introduced long-duration reduced-lead ECGs for home environments and multiple ECG comparison scenarios commonly encountered in clinical practice. Furthermore, we propose the anyECG-chat model, which supports dynamic-length ECG inputs and multiple ECG inputs. We trained the model using a three-stage curriculum training recipe with the anyECG dataset. A comprehensive evaluation was conducted, demonstrating that anyECG-chat is capable of supporting various practical application scenarios, including not only common report generation tasks but also abnormal waveform localization for long-duration reduced-lead ECGs in home environments and comprehensive comparative analysis of multiple ECGs.
- Abstract(参考訳): マルチモーダル大言語モデル(MLLM)の出現は、心電図(ECG)解析への応用への関心を喚起している。
しかし、既存のECGにフォーカスしたMLLMは主にレポート生成タスクに重点を置いており、多くの場合、単一の12リードの短いECG入力に制限される。
そこで我々は,より広い範囲のタスクとより柔軟なECG入力をサポートするMLLM for ECG分析を開発することを目的とする。
しかし、既存のECG-QAデータセットはしばしば単調である。
このギャップに対処するために、我々はまずレポート生成、異常波形の局在化、オープンな質問応答を含む幅広いタスクを含むECGデータセットを構築した。
病院の標準心電図に加えて, 在宅環境における長期低リード心電図と, 臨床実習でよく見られる複数の心電図の比較シナリオも導入した。
さらに、動的長のECG入力と複数のECG入力をサポートする anyECG-chat モデルを提案する。
我々は,このモデルを,ECGデータセットを用いた3段階のカリキュラム学習レシピを用いて訓練した。
総合的な評価を行い, 共通報告生成タスクだけでなく, 家庭環境における長期縮小型心電図の異常波形定位や, 複数の心電図の総合的比較分析など, 様々な応用シナリオをサポートすることを実証した。
関連論文リスト
- From Token to Rhythm: A Multi-Scale Approach for ECG-Language Pretraining [22.214252217020174]
本稿では,マルチスケールECG-Language Pretraining(MELP)モデルを紹介する。
我々は、ゼロショットECG分類、線形探索、転送学習を含む、複数のタスクにわたる3つのパブリックECGデータセット上でMELPを評価する。
論文 参考訳(メタデータ) (2025-06-11T07:22:17Z) - Heartcare Suite: Multi-dimensional Understanding of ECG with Raw Multi-lead Signal Modeling [50.58126509704037]
医療スイート(Heartcare Suite)は、微細心電図(ECG)の理解のためのフレームワークである。
Heartcare-220Kは高品質で構造化され、包括的なマルチモーダルECGデータセットである。
Heartcare-Benchは、ECGシナリオにおける医療マルチモーダル大言語モデル(Med-MLLM)の最適化を導くためのベンチマークである。
論文 参考訳(メタデータ) (2025-06-06T07:56:41Z) - GEM: Empowering MLLM for Grounded ECG Understanding with Time Series and Images [43.65650710265957]
GEMは,第1回MLLM統合ECG時系列,第12回リードECG画像,地上および臨床のECG解釈のためのテキストである。
GEMは、3つのコアイノベーションを通じて機能的解析、エビデンス駆動推論、および臨床医のような診断プロセスを可能にする。
基礎心電図理解におけるMLLMの能力を評価するために,臨床動機付けのベンチマークであるグラウンドドECGタスクを提案する。
論文 参考訳(メタデータ) (2025-03-08T05:48:53Z) - Multimodal Lead-Specific Modeling of ECG for Low-Cost Pulmonary Hypertension Assessment [71.69065905466567]
低所得国や中所得国(LMIC)では,高度な診断ツールが不足しているため,肺高血圧症(PH)が頻繁に診断される。
我々は,大人口12L-ECGデータに基づいて事前学習したモデルであるLS-EMVAE(Lead-Specific Electrocardiogram Multimodal Variational Autoencoder)を提案する。
LS-EMVAEは、推論時に12L-ECGと6L-ECGの両方でより良い予測を行い、診断ツールが限られている領域や全くない領域において、同等の解となる。
論文 参考訳(メタデータ) (2025-03-03T16:16:38Z) - AnyECG: Foundational Models for Multitask Cardiac Analysis in Real-World Settings [34.078819572852446]
心電図(ECG)は急性心臓発作の検出に非常に敏感である。
本稿では,実世界のECGデータからロバストな表現を抽出するための基礎モデルであるAnyECGを紹介する。
論文 参考訳(メタデータ) (2024-11-17T17:32:58Z) - Teach Multimodal LLMs to Comprehend Electrocardiographic Images [10.577263066644194]
我々は、100万以上のサンプルからなる総合的なECGイメージインストラクションチューニングデータセットであるECGInstructを紹介する。
また,心電図の理解に適したMLLMであるPULSEを開発した。
実験の結果,PULSEは従来のMLLMよりも15%から30%の精度向上を実現した。
論文 参考訳(メタデータ) (2024-10-21T20:26:41Z) - An Electrocardiogram Foundation Model Built on over 10 Million Recordings with External Evaluation across Multiple Domains [17.809094003643523]
ECG Foundation Model (ECGFounder)は、Harvard-Emory ECG Databaseから150のラベルカテゴリを持つ1000万以上のECGをトレーニングしている。
ECGFounderは内部検証セットのエキスパートレベルのパフォーマンスを達成し、AUROCは80の診断で0.95を超えている。
微調整されたECGFounderは、人口統計分析、臨床イベント検出、心拍数横断診断においてベースラインモデルを上回っている。
論文 参考訳(メタデータ) (2024-10-05T12:12:02Z) - Electrocardiogram Report Generation and Question Answering via Retrieval-Augmented Self-Supervised Modeling [19.513904491604794]
ECG-ReGenは、ECG-to-textレポート生成と質問応答のための検索ベースのアプローチである。
事前学習と動的検索とLarge Language Model(LLM)ベースの改善を組み合わせることで、ECG-ReGenはECGデータと関連するクエリを効果的に分析する。
論文 参考訳(メタデータ) (2024-09-13T12:50:36Z) - MEIT: Multi-Modal Electrocardiogram Instruction Tuning on Large Language Models for Report Generation [41.324530807795256]
心電図(Electrocardiogram、ECG)は、心臓の状態をモニタリングするための主要な非侵襲的診断ツールである。
最近の研究は心電図データを用いた心臓状態の分類に集中しているが、心電図レポートの生成は見落としている。
LLMとマルチモーダル命令を用いてECGレポート生成に取り組む最初の試みであるMultimodal ECG Instruction Tuning (MEIT) フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-07T23:20:56Z) - PulseNet: Deep Learning ECG-signal classification using random
augmentation policy and continous wavelet transform for canines [46.09869227806991]
犬心電図(ECG)の評価には熟練した獣医が必要である。
心電図の解釈と診断支援のための獣医師の現在の利用状況は限られている。
犬の心電図配列を正常または異常と分類するためのディープ畳み込みニューラルネットワーク(CNN)アプローチを実装した。
論文 参考訳(メタデータ) (2023-05-17T09:06:39Z) - Generalizing electrocardiogram delineation: training convolutional
neural networks with synthetic data augmentation [63.51064808536065]
ECGのデライン化のための既存のデータベースは小さく、サイズやそれらが表す病態の配列に不足している。
まず、原データベースから抽出した基本セグメントのプールを与えられたECGトレースを確率的に合成し、その整合性のある合成トレースに配置するための一連のルールを考案した。
第二に、2つの新しいセグメンテーションに基づく損失関数が開発され、これは、正確な数の独立構造の予測を強制し、サンプル数の削減に焦点をあてて、より密接なセグメンテーション境界を創出することを目的としている。
論文 参考訳(メタデータ) (2021-11-25T10:11:41Z) - ECG-DelNet: Delineation of Ambulatory Electrocardiograms with Mixed
Quality Labeling Using Neural Networks [69.25956542388653]
ディープラーニング(DL)アルゴリズムは、学術的、産業的にも重くなっている。
セグメンテーションフレームワークにECGの検出とデライン化を組み込むことにより、低解釈タスクにDLをうまく適用できることを実証する。
このモデルは、PhyloNetのQTデータベースを使用して、105個の増幅ECG記録から訓練された。
論文 参考訳(メタデータ) (2020-05-11T16:29:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。