論文の概要: DiagECG: An LLM-Driven Framework for Diagnostic Reasoning via Discretized ECG Tokenization
- arxiv url: http://arxiv.org/abs/2508.15338v1
- Date: Thu, 21 Aug 2025 08:13:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-22 16:26:46.235518
- Title: DiagECG: An LLM-Driven Framework for Diagnostic Reasoning via Discretized ECG Tokenization
- Title(参考訳): DiagECG: 離散化ECGトークン化による診断推論のためのLLM駆動フレームワーク
- Authors: Jinning Yang, Wen Shi,
- Abstract要約: 本稿では,時系列と言語モデリングを統合した新しいフレームワークであるDiagECGを紹介する。
本手法は,リード非依存エンコーダと量子化モジュールを用いて,連続ECG埋め込みをシンボリックトークンに識別する。
- 参考スコア(独自算出の注目度): 0.7550566004119158
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Electrocardiography plays a central role in cardiovascular diagnostics, yet existing automated approaches often struggle to generalize across clinical tasks and offer limited support for open-ended reasoning. We present DiagECG, a novel framework that integrates time-series and language modeling by enabling large language models to process 12-lead ECG signals for clinical text generation tasks. Our approach discretizes continuous ECG embeddings into symbolic tokens using a lead-independent encoder and quantization module. These tokens are then used to extend the vocabulary of LLM, allowing the model to handle both ECG and natural language inputs in a unified manner. To bridge the modality gap, we pretrain the model on an autoregressive ECG forecasting task, enabling the LLM to model temporal dynamics using its native language modeling capabilities. Finally, we perform instruction tuning on both ECG question answering and diagnostic report generation. Without modifying the core model, DiagECG achieves strong performance across tasks while maintaining generalization to out-of-distribution settings. Extensive experiments demonstrate the effectiveness of each component and highlight the potential of integrating symbolic ECG representations into LLMs for medical reasoning.
- Abstract(参考訳): 心電図は心臓血管診断において中心的な役割を担っているが、既存の自動的アプローチは、臨床タスク全体にわたって一般化し、オープンエンド推論の限られたサポートを提供するのに苦慮することが多い。
臨床用テキスト生成タスクにおいて,大言語モデルで12リードのECG信号を処理できるようにすることにより,時系列と言語モデリングを統合した新しいフレームワークであるDiagECGを提案する。
本手法は,リード非依存エンコーダと量子化モジュールを用いて,連続ECG埋め込みをシンボリックトークンに識別する。
これらのトークンはLLMの語彙を拡張するために使用され、ECGと自然言語の両方を統一的に扱うことができる。
モダリティギャップを埋めるため、自動回帰ECG予測タスクでモデルを事前訓練し、LLMがそのネイティブ言語モデリング機能を用いて時間的ダイナミクスをモデル化できるようにする。
最後に,ECG質問応答と診断レポート生成の双方に対して,命令チューニングを行う。
コアモデルを変更することなく、DiagECGはタスク間で強力なパフォーマンスを実現し、配布外設定への一般化を維持している。
広範囲にわたる実験は、各コンポーネントの有効性を示し、医学的推論のために象徴的なECG表現をLLMに統合する可能性を強調している。
関連論文リスト
- From Token to Rhythm: A Multi-Scale Approach for ECG-Language Pretraining [22.214252217020174]
本稿では,マルチスケールECG-Language Pretraining(MELP)モデルを紹介する。
我々は、ゼロショットECG分類、線形探索、転送学習を含む、複数のタスクにわたる3つのパブリックECGデータセット上でMELPを評価する。
論文 参考訳(メタデータ) (2025-06-11T07:22:17Z) - Heartcare Suite: Multi-dimensional Understanding of ECG with Raw Multi-lead Signal Modeling [50.58126509704037]
医療スイート(Heartcare Suite)は、微細心電図(ECG)の理解のためのフレームワークである。
Heartcare-220Kは高品質で構造化され、包括的なマルチモーダルECGデータセットである。
Heartcare-Benchは、ECGシナリオにおける医療マルチモーダル大言語モデル(Med-MLLM)の最適化を導くためのベンチマークである。
論文 参考訳(メタデータ) (2025-06-06T07:56:41Z) - PhysLLM: Harnessing Large Language Models for Cross-Modal Remote Physiological Sensing [49.243031514520794]
LLM(Large Language Models)は、テキスト中心の設計のため、長距離信号の取得に優れる。
PhysLLMは最先端の精度とロバスト性を実現し、照明のバリエーションや動きのシナリオにまたがる優れた一般化を示す。
論文 参考訳(メタデータ) (2025-05-06T15:18:38Z) - A CNN-based Local-Global Self-Attention via Averaged Window Embeddings for Hierarchical ECG Analysis [1.0844302367985357]
本稿では,この制限に対処するため,新しいLGA(Local-Global Attention ECG)モデルを提案する。
提案手法は,重なり合う畳み込みウィンドウから得られる埋め込みを平均化することでクエリを抽出する。
CODE-15データセットで行った実験は、LGA-ECGが最先端モデルより優れていることを示した。
論文 参考訳(メタデータ) (2025-04-13T01:21:18Z) - GEM: Empowering MLLM for Grounded ECG Understanding with Time Series and Images [43.65650710265957]
GEMは,第1回MLLM統合ECG時系列,第12回リードECG画像,地上および臨床のECG解釈のためのテキストである。
GEMは、3つのコアイノベーションを通じて機能的解析、エビデンス駆動推論、および臨床医のような診断プロセスを可能にする。
基礎心電図理解におけるMLLMの能力を評価するために,臨床動機付けのベンチマークであるグラウンドドECGタスクを提案する。
論文 参考訳(メタデータ) (2025-03-08T05:48:53Z) - Electrocardiogram-Language Model for Few-Shot Question Answering with Meta Learning [19.513904491604794]
心電図(ECG)の解釈には専門知識が必要である。
本研究は,数発のECG質問応答のための新しいマルチモーダルメタラーニング手法を提案する。
論文 参考訳(メタデータ) (2024-10-18T13:48:01Z) - MEIT: Multimodal Electrocardiogram Instruction Tuning on Large Language Models for Report Generation [28.35107188450758]
心電図(Electrocardiogram、ECG)は、心臓の状態をモニタリングするための主要な非侵襲的診断ツールである。
最近の研究は心電図データを用いた心臓状態の分類に集中しているが、心電図レポートの生成は見落としている。
LLMとマルチモーダル命令を用いてECGレポート生成に取り組む最初の試みであるMultimodal ECG Instruction Tuning (MEIT) フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-07T23:20:56Z) - ECG-CL: A Comprehensive Electrocardiogram Interpretation Method Based on
Continual Learning [20.465733855762835]
心電図(ECG)モニタリングは心血管疾患(CVD)早期診断の最も強力な手法の一つである。
古典的なルールベースのアルゴリズムは、今ではディープラーニングベースの手法によって完全にパフォーマンスが向上している。
本稿では,高解像度の低レベルセマンティック情報を一括して保持できるマルチレゾリューションモデルを提案する。
論文 参考訳(メタデータ) (2023-04-10T15:19:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。