論文の概要: DiagECG: An LLM-Driven Framework for Diagnostic Reasoning via Discretized ECG Tokenization
- arxiv url: http://arxiv.org/abs/2508.15338v1
- Date: Thu, 21 Aug 2025 08:13:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-22 16:26:46.235518
- Title: DiagECG: An LLM-Driven Framework for Diagnostic Reasoning via Discretized ECG Tokenization
- Title(参考訳): DiagECG: 離散化ECGトークン化による診断推論のためのLLM駆動フレームワーク
- Authors: Jinning Yang, Wen Shi,
- Abstract要約: 本稿では,時系列と言語モデリングを統合した新しいフレームワークであるDiagECGを紹介する。
本手法は,リード非依存エンコーダと量子化モジュールを用いて,連続ECG埋め込みをシンボリックトークンに識別する。
- 参考スコア(独自算出の注目度): 0.7550566004119158
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Electrocardiography plays a central role in cardiovascular diagnostics, yet existing automated approaches often struggle to generalize across clinical tasks and offer limited support for open-ended reasoning. We present DiagECG, a novel framework that integrates time-series and language modeling by enabling large language models to process 12-lead ECG signals for clinical text generation tasks. Our approach discretizes continuous ECG embeddings into symbolic tokens using a lead-independent encoder and quantization module. These tokens are then used to extend the vocabulary of LLM, allowing the model to handle both ECG and natural language inputs in a unified manner. To bridge the modality gap, we pretrain the model on an autoregressive ECG forecasting task, enabling the LLM to model temporal dynamics using its native language modeling capabilities. Finally, we perform instruction tuning on both ECG question answering and diagnostic report generation. Without modifying the core model, DiagECG achieves strong performance across tasks while maintaining generalization to out-of-distribution settings. Extensive experiments demonstrate the effectiveness of each component and highlight the potential of integrating symbolic ECG representations into LLMs for medical reasoning.
- Abstract(参考訳): 心電図は心臓血管診断において中心的な役割を担っているが、既存の自動的アプローチは、臨床タスク全体にわたって一般化し、オープンエンド推論の限られたサポートを提供するのに苦慮することが多い。
臨床用テキスト生成タスクにおいて,大言語モデルで12リードのECG信号を処理できるようにすることにより,時系列と言語モデリングを統合した新しいフレームワークであるDiagECGを提案する。
本手法は,リード非依存エンコーダと量子化モジュールを用いて,連続ECG埋め込みをシンボリックトークンに識別する。
これらのトークンはLLMの語彙を拡張するために使用され、ECGと自然言語の両方を統一的に扱うことができる。
モダリティギャップを埋めるため、自動回帰ECG予測タスクでモデルを事前訓練し、LLMがそのネイティブ言語モデリング機能を用いて時間的ダイナミクスをモデル化できるようにする。
最後に,ECG質問応答と診断レポート生成の双方に対して,命令チューニングを行う。
コアモデルを変更することなく、DiagECGはタスク間で強力なパフォーマンスを実現し、配布外設定への一般化を維持している。
広範囲にわたる実験は、各コンポーネントの有効性を示し、医学的推論のために象徴的なECG表現をLLMに統合する可能性を強調している。
関連論文リスト
- EnECG: Efficient Ensemble Learning for Electrocardiogram Multi-task Foundation Model [46.84040404474695]
EnECGは、複数の特別な基礎モデルを統合するアンサンブルベースのフレームワークであり、それぞれECG解釈の異なる側面で優れている。
本稿では,基礎モデルの強力な表現力を維持しつつ,計算・メモリコストの削減に寄与することを示す。
このフレームワークは特徴抽出と予測性能を向上するだけでなく、実際の臨床応用に実用的な効率性も確保する。
論文 参考訳(メタデータ) (2025-11-28T07:22:33Z) - MIRNet: Integrating Constrained Graph-Based Reasoning with Pre-training for Diagnostic Medical Imaging [67.74482877175797]
MIRNetは、自己教師付き事前学習と制約付きグラフベースの推論を統合する新しいフレームワークである。
TongueAtlas-4Kは,22の診断ラベルを付した4,000枚の画像からなるベンチマークである。
論文 参考訳(メタデータ) (2025-11-13T06:30:41Z) - Simulator and Experience Enhanced Diffusion Model for Comprehensive ECG Generation [52.19347532840774]
本稿では,心電図生成のための新しい生理シミュレータSE-Diffを提案する。
SE-Diffは、軽量常微分方程式(ODE)ベースのECGシミュレータをビートデコーダを介して拡散過程に統合する。
実世界のECGデータセットに対する大規模な実験により、SE-Diffは信号の忠実度とテキスト-ECGセマンティックアライメントの両方を改善している。
論文 参考訳(メタデータ) (2025-11-13T02:57:10Z) - WaveMind: Towards a Conversational EEG Foundation Model Aligned to Textual and Visual Modalities [55.00677513249723]
脳波信号は認知過程と固有の神経状態の両方を同時に符号化する。
我々は、EEG信号とその対応するモダリティを統一意味空間にマッピングし、一般化された解釈を実現する。
結果として得られたモデルは、柔軟でオープンな会話をサポートしながら、堅牢な分類精度を示す。
論文 参考訳(メタデータ) (2025-09-26T06:21:51Z) - From Token to Rhythm: A Multi-Scale Approach for ECG-Language Pretraining [22.214252217020174]
本稿では,マルチスケールECG-Language Pretraining(MELP)モデルを紹介する。
我々は、ゼロショットECG分類、線形探索、転送学習を含む、複数のタスクにわたる3つのパブリックECGデータセット上でMELPを評価する。
論文 参考訳(メタデータ) (2025-06-11T07:22:17Z) - Heartcare Suite: Multi-dimensional Understanding of ECG with Raw Multi-lead Signal Modeling [50.58126509704037]
医療スイート(Heartcare Suite)は、微細心電図(ECG)の理解のためのフレームワークである。
Heartcare-220Kは高品質で構造化され、包括的なマルチモーダルECGデータセットである。
Heartcare-Benchは、ECGシナリオにおける医療マルチモーダル大言語モデル(Med-MLLM)の最適化を導くためのベンチマークである。
論文 参考訳(メタデータ) (2025-06-06T07:56:41Z) - PhysLLM: Harnessing Large Language Models for Cross-Modal Remote Physiological Sensing [49.243031514520794]
LLM(Large Language Models)は、テキスト中心の設計のため、長距離信号の取得に優れる。
PhysLLMは最先端の精度とロバスト性を実現し、照明のバリエーションや動きのシナリオにまたがる優れた一般化を示す。
論文 参考訳(メタデータ) (2025-05-06T15:18:38Z) - A CNN-based Local-Global Self-Attention via Averaged Window Embeddings for Hierarchical ECG Analysis [1.0844302367985357]
本稿では,この制限に対処するため,新しいLGA(Local-Global Attention ECG)モデルを提案する。
提案手法は,重なり合う畳み込みウィンドウから得られる埋め込みを平均化することでクエリを抽出する。
CODE-15データセットで行った実験は、LGA-ECGが最先端モデルより優れていることを示した。
論文 参考訳(メタデータ) (2025-04-13T01:21:18Z) - GEM: Empowering MLLM for Grounded ECG Understanding with Time Series and Images [43.65650710265957]
GEMは,第1回MLLM統合ECG時系列,第12回リードECG画像,地上および臨床のECG解釈のためのテキストである。
GEMは、3つのコアイノベーションを通じて機能的解析、エビデンス駆動推論、および臨床医のような診断プロセスを可能にする。
基礎心電図理解におけるMLLMの能力を評価するために,臨床動機付けのベンチマークであるグラウンドドECGタスクを提案する。
論文 参考訳(メタデータ) (2025-03-08T05:48:53Z) - ECG-Byte: A Tokenizer for End-to-End Generative Electrocardiogram Language Modeling [20.484166589932702]
大規模言語モデル(LLMs)は、心電図(ECGs)への応用を含む、ドメイン間での例外的な汎用性を実証している。
本稿では,ECGの自動回帰言語モデリングのための適応バイトペア符号化(BPE)トークン化パイプラインであるECG-Byteを提案する。
従来の2段階法で必要とされるデータの48%しか使用せず,3倍高速なトレーニングをしながら,競争力のあるNLG性能を実現する。
論文 参考訳(メタデータ) (2024-12-18T22:13:21Z) - Electrocardiogram-Language Model for Few-Shot Question Answering with Meta Learning [19.513904491604794]
心電図(ECG)の解釈には専門知識が必要である。
本研究は,数発のECG質問応答のための新しいマルチモーダルメタラーニング手法を提案する。
論文 参考訳(メタデータ) (2024-10-18T13:48:01Z) - MEIT: Multimodal Electrocardiogram Instruction Tuning on Large Language Models for Report Generation [28.35107188450758]
心電図(Electrocardiogram、ECG)は、心臓の状態をモニタリングするための主要な非侵襲的診断ツールである。
最近の研究は心電図データを用いた心臓状態の分類に集中しているが、心電図レポートの生成は見落としている。
LLMとマルチモーダル命令を用いてECGレポート生成に取り組む最初の試みであるMultimodal ECG Instruction Tuning (MEIT) フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-07T23:20:56Z) - ECG-CL: A Comprehensive Electrocardiogram Interpretation Method Based on
Continual Learning [20.465733855762835]
心電図(ECG)モニタリングは心血管疾患(CVD)早期診断の最も強力な手法の一つである。
古典的なルールベースのアルゴリズムは、今ではディープラーニングベースの手法によって完全にパフォーマンスが向上している。
本稿では,高解像度の低レベルセマンティック情報を一括して保持できるマルチレゾリューションモデルを提案する。
論文 参考訳(メタデータ) (2023-04-10T15:19:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。