論文の概要: Electrocardiogram-Language Model for Few-Shot Question Answering with Meta Learning
- arxiv url: http://arxiv.org/abs/2410.14464v1
- Date: Fri, 18 Oct 2024 13:48:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-21 14:24:43.899628
- Title: Electrocardiogram-Language Model for Few-Shot Question Answering with Meta Learning
- Title(参考訳): メタラーニングによるFew-Shot Question Answeringのための心電図・言語モデル
- Authors: Jialu Tang, Tong Xia, Yuan Lu, Cecilia Mascolo, Aaqib Saeed,
- Abstract要約: 心電図(ECG)の解釈には専門知識が必要である。
本研究は,数発のECG質問応答のための新しいマルチモーダルメタラーニング手法を提案する。
- 参考スコア(独自算出の注目度): 19.513904491604794
- License:
- Abstract: Electrocardiogram (ECG) interpretation requires specialized expertise, often involving synthesizing insights from ECG signals with complex clinical queries posed in natural language. The scarcity of labeled ECG data coupled with the diverse nature of clinical inquiries presents a significant challenge for developing robust and adaptable ECG diagnostic systems. This work introduces a novel multimodal meta-learning method for few-shot ECG question answering, addressing the challenge of limited labeled data while leveraging the rich knowledge encoded within large language models (LLMs). Our LLM-agnostic approach integrates a pre-trained ECG encoder with a frozen LLM (e.g., LLaMA and Gemma) via a trainable fusion module, enabling the language model to reason about ECG data and generate clinically meaningful answers. Extensive experiments demonstrate superior generalization to unseen diagnostic tasks compared to supervised baselines, achieving notable performance even with limited ECG leads. For instance, in a 5-way 5-shot setting, our method using LLaMA-3.1-8B achieves accuracy of 84.6%, 77.3%, and 69.6% on single verify, choose and query question types, respectively. These results highlight the potential of our method to enhance clinical ECG interpretation by combining signal processing with the nuanced language understanding capabilities of LLMs, particularly in data-constrained scenarios.
- Abstract(参考訳): 心電図(ECG)の解釈には専門的な専門知識が必要で、しばしば自然言語で表される複雑な臨床的クエリとECG信号からの洞察を合成する。
臨床検査の多様な性質とラベル付き心電図データの不足は、堅牢で適応可能な心電図診断システムを開発する上で大きな課題となる。
本研究は,大規模言語モデル(LLM)に符号化された豊富な知識を活用しつつ,限定ラベル付きデータの課題に対処する,数ショットのECG質問応答のための新しいマルチモーダルメタラーニング手法を提案する。
LLM非依存的アプローチでは、トレーニング可能な融合モジュールを介して、トレーニング済みのECGエンコーダを凍結したLCM(eg, LLaMA, Gemma)と統合し、言語モデルがECGデータを推論し、臨床的に有意な回答を得られるようにする。
広範囲な実験は、教師付きベースラインと比較して、見つからない診断タスクに優れた一般化を示し、限られたECGリードでも顕著な性能を達成している。
例えば, 5-way 5-shot では, LLaMA-3.1-8B を用いた手法は, それぞれ84.6%, 77.3%, 69.6%の精度で検証, 選択, 問合せを行う。
これらの結果は,特にデータ制約のあるシナリオにおいて,信号処理とLLMのニュアンス言語理解能力を組み合わせることで,臨床ECGの解釈を向上させる方法の可能性を強調した。
関連論文リスト
- Teach Multimodal LLMs to Comprehend Electrocardiographic Images [10.577263066644194]
我々は、100万以上のサンプルからなる総合的なECGイメージインストラクションチューニングデータセットであるECGInstructを紹介する。
また,心電図の理解に適したMLLMであるPULSEを開発した。
実験の結果,PULSEは従来のMLLMよりも15%から30%の精度向上を実現した。
論文 参考訳(メタデータ) (2024-10-21T20:26:41Z) - Electrocardiogram Report Generation and Question Answering via Retrieval-Augmented Self-Supervised Modeling [19.513904491604794]
ECG-ReGenは、ECG-to-textレポート生成と質問応答のための検索ベースのアプローチである。
事前学習と動的検索とLarge Language Model(LLM)ベースの改善を組み合わせることで、ECG-ReGenはECGデータと関連するクエリを効果的に分析する。
論文 参考訳(メタデータ) (2024-09-13T12:50:36Z) - GMAI-MMBench: A Comprehensive Multimodal Evaluation Benchmark Towards General Medical AI [67.09501109871351]
LVLM(Large Vision-Language Model)は、画像、テキスト、生理学的信号などの多様なデータタイプを扱うことができる。
GMAI-MMBenchは、よく分類されたデータ構造と、これまででもっとも包括的な一般医療用AIベンチマークである。
38の医療画像モダリティ、18の臨床関連タスク、18の部門、視覚質問回答(VQA)フォーマットの4つの知覚的粒度からなる284のデータセットで構成されている。
論文 参考訳(メタデータ) (2024-08-06T17:59:21Z) - ECG Semantic Integrator (ESI): A Foundation ECG Model Pretrained with LLM-Enhanced Cardiological Text [14.06147507373525]
本研究は,12誘導ECG信号の学習表現の品質とロバスト性の向上を目的とした,新しいマルチモーダルコントラスト保持フレームワークを提案する。
私たちのフレームワークは、Cardio Query Assistant(CQA)とECG Semantics Integrator(ESI)の2つの重要なコンポーネントで構成されています。
論文 参考訳(メタデータ) (2024-05-26T06:45:39Z) - Zero-Shot ECG Classification with Multimodal Learning and Test-time Clinical Knowledge Enhancement [10.611952462532908]
マルチモーダルECG表現学習(MERL)は、テキストプロンプトでゼロショットECG分類を行うことができる。
本稿では,外部の専門知識データベースを利用した臨床知識向上技術(CKEPE)アプローチを提案する。
MERLは、ゼロショット分類における平均75.2%のAUCスコアを(トレーニングデータなしで)達成し、10%の注釈付きトレーニングデータを持つ線形プローブeSSLメソッドよりも3.2%高い。
論文 参考訳(メタデータ) (2024-03-11T12:28:55Z) - MEIT: Multi-Modal Electrocardiogram Instruction Tuning on Large Language Models for Report Generation [41.324530807795256]
心電図(Electrocardiogram、ECG)は、心臓の状態をモニタリングするための主要な非侵襲的診断ツールである。
最近の研究は心電図データを用いた心臓状態の分類に集中しているが、心電図レポートの生成は見落としている。
LLMとマルチモーダル命令を用いてECGレポート生成に取り組む最初の試みであるMultimodal ECG Instruction Tuning (MEIT) フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-07T23:20:56Z) - MedAlign: A Clinician-Generated Dataset for Instruction Following with
Electronic Medical Records [60.35217378132709]
大型言語モデル(LLM)は、人間レベルの流布で自然言語の指示に従うことができる。
医療のための現実的なテキスト生成タスクにおけるLCMの評価は依然として困難である。
我々は、EHRデータのための983の自然言語命令のベンチマークデータセットであるMedAlignを紹介する。
論文 参考訳(メタデータ) (2023-08-27T12:24:39Z) - Self-Verification Improves Few-Shot Clinical Information Extraction [73.6905567014859]
大規模言語モデル (LLMs) は、数発のテキスト内学習を通じて臨床キュレーションを加速する可能性を示している。
正確性や解釈可能性に関する問題、特に健康のようなミッションクリティカルな領域ではまだ苦戦している。
本稿では,自己検証を用いた汎用的な緩和フレームワークについて検討する。このフレームワークはLLMを利用して,自己抽出のための証明を提供し,その出力をチェックする。
論文 参考訳(メタデータ) (2023-05-30T22:05:11Z) - ECG-DelNet: Delineation of Ambulatory Electrocardiograms with Mixed
Quality Labeling Using Neural Networks [69.25956542388653]
ディープラーニング(DL)アルゴリズムは、学術的、産業的にも重くなっている。
セグメンテーションフレームワークにECGの検出とデライン化を組み込むことにより、低解釈タスクにDLをうまく適用できることを実証する。
このモデルは、PhyloNetのQTデータベースを使用して、105個の増幅ECG記録から訓練された。
論文 参考訳(メタデータ) (2020-05-11T16:29:12Z) - Opportunities and Challenges of Deep Learning Methods for
Electrocardiogram Data: A Systematic Review [62.490310870300746]
心電図(Electrocardiogram、ECG)は、医学および医療において最も一般的に用いられる診断ツールの1つである。
深層学習法は心電図信号を用いた予測医療タスクにおいて有望な結果を得た。
本稿では、モデリングとアプリケーションの観点から、ECGデータに対するディープラーニング手法の体系的なレビューを行う。
論文 参考訳(メタデータ) (2019-12-28T02:44:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。