Fugu-MT 論文翻訳(概要): De-biased Multimodal Electrocardiogram Analysis

論文の概要: De-biased Multimodal Electrocardiogram Analysis

arxiv url: http://arxiv.org/abs/2411.14795v1
Date: Fri, 22 Nov 2024 08:35:35 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:50.121971
Title: De-biased Multimodal Electrocardiogram Analysis
Title（参考訳）: 脱バイアス多モード心電図解析
Authors: Haitao Li, Ziyu Li, Yiheng Mao, Ziyi Liu, Zhoujian Sun, Zhengxing Huang,
Abstract要約: 医療分野ではMLLM(Multimodal large language model)がますます採用されている。これまでの研究では、ECGを複数のテキストタグに変換することでこの問題に対処してきた。本研究は,射影層を通したLCMへのECGの埋め込みを直接供給する。
参考スコア（独自算出の注目度）: 20.290531515033518
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Multimodal large language models (MLLMs) are increasingly being applied in the medical field, particularly in medical imaging. However, developing MLLMs for ECG signals, which are crucial in clinical settings, has been a significant challenge beyond medical imaging. Previous studies have attempted to address this by converting ECGs into several text tags using an external classifier in a training-free manner. However, this approach significantly compresses the information in ECGs and underutilizes the reasoning capabilities of LLMs. In this work, we directly feed the embeddings of ECGs into the LLM through a projection layer, retaining more information about ECGs and better leveraging the reasoning abilities of LLMs. Our method can also effectively handle a common situation in clinical practice where it is necessary to compare two ECGs taken at different times. Recent studies found that MLLMs may rely solely on text input to provide answers, ignoring inputs from other modalities. We analyzed this phenomenon from a causal perspective in the context of ECG MLLMs and discovered that the confounder, severity of illness, introduces a spurious correlation between the question and answer, leading the model to rely on this spurious correlation and ignore the ECG input. Such models do not comprehend the ECG input and perform poorly in adversarial tests where different expressions of the same question are used in the training and testing sets. We designed a de-biased pre-training method to eliminate the confounder's effect according to the theory of backdoor adjustment. Our model performed well on the ECG-QA task under adversarial testing and demonstrated zero-shot capabilities. An interesting random ECG test further validated that our model effectively understands and utilizes the input ECG signal.
Abstract（参考訳）: マルチモーダル大言語モデル(MLLM)は医療分野、特に医用画像においてますます応用されている。しかし,心電図信号のためのMLLMの開発は,臨床現場において重要な課題であり,医用画像よりも重要な課題であった。従来の研究では、ECGを外部分類器を用いて複数のテキストタグに変換する訓練自由な方法で、この問題に対処しようと試みてきた。しかし、このアプローチはECGの情報を著しく圧縮し、LLMの推論能力を弱めている。本研究では,ECGの射影層への埋め込みを直接供給し,ECGのさらなる情報を保持し,LCMの推論能力を向上する。本手法は,2つの心電図を異なる時間で比較する必要がある臨床実践において,一般的な状況でも効果的に対処できる。近年の研究では、MLLMはテキスト入力にのみ依存して回答を提供し、他のモダリティからの入力を無視している可能性がある。我々は,この現象を心電図MLLMの文脈における因果的視点から分析し,共同創設者の重症度が質問と回答の間に急激な相関を導入し,この素因的な相関に頼ってECG入力を無視することを発見した。このようなモデルはECGの入力を理解せず、同じ質問の異なる表現がトレーニングやテストセットで使用される場合の敵検定では不十分である。バックドア調整理論に基づき, 共同創設者の効果を除去するための非バイアス事前学習法を考案した。本モデルは, 対向試験におけるECG-QAタスクにおいて良好に動作し, ゼロショット機能を示した。興味深いランダムECGテストにより,入力ECG信号を効果的に理解し,活用できることが検証された。

関連論文リスト

ECG-R1: Protocol-Guided and Modality-Agnostic MLLM for Reliable ECG Interpretation [36.244601234085856]
既存のマルチモーダル大言語モデル(MLLM)は、ECGの解釈には信頼できないままである。 ECG-R1は、信頼できるECG解釈のために設計されたMLLMの最初の推論である。コードとデータはhrefhttp://ai.heartvoice.com.cn/ECG-R1hereで公開されている。
論文参考訳（メタデータ） (2026-02-04T07:17:55Z)
EnECG: Efficient Ensemble Learning for Electrocardiogram Multi-task Foundation Model [46.84040404474695]
EnECGは、複数の特別な基礎モデルを統合するアンサンブルベースのフレームワークであり、それぞれECG解釈の異なる側面で優れている。本稿では,基礎モデルの強力な表現力を維持しつつ,計算・メモリコストの削減に寄与することを示す。このフレームワークは特徴抽出と予測性能を向上するだけでなく、実際の臨床応用に実用的な効率性も確保する。
論文参考訳（メタデータ） (2025-11-28T07:22:33Z)
Simulator and Experience Enhanced Diffusion Model for Comprehensive ECG Generation [52.19347532840774]
本稿では,心電図生成のための新しい生理シミュレータSE-Diffを提案する。 SE-Diffは、軽量常微分方程式(ODE)ベースのECGシミュレータをビートデコーダを介して拡散過程に統合する。実世界のECGデータセットに対する大規模な実験により、SE-Diffは信号の忠実度とテキスト-ECGセマンティックアライメントの両方を改善している。
論文参考訳（メタデータ） (2025-11-13T02:57:10Z)
ECG-aBcDe: Overcoming Model Dependence, Encoding ECG into a Universal Language for Any LLM [7.632459372363093]
大型言語モデル (LLMs) は心電図 (ECG) 解析において大きな可能性を秘めている。現在の方法はモデル固有のECGエンコーダに悩まされており、LLM間の転送を妨げる。我々は、ECG信号を任意のLLMで容易に解釈可能な普遍的なECG言語に変換する新しい符号化法ECG-aBcDeを紹介する。
論文参考訳（メタデータ） (2025-09-16T03:41:02Z)
Global and Local Contrastive Learning for Joint Representations from Cardiac MRI and ECG [40.407824759778784]
PTACL(Patient and Temporal Alignment Contrastive Learning)は、CMRからの時間情報を統合することで、ECG表現を強化するマルチモーダルコントラスト学習フレームワークである。英国バイオバンクの被験者27,951名を対象に,ペア心電図-CMRデータを用いたPTACLの評価を行った。心電図を用いた非侵襲的心臓診断におけるPTACLの有用性について検討した。
論文参考訳（メタデータ） (2025-06-24T17:19:39Z)
Sensing Cardiac Health Across Scenarios and Devices: A Multi-Modal Foundation Model Pretrained on Heterogeneous Data from 1.7 Million Individuals [36.08910150609342]
広大で異質な健康記録から統一された表現を学習する心センシング基礎モデル(CSFM)を提案する。我々のモデルは、複数の大規模データセットからのデータの革新的なマルチモーダル統合に基づいて事前訓練されている。 CSFMは従来のワンモーダル・ワン・タスク・アプローチより一貫して優れている。
論文参考訳（メタデータ） (2025-06-23T20:58:12Z)
From Token to Rhythm: A Multi-Scale Approach for ECG-Language Pretraining [22.214252217020174]
本稿では,マルチスケールECG-Language Pretraining(MELP)モデルを紹介する。我々は、ゼロショットECG分類、線形探索、転送学習を含む、複数のタスクにわたる3つのパブリックECGデータセット上でMELPを評価する。
論文参考訳（メタデータ） (2025-06-11T07:22:17Z)
Heartcare Suite: Multi-dimensional Understanding of ECG with Raw Multi-lead Signal Modeling [50.58126509704037]
医療スイート(Heartcare Suite)は、微細心電図(ECG)の理解のためのフレームワークである。 Heartcare-220Kは高品質で構造化され、包括的なマルチモーダルECGデータセットである。 Heartcare-Benchは、ECGシナリオにおける医療マルチモーダル大言語モデル(Med-MLLM)の最適化を導くためのベンチマークである。
論文参考訳（メタデータ） (2025-06-06T07:56:41Z)
GEM: Empowering MLLM for Grounded ECG Understanding with Time Series and Images [43.65650710265957]
GEMは,第1回MLLM統合ECG時系列,第12回リードECG画像,地上および臨床のECG解釈のためのテキストである。 GEMは、3つのコアイノベーションを通じて機能的解析、エビデンス駆動推論、および臨床医のような診断プロセスを可能にする。基礎心電図理解におけるMLLMの能力を評価するために,臨床動機付けのベンチマークであるグラウンドドECGタスクを提案する。
論文参考訳（メタデータ） (2025-03-08T05:48:53Z)
AnyECG: Foundational Models for Multitask Cardiac Analysis in Real-World Settings [34.078819572852446]
心電図(ECG)は急性心臓発作の検出に非常に敏感である。本稿では,実世界のECGデータからロバストな表現を抽出するための基礎モデルであるAnyECGを紹介する。
論文参考訳（メタデータ） (2024-11-17T17:32:58Z)
Teach Multimodal LLMs to Comprehend Electrocardiographic Images [10.577263066644194]
我々は、100万以上のサンプルからなる総合的なECGイメージインストラクションチューニングデータセットであるECGInstructを紹介する。また,心電図の理解に適したMLLMであるPULSEを開発した。実験の結果,PULSEは従来のMLLMよりも15%から30%の精度向上を実現した。
論文参考訳（メタデータ） (2024-10-21T20:26:41Z)
Electrocardiogram-Language Model for Few-Shot Question Answering with Meta Learning [19.513904491604794]
心電図(ECG)の解釈には専門知識が必要である。本研究は,数発のECG質問応答のための新しいマルチモーダルメタラーニング手法を提案する。
論文参考訳（メタデータ） (2024-10-18T13:48:01Z)
Self-supervised inter-intra period-aware ECG representation learning for detecting atrial fibrillation [41.82319894067087]
そこで本研究では,周期型ECG表現学習手法を提案する。心房細動患者の心電図ではRR間隔の不規則性やP波の欠如を考慮し, 経時的および経時的表現のための特定の事前訓練タスクを開発する。本手法は,発作/持続性心房細動検出のためのBTCHデータセット,textiti., 0.953/0.996におけるAUCの顕著な性能を示す。
論文参考訳（メタデータ） (2024-10-08T10:03:52Z)
Electrocardiogram Report Generation and Question Answering via Retrieval-Augmented Self-Supervised Modeling [19.513904491604794]
ECG-ReGenは、ECG-to-textレポート生成と質問応答のための検索ベースのアプローチである。事前学習と動的検索とLarge Language Model(LLM)ベースの改善を組み合わせることで、ECG-ReGenはECGデータと関連するクエリを効果的に分析する。
論文参考訳（メタデータ） (2024-09-13T12:50:36Z)
ECG-FM: An Open Electrocardiogram Foundation Model [3.611746032873298]
本稿では,ECG分析のためのオープン基盤モデルであるECG-FMを提案する。 ECG-FMはトランスフォーマーベースのアーキテクチャを採用し、250万のサンプルで事前訓練されている。文脈情報のコマンドが強靭なパフォーマンス、豊富な事前学習された埋め込み、信頼性のある解釈可能性をもたらすことを示す。
論文参考訳（メタデータ） (2024-08-09T17:06:49Z)
MEIT: Multi-Modal Electrocardiogram Instruction Tuning on Large Language Models for Report Generation [41.324530807795256]
心電図(Electrocardiogram、ECG)は、心臓の状態をモニタリングするための主要な非侵襲的診断ツールである。最近の研究は心電図データを用いた心臓状態の分類に集中しているが、心電図レポートの生成は見落としている。 LLMとマルチモーダル命令を用いてECGレポート生成に取り組む最初の試みであるMultimodal ECG Instruction Tuning (MEIT) フレームワークを提案する。
論文参考訳（メタデータ） (2024-03-07T23:20:56Z)
PulseNet: Deep Learning ECG-signal classification using random augmentation policy and continous wavelet transform for canines [46.09869227806991]
犬心電図(ECG)の評価には熟練した獣医が必要である。心電図の解釈と診断支援のための獣医師の現在の利用状況は限られている。犬の心電図配列を正常または異常と分類するためのディープ畳み込みニューラルネットワーク(CNN)アプローチを実装した。
論文参考訳（メタデータ） (2023-05-17T09:06:39Z)
SEVGGNet-LSTM: a fused deep learning model for ECG classification [38.747030782394646]
入力ECG信号はまずセグメント化され、正規化され、その後、特徴抽出と分類のためにVGGとLSTMネットワークに入力される。注目機構(SEブロック)をコアネットワークに組み込んで重要な特徴の重み付けを行う。
論文参考訳（メタデータ） (2022-10-31T07:36:48Z)
Continuous Decoding of Daily-Life Hand Movements from Forearm Muscle Activity for Enhanced Myoelectric Control of Hand Prostheses [78.120734120667]
本研究では,前腕のEMG活性をハンドキネマティクスに連続的にマップする,長期記憶(LSTM)ネットワークに基づく新しい手法を提案する。私たちの研究は、この困難なデータセットを使用するハンドキネマティクスの予測に関する最初の報告です。提案手法は, 人工手指の複数のDOFの独立的, 比例的アクティベーションのための制御信号の生成に適していることが示唆された。
論文参考訳（メタデータ） (2021-04-29T00:11:32Z)
ECG-DelNet: Delineation of Ambulatory Electrocardiograms with Mixed Quality Labeling Using Neural Networks [69.25956542388653]
ディープラーニング(DL)アルゴリズムは、学術的、産業的にも重くなっている。セグメンテーションフレームワークにECGの検出とデライン化を組み込むことにより、低解釈タスクにDLをうまく適用できることを実証する。このモデルは、PhyloNetのQTデータベースを使用して、105個の増幅ECG記録から訓練された。
論文参考訳（メタデータ） (2020-05-11T16:29:12Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。