論文の概要: Few-Label Multimodal Modeling of SNP Variants and ECG Phenotypes Using Large Language Models for Cardiovascular Risk Stratification
- arxiv url: http://arxiv.org/abs/2510.16536v1
- Date: Sat, 18 Oct 2025 15:19:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 00:56:39.028881
- Title: Few-Label Multimodal Modeling of SNP Variants and ECG Phenotypes Using Large Language Models for Cardiovascular Risk Stratification
- Title(参考訳): 大規模言語モデルを用いたSNP変数と心電図の多モードモデリング
- Authors: Niranjana Arun Menon, Yulong Li, Iqra Farooq, Sara Ahmed, Muhammad Awais, Imran Razzak,
- Abstract要約: 心血管性リスク層形成のための遺伝子情報と電気生理学的情報を組み合わせた,数ラベルのマルチモーダル・フレームワークを提案する。
我々は、このタスクを思考の連鎖(CoT)推論問題とみなし、モデルが予測と共に臨床的に関連性のある有理性を生成するよう促す。
実験結果から,マルチモーダル入力の統合,少数ラベル管理,CoT推論により,多様な患者プロファイル間の堅牢性と一般化性が向上することが示唆された。
- 参考スコア(独自算出の注目度): 21.890853284710776
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cardiovascular disease (CVD) risk stratification remains a major challenge due to its multifactorial nature and limited availability of high-quality labeled datasets. While genomic and electrophysiological data such as SNP variants and ECG phenotypes are increasingly accessible, effectively integrating these modalities in low-label settings is non-trivial. This challenge arises from the scarcity of well-annotated multimodal datasets and the high dimensionality of biological signals, which limit the effectiveness of conventional supervised models. To address this, we present a few-label multimodal framework that leverages large language models (LLMs) to combine genetic and electrophysiological information for cardiovascular risk stratification. Our approach incorporates a pseudo-label refinement strategy to adaptively distill high-confidence labels from weakly supervised predictions, enabling robust model fine-tuning with only a small set of ground-truth annotations. To enhance the interpretability, we frame the task as a Chain of Thought (CoT) reasoning problem, prompting the model to produce clinically relevant rationales alongside predictions. Experimental results demonstrate that the integration of multimodal inputs, few-label supervision, and CoT reasoning improves robustness and generalizability across diverse patient profiles. Experimental results using multimodal SNP variants and ECG-derived features demonstrated comparable performance to models trained on the full dataset, underscoring the promise of LLM-based few-label multimodal modeling for advancing personalized cardiovascular care.
- Abstract(参考訳): 心血管疾患(CVD)のリスク層化は、多因子性であり、高品質なラベル付きデータセットの可用性が限られているため、依然として大きな課題である。
SNP変種やECG表現型などのゲノム・電気生理学的データはますますアクセスしやすくなっているが、これらのモダリティを低ラベル環境に効果的に統合することは容易ではない。
この課題は、よく注釈付けされたマルチモーダルデータセットの不足と、従来の教師付きモデルの有効性を制限する生物学的信号の高次元性から生じる。
そこで本研究では,大規模言語モデル(LLM)を利用して,循環器系リスク階層化のための遺伝的・電気生理学的情報を組み合わせた,数ラベルのマルチモーダルフレームワークを提案する。
提案手法は,弱教師付き予測から高信頼度ラベルを適応的に抽出する擬似ラベル改良戦略を取り入れ,少量の接地構文アノテーションで頑健なモデル微調整を可能にする。
解釈可能性を高めるために、我々は、そのタスクを思考の連鎖(CoT)推論問題として定式化し、予測とともに臨床的に関係のある有理性を生み出すよう促す。
実験結果から,マルチモーダル入力の統合,少数ラベル管理,CoT推論により,多様な患者プロファイル間の堅牢性と一般化性が向上することが示唆された。
マルチモーダル SNP 変種とECG 由来の特徴を用いた実験結果は、パーソナライズされた心血管ケアを推進するための LLM ベースのマルチモーダルモデリングの可能性を強調し、フルデータセットでトレーニングされたモデルに匹敵する性能を示した。
関連論文リスト
- Learning Robust Diffusion Models from Imprecise Supervision [75.53546939251146]
DMISは、Imrecise Supervisionから堅牢な条件拡散モデルをトレーニングするための統一されたフレームワークである。
我々のフレームワークは、可能性から派生し、その目的を生成的および分類的構成要素に分解する。
画像生成、弱教師付き学習、データセットの凝縮をカバーし、様々な形の不正確な監視実験を行い、DMISが常に高品質でクラス差別的なサンプルを生成することを示した。
論文 参考訳(メタデータ) (2025-10-03T14:00:32Z) - impuTMAE: Multi-modal Transformer with Masked Pre-training for Missing Modalities Imputation in Cancer Survival Prediction [75.43342771863837]
我々は,効率的なマルチモーダル事前学習戦略を備えた新しいトランスフォーマーに基づくエンドツーエンドアプローチである impuTMAE を紹介する。
マスクされたパッチを再構築することで、モダリティの欠如を同時に示唆しながら、モダリティ間の相互作用とモダリティ内相互作用を学習する。
本モデルは,TGA-GBM/LGGとBraTSデータセットを用いたグリオーマ生存予測のために,異種不完全データに基づいて事前訓練を行った。
論文 参考訳(メタデータ) (2025-08-08T10:01:16Z) - TCDiff: Triplex Cascaded Diffusion for High-fidelity Multimodal EHRs Generation with Incomplete Clinical Data [7.661128607911307]
実世界のEHRデータの特徴を学習するために,3つの拡散ネットワークをカスケードする新しいEHR生成フレームワークTCDiffを提案する。
TCDiffは、さまざまな欠落率でデータ忠実度の平均10%で、最先端のベースラインを一貫して上回っている。
これは、現実のヘルスケアシナリオにおける我々のアプローチの有効性、堅牢性、一般化性を強調します。
論文 参考訳(メタデータ) (2025-08-03T06:24:20Z) - Adaptable Cardiovascular Disease Risk Prediction from Heterogeneous Data using Large Language Models [70.64969663547703]
AdaCVDは、英国バイオバンクから50万人以上の参加者を対象に、大規模な言語モデルに基づいて構築された適応可能なCVDリスク予測フレームワークである。
包括的かつ可変的な患者情報を柔軟に取り込み、構造化データと非構造化テキストの両方をシームレスに統合し、最小限の追加データを使用して新規患者の集団に迅速に適応する。
論文 参考訳(メタデータ) (2025-05-30T14:42:02Z) - Towards Robust Multimodal Physiological Foundation Models: Handling Arbitrary Missing Modalities [9.785262633953794]
生理オムニ (Phylo Omni) は、マルチモーダルな生理的信号解析の基礎モデルである。
分離されたマルチモーダル・トークンーザを訓練し、マスクされた信号の事前訓練を可能にする。
最先端のパフォーマンスを達成しつつ、モダリティの欠如に対して強い堅牢性を維持します。
論文 参考訳(メタデータ) (2025-04-28T09:00:04Z) - A Vector-Quantized Foundation Model for Patient Behavior Monitoring [41.48188433408574]
本稿では,スマートフォンやウェアラブルデバイスからの実世界のデータを処理するために設計されたベクトル量子化変分自動エンコーダを改良した基礎モデルを提案する。
本研究では, 個別の潜伏表現を利用して, 微調整を必要とせず, 2つの下流課題, 自殺リスク評価, 情緒的状態予測を効果的に実施した。
論文 参考訳(メタデータ) (2025-03-19T14:01:16Z) - Multi-Modal and Multi-Attribute Generation of Single Cells with CFGen [76.02070962797794]
本研究では、単一セルデータ固有の離散性を保存するフローベースの条件生成モデルであるCellFlow for Generation (CFGen)を紹介する。
CFGenは、全ゲノムマルチモーダル単一セルデータを確実に生成し、重要な生物学的データ特性の回復を改善する。
論文 参考訳(メタデータ) (2024-07-16T14:05:03Z) - Semi-Supervised Learning for Multi-Label Cardiovascular Diseases
Prediction:A Multi-Dataset Study [17.84069222975825]
現在の心電図に基づく診断システムは,ディープラーニング技術の急速な発展により,有望な性能を示す。
ラベル不足、複数のCVDの共起、目に見えないデータセットのパフォーマンスの低下は、ディープラーニングベースのモデルの普及を妨げる。
本稿では,複数のCVDを同時に認識するマルチラベル半教師付きモデル(ECGMatch)を提案する。
論文 参考訳(メタデータ) (2023-06-18T07:46:19Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。