論文の概要: How Effectively Can Large Language Models Connect SNP Variants and ECG Phenotypes for Cardiovascular Risk Prediction?
- arxiv url: http://arxiv.org/abs/2508.07127v1
- Date: Sun, 10 Aug 2025 00:19:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-12 21:23:28.714756
- Title: How Effectively Can Large Language Models Connect SNP Variants and ECG Phenotypes for Cardiovascular Risk Prediction?
- Title(参考訳): 大規模言語モデルがSNP変数と心血管性リスク予測にどの程度有効か?
- Authors: Niranjana Arun Menon, Iqra Farooq, Yulong Li, Sara Ahmed, Yutong Xie, Muhammad Awais, Imran Razzak,
- Abstract要約: 心疾患やSNPを予測するための微調整LDMの可能性を探る。
我々は、LLMが構造的および半構造的ゲノムデータから潜伏する生物学的関係を学習する方法を評価する。
この結果は、早期発見、リスクアセスメント、そして究極的には心臓医療におけるパーソナライズド医療の進歩に寄与するLSMsの可能性を浮き彫りにした。
- 参考スコア(独自算出の注目度): 20.329484401428815
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Cardiovascular disease (CVD) prediction remains a tremendous challenge due to its multifactorial etiology and global burden of morbidity and mortality. Despite the growing availability of genomic and electrophysiological data, extracting biologically meaningful insights from such high-dimensional, noisy, and sparsely annotated datasets remains a non-trivial task. Recently, LLMs has been applied effectively to predict structural variations in biological sequences. In this work, we explore the potential of fine-tuned LLMs to predict cardiac diseases and SNPs potentially leading to CVD risk using genetic markers derived from high-throughput genomic profiling. We investigate the effect of genetic patterns associated with cardiac conditions and evaluate how LLMs can learn latent biological relationships from structured and semi-structured genomic data obtained by mapping genetic aspects that are inherited from the family tree. By framing the problem as a Chain of Thought (CoT) reasoning task, the models are prompted to generate disease labels and articulate informed clinical deductions across diverse patient profiles and phenotypes. The findings highlight the promise of LLMs in contributing to early detection, risk assessment, and ultimately, the advancement of personalized medicine in cardiac care.
- Abstract(参考訳): 心血管疾患(CVD)の予知は多因子性エチオロジーと世界的死亡率と死亡率の重荷のため,依然として大きな課題である。
ゲノミクスや電気生理学的データの増加にもかかわらず、高次元、ノイズ、希少な注釈付きデータセットから生物学的に意味のある洞察を抽出することは簡単ではない。
近年, LLMは生物学的配列の構造変化を予測するために効果的に応用されている。
本研究では、高スループットゲノムプロファイリングから得られた遺伝マーカーを用いて、心疾患やSNPを予測し、CVDリスクにつながる可能性のある微調整LDMの可能性を探る。
本研究は,LLMが系統樹から受け継いだ遺伝的側面をマッピングして得られた構造的および半構造的ゲノムデータから潜伏生物関係を学習する方法について検討した。
思考の連鎖(CoT)推論タスクとしてこの問題をフレーミングすることにより、モデルが疾患のラベルを生成し、様々な患者プロファイルや表現型にまたがる情報的臨床的推論を明確化するよう促される。
この結果は、早期発見、リスクアセスメント、そして究極的には、心臓ケアにおけるパーソナライズド医療の進歩に寄与するLLMの可能性を浮き彫りにした。
関連論文リスト
- Causal and Federated Multimodal Learning for Cardiovascular Risk Prediction under Heterogeneous Populations [0.0]
我々は、クロスモーダルトランスフォーマーとグラフニューラルネットワークを統合した単一のマルチモーダル学習フレームワークを作成し、因果表現学習を行い、パーソナライズされたCVDリスクを測定する。
このモデルは、ゲノム変異、心臓MRI、心電図波形、ウェアラブルストリーム、構造化ERHデータを組み合わせてリスクを予測する。
本研究は,CVD予測に対する臨床的信頼度,解釈性,プライバシへの原則的アプローチの道を開くものである。
論文 参考訳(メタデータ) (2026-01-05T14:32:49Z) - R-GenIMA: Integrating Neuroimaging and Genetics with Interpretable Multimodal AI for Alzheimer's Disease Progression [63.97617759805451]
アルツハイマー病の早期発見には、マクロスケールの神経解剖学的変化とマイクロスケールの遺伝的感受性を統合できるモデルが必要である。
本稿では,新しいROIワイド・ビジョン・トランスフォーマと遺伝的プロンプトを結合した多モード多言語モデルR-GenIMAを紹介する。
R-GenIMAは、通常の認知、主観記憶、軽度認知障害、ADの4方向分類において最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-12-22T02:54:10Z) - Few-Label Multimodal Modeling of SNP Variants and ECG Phenotypes Using Large Language Models for Cardiovascular Risk Stratification [21.890853284710776]
心血管性リスク層形成のための遺伝子情報と電気生理学的情報を組み合わせた,数ラベルのマルチモーダル・フレームワークを提案する。
我々は、このタスクを思考の連鎖(CoT)推論問題とみなし、モデルが予測と共に臨床的に関連性のある有理性を生成するよう促す。
実験結果から,マルチモーダル入力の統合,少数ラベル管理,CoT推論により,多様な患者プロファイル間の堅牢性と一般化性が向上することが示唆された。
論文 参考訳(メタデータ) (2025-10-18T15:19:35Z) - Adaptable Cardiovascular Disease Risk Prediction from Heterogeneous Data using Large Language Models [70.64969663547703]
AdaCVDは、英国バイオバンクから50万人以上の参加者を対象に、大規模な言語モデルに基づいて構築された適応可能なCVDリスク予測フレームワークである。
包括的かつ可変的な患者情報を柔軟に取り込み、構造化データと非構造化テキストの両方をシームレスに統合し、最小限の追加データを使用して新規患者の集団に迅速に適応する。
論文 参考訳(メタデータ) (2025-05-30T14:42:02Z) - Multi-modal Integration Analysis of Alzheimer's Disease Using Large Language Models and Knowledge Graphs [0.33554367023486936]
本稿では,大規模言語モデル(LLM)と知識グラフを用いたアルツハイマー病(AD)研究において,断片化されたマルチモーダルデータを統合するための新しい枠組みを提案する。
本手法は,MRI,遺伝子発現,バイオマーカー,脳波,臨床指標の集団レベルでの統合を実証する。
論文 参考訳(メタデータ) (2025-05-21T16:51:49Z) - Improving Diseases Predictions Utilizing External Bio-Banks [1.9336815376402723]
機械学習がどのように活用され、説明可能性を高め、生物学的に意味のある関連を明らかにするかを実証する。
LightGBMモデルをデータセット(10K)のスクラッチからトレーニングして、メタボロミクス機能をインプットします。
汚染された代謝学の特徴は、疾患に関連する危険因子に対する影響を評価するために生存分析に使用される。
論文 参考訳(メタデータ) (2025-03-30T13:05:20Z) - GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。
DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。
また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - Penalized Deep Partially Linear Cox Models with Application to CT Scans
of Lung Cancer Patients [42.09584755334577]
肺がんは世界中のがん死亡の原因であり、効果的な治療法を設計するための死亡リスクを理解することの重要性を強調している。
NLST(National Lung Screening Trial)は、肺がん患者の死亡リスクを定量化するために、CTテクスチャ解析を用いている。
本稿では,SCADペナルティを組み込んで重要なテクスチャ特徴を抽出し,深層ニューラルネットワークを用いてモデルの非パラメトリック成分を推定する,Pentalized Deep partially Linear Cox Model (Penalized DPLC)を提案する。
論文 参考訳(メタデータ) (2023-03-09T15:38:16Z) - Deep Learning of Semi-Competing Risk Data via a New Neural
Expectation-Maximization Algorithm [5.253100011321437]
私たちのモチベーションはボストン肺がん研究(Boston Lung Cancer Study)から来ています。
本稿では,古典的統計的アプローチと機械学習のギャップを埋めるために,ニューラル予測最大化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-22T20:38:57Z) - COVID-Net Biochem: An Explainability-driven Framework to Building
Machine Learning Models for Predicting Survival and Kidney Injury of COVID-19
Patients from Clinical and Biochemistry Data [66.43957431843324]
我々は、機械学習モデルを構築するための汎用的で説明可能なフレームワークであるCOVID-Net Biochemを紹介する。
この枠組みを用いて、新型コロナウイルス患者の生存率と、入院中に急性腎不全を発症する可能性を予測する。
論文 参考訳(メタデータ) (2022-04-24T07:38:37Z) - SurvLatent ODE : A Neural ODE based time-to-event model with competing
risks for longitudinal data improves cancer-associated Deep Vein Thrombosis
(DVT) prediction [68.8204255655161]
本稿では,不規則なサンプルデータの下で潜在表現をパラメータ化する生成時間対イベントモデルSurvLatent ODEを提案する。
そこで,本モデルでは,事象特異的ハザード関数の形状を指定せずに,複数の競合イベントの生存時間を柔軟に推定する。
SurvLatent ODEは、DVTリスクグループを成層化するために、現在の臨床標準であるKhorana Riskスコアより優れている。
論文 参考訳(メタデータ) (2022-04-20T17:28:08Z) - Low-Rank Reorganization via Proportional Hazards Non-negative Matrix
Factorization Unveils Survival Associated Gene Clusters [9.773075235189525]
この研究において、Cox比例ハザードの回帰は生存制約を課すことでNMFと統合される。
ヒト癌遺伝子の発現データを用いて、提案手法は癌遺伝子の重要なクラスターを解明することができる。
発見された遺伝子クラスターは、豊富な生物学的含意を反映し、生存に関連するバイオマーカーの同定に役立つ。
論文 参考訳(メタデータ) (2020-08-09T17:59:30Z) - Trajectories, bifurcations and pseudotime in large clinical datasets:
applications to myocardial infarction and diabetes data [94.37521840642141]
混合データ型と欠落値を特徴とする大規模臨床データセット分析のための半教師付き方法論を提案する。
この手法は、次元の減少、データの可視化、クラスタリング、特徴の選択と、部分的に順序付けられた観測列における測地距離(擬時)の定量化のタスクを同時に扱うことのできる弾性主グラフの適用に基づいている。
論文 参考訳(メタデータ) (2020-07-07T21:04:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。