論文の概要: How Effectively Can Large Language Models Connect SNP Variants and ECG Phenotypes for Cardiovascular Risk Prediction?
- arxiv url: http://arxiv.org/abs/2508.07127v1
- Date: Sun, 10 Aug 2025 00:19:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-12 21:23:28.714756
- Title: How Effectively Can Large Language Models Connect SNP Variants and ECG Phenotypes for Cardiovascular Risk Prediction?
- Title(参考訳): 大規模言語モデルがSNP変数と心血管性リスク予測にどの程度有効か?
- Authors: Niranjana Arun Menon, Iqra Farooq, Yulong Li, Sara Ahmed, Yutong Xie, Muhammad Awais, Imran Razzak,
- Abstract要約: 心疾患やSNPを予測するための微調整LDMの可能性を探る。
我々は、LLMが構造的および半構造的ゲノムデータから潜伏する生物学的関係を学習する方法を評価する。
この結果は、早期発見、リスクアセスメント、そして究極的には心臓医療におけるパーソナライズド医療の進歩に寄与するLSMsの可能性を浮き彫りにした。
- 参考スコア(独自算出の注目度): 20.329484401428815
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Cardiovascular disease (CVD) prediction remains a tremendous challenge due to its multifactorial etiology and global burden of morbidity and mortality. Despite the growing availability of genomic and electrophysiological data, extracting biologically meaningful insights from such high-dimensional, noisy, and sparsely annotated datasets remains a non-trivial task. Recently, LLMs has been applied effectively to predict structural variations in biological sequences. In this work, we explore the potential of fine-tuned LLMs to predict cardiac diseases and SNPs potentially leading to CVD risk using genetic markers derived from high-throughput genomic profiling. We investigate the effect of genetic patterns associated with cardiac conditions and evaluate how LLMs can learn latent biological relationships from structured and semi-structured genomic data obtained by mapping genetic aspects that are inherited from the family tree. By framing the problem as a Chain of Thought (CoT) reasoning task, the models are prompted to generate disease labels and articulate informed clinical deductions across diverse patient profiles and phenotypes. The findings highlight the promise of LLMs in contributing to early detection, risk assessment, and ultimately, the advancement of personalized medicine in cardiac care.
- Abstract(参考訳): 心血管疾患(CVD)の予知は多因子性エチオロジーと世界的死亡率と死亡率の重荷のため,依然として大きな課題である。
ゲノミクスや電気生理学的データの増加にもかかわらず、高次元、ノイズ、希少な注釈付きデータセットから生物学的に意味のある洞察を抽出することは簡単ではない。
近年, LLMは生物学的配列の構造変化を予測するために効果的に応用されている。
本研究では、高スループットゲノムプロファイリングから得られた遺伝マーカーを用いて、心疾患やSNPを予測し、CVDリスクにつながる可能性のある微調整LDMの可能性を探る。
本研究は,LLMが系統樹から受け継いだ遺伝的側面をマッピングして得られた構造的および半構造的ゲノムデータから潜伏生物関係を学習する方法について検討した。
思考の連鎖(CoT)推論タスクとしてこの問題をフレーミングすることにより、モデルが疾患のラベルを生成し、様々な患者プロファイルや表現型にまたがる情報的臨床的推論を明確化するよう促される。
この結果は、早期発見、リスクアセスメント、そして究極的には、心臓ケアにおけるパーソナライズド医療の進歩に寄与するLLMの可能性を浮き彫りにした。
関連論文リスト
- Adaptable Cardiovascular Disease Risk Prediction from Heterogeneous Data using Large Language Models [70.64969663547703]
AdaCVDは、英国バイオバンクから50万人以上の参加者を対象に、大規模な言語モデルに基づいて構築された適応可能なCVDリスク予測フレームワークである。
包括的かつ可変的な患者情報を柔軟に取り込み、構造化データと非構造化テキストの両方をシームレスに統合し、最小限の追加データを使用して新規患者の集団に迅速に適応する。
論文 参考訳(メタデータ) (2025-05-30T14:42:02Z) - Multi-modal Integration Analysis of Alzheimer's Disease Using Large Language Models and Knowledge Graphs [0.33554367023486936]
本稿では,大規模言語モデル(LLM)と知識グラフを用いたアルツハイマー病(AD)研究において,断片化されたマルチモーダルデータを統合するための新しい枠組みを提案する。
本手法は,MRI,遺伝子発現,バイオマーカー,脳波,臨床指標の集団レベルでの統合を実証する。
論文 参考訳(メタデータ) (2025-05-21T16:51:49Z) - Improving Diseases Predictions Utilizing External Bio-Banks [1.9336815376402723]
機械学習がどのように活用され、説明可能性を高め、生物学的に意味のある関連を明らかにするかを実証する。
LightGBMモデルをデータセット(10K)のスクラッチからトレーニングして、メタボロミクス機能をインプットします。
汚染された代謝学の特徴は、疾患に関連する危険因子に対する影響を評価するために生存分析に使用される。
論文 参考訳(メタデータ) (2025-03-30T13:05:20Z) - GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。
DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。
また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - Penalized Deep Partially Linear Cox Models with Application to CT Scans
of Lung Cancer Patients [42.09584755334577]
肺がんは世界中のがん死亡の原因であり、効果的な治療法を設計するための死亡リスクを理解することの重要性を強調している。
NLST(National Lung Screening Trial)は、肺がん患者の死亡リスクを定量化するために、CTテクスチャ解析を用いている。
本稿では,SCADペナルティを組み込んで重要なテクスチャ特徴を抽出し,深層ニューラルネットワークを用いてモデルの非パラメトリック成分を推定する,Pentalized Deep partially Linear Cox Model (Penalized DPLC)を提案する。
論文 参考訳(メタデータ) (2023-03-09T15:38:16Z) - Deep Learning of Semi-Competing Risk Data via a New Neural
Expectation-Maximization Algorithm [5.253100011321437]
私たちのモチベーションはボストン肺がん研究(Boston Lung Cancer Study)から来ています。
本稿では,古典的統計的アプローチと機械学習のギャップを埋めるために,ニューラル予測最大化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-22T20:38:57Z) - SurvLatent ODE : A Neural ODE based time-to-event model with competing
risks for longitudinal data improves cancer-associated Deep Vein Thrombosis
(DVT) prediction [68.8204255655161]
本稿では,不規則なサンプルデータの下で潜在表現をパラメータ化する生成時間対イベントモデルSurvLatent ODEを提案する。
そこで,本モデルでは,事象特異的ハザード関数の形状を指定せずに,複数の競合イベントの生存時間を柔軟に推定する。
SurvLatent ODEは、DVTリスクグループを成層化するために、現在の臨床標準であるKhorana Riskスコアより優れている。
論文 参考訳(メタデータ) (2022-04-20T17:28:08Z) - Low-Rank Reorganization via Proportional Hazards Non-negative Matrix
Factorization Unveils Survival Associated Gene Clusters [9.773075235189525]
この研究において、Cox比例ハザードの回帰は生存制約を課すことでNMFと統合される。
ヒト癌遺伝子の発現データを用いて、提案手法は癌遺伝子の重要なクラスターを解明することができる。
発見された遺伝子クラスターは、豊富な生物学的含意を反映し、生存に関連するバイオマーカーの同定に役立つ。
論文 参考訳(メタデータ) (2020-08-09T17:59:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。