論文の概要: EnTao-GPM: DNA Foundation Model for Predicting the Germline Pathogenic Mutations
- arxiv url: http://arxiv.org/abs/2507.21706v1
- Date: Tue, 29 Jul 2025 11:34:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-30 17:08:56.064843
- Title: EnTao-GPM: DNA Foundation Model for Predicting the Germline Pathogenic Mutations
- Title(参考訳): EnTao-GPM: 胚性病原性変異の予測のためのDNA基盤モデル
- Authors: Zekai Lin, Haoran Sun, Yucheng Guo, Yujie Yang, Yanwen Wang, Bozhen Hu, Chonghang Ye, Qirong Yang, Fan Zhong, Xiaoming Zhang, Lei Liu,
- Abstract要約: 病原性哺乳類ゲノム(ヒト、ブタ、マウス)の事前学習を目的としたクロス種
ClinVarとHGMDの微細調整によるゲルムリン突然変異の特殊化
LLMに基づく統計的説明とDNAシークエンディングの統合に関する解釈可能な臨床的枠組み
- 参考スコア(独自算出の注目度): 16.32431932781823
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Distinguishing pathogenic mutations from benign polymorphisms remains a critical challenge in precision medicine. EnTao-GPM, developed by Fudan University and BioMap, addresses this through three innovations: (1) Cross-species targeted pre-training on disease-relevant mammalian genomes (human, pig, mouse), leveraging evolutionary conservation to enhance interpretation of pathogenic motifs, particularly in non-coding regions; (2) Germline mutation specialization via fine-tuning on ClinVar and HGMD, improving accuracy for both SNVs and non-SNVs; (3) Interpretable clinical framework integrating DNA sequence embeddings with LLM-based statistical explanations to provide actionable insights. Validated against ClinVar, EnTao-GPM demonstrates superior accuracy in mutation classification. It revolutionizes genetic testing by enabling faster, more accurate, and accessible interpretation for clinical diagnostics (e.g., variant assessment, risk identification, personalized treatment) and research, advancing personalized medicine.
- Abstract(参考訳): 良性多型から病原性変異を除去することは、精度医学において重要な課題である。
フダン大学とBioMapが開発したEnTao-GPMは、(1)病原性哺乳類ゲノム(ヒト、ブタ、マウス)の事前学習を目的としたクロスタイプ、特に非コード領域における病原性モチーフの解釈を強化する進化的保存の活用、(2)ClinVarとHGMDの微調整によるゲルムリン突然変異の特殊化、SNVsと非SNVsの精度の向上、(3)LLMに基づく統計的説明とDNA配列の埋め込みの統合による解釈可能な臨床フレームワーク、の3つの革新に対処している。
ClinVarに対して検証されたEnTao-GPMは、突然変異分類において優れた精度を示す。
臨床診断(例えば、変異評価、リスク識別、パーソナライズされた治療)と研究、パーソナライズされた医療の進歩を可能にすることで、遺伝子検査に革命をもたらす。
関連論文リスト
- PathGene: Benchmarking Driver Gene Mutations and Exon Prediction Using Multicenter Lung Cancer Histopathology Image Dataset [3.716599571611912]
肺癌における遺伝子変異、変異サブタイプおよびそれらのエクソンの正確な予測は、パーソナライズされた治療計画と予後評価に重要である。
病理組織像と次世代シークエンシングレポートを組み合わせたPathGeneを収集した。
このマルチセンターデータセットは、全スライディングイメージをドライバ遺伝子変異状態、突然変異サブタイプ、エキソン、腫瘍突然変異負担(TMB)ステータスにリンクする。
論文 参考訳(メタデータ) (2025-05-30T11:51:11Z) - A Simple yet Effective DDG Predictor is An Unsupervised Antibody Optimizer and Explainer [53.85265022754878]
高速な突然変異スクリーニングのための軽量DDG予測器(Light-DDG)を提案する。
また、Light-DDGを事前学習するための数百万の突然変異データを含む大規模データセットもリリースした。
対象抗体について,変異選好を学習するための新しい変異説明器を提案する。
論文 参考訳(メタデータ) (2025-02-10T09:26:57Z) - Survey and Improvement Strategies for Gene Prioritization with Large Language Models [61.24568051916653]
大規模言語モデル (LLM) は, 医学検査において良好に機能しているが, 希少な遺伝疾患の診断における有効性は評価されていない。
表現型と可溶性レベルに基づいて, マルチエージェントとヒトフェノタイプオントロジー(HPO)を分類した。
ベースラインでは、GPT-4は他のLLMよりも優れており、因果遺伝子を正しくランク付けする際の精度は30%近く向上した。
論文 参考訳(メタデータ) (2025-01-30T23:03:03Z) - Multivariate Feature Selection and Autoencoder Embeddings of Ovarian Cancer Clinical and Genetic Data [2.973561339858947]
本研究は,卵巣癌(OC)における新規な臨床および遺伝マーカー発見のためのデータ駆動的アプローチについて検討する。
オートエンコーダ解析では、臨床特徴と臨床および遺伝データの組合せを用いて、より明確なパターンが出現した。
主要な臨床変数(手術の種類、ネオアジュバント化学療法など)と特定の遺伝子変異は、リスクの低い遺伝子因子と強い関連性を示した。
論文 参考訳(メタデータ) (2025-01-27T09:07:07Z) - Integrating Large Language Models for Genetic Variant Classification [12.244115429231888]
大型言語モデル (LLM) は遺伝学においてトランスフォーメーションツールとして登場した。
本研究では,GPN-MSA,ESM1b,AlphaMissenseを含む最先端LLMの統合について検討した。
提案手法は,よく注釈付けされたProteinGymとClinVarのデータセットを用いて,これらの統合モデルを評価する。
論文 参考訳(メタデータ) (2024-11-07T13:45:56Z) - ALPHAGMUT: A Rationale-Guided Alpha Shape Graph Neural Network to Evaluate Mutation Effects [8.331322657310292]
本研究では,変異効果を評価するための有理グラフニューラルネットワークAlphaGMutを提案する。
グラフのノード属性として割り当てられる変異部位の構造的, 位相的, 生物物理学的, シーケンス的特性を計算する。
我々は、AlphaGMutがDeepMindのAlphaMissenseを含む最先端の手法よりも多くのパフォーマンス指標で優れていることを示す。
論文 参考訳(メタデータ) (2024-06-13T14:22:12Z) - Predicting Genetic Mutation from Whole Slide Images via Biomedical-Linguistic Knowledge Enhanced Multi-label Classification [119.13058298388101]
遺伝子変異予測性能を向上させるため,生物知識を付加したPathGenomic Multi-label Transformerを開発した。
BPGTはまず、2つの慎重に設計されたモジュールによって遺伝子前駆体を構成する新しい遺伝子エンコーダを確立する。
BPGTはその後ラベルデコーダを設計し、最終的に2つの調整されたモジュールによる遺伝的突然変異予測を行う。
論文 参考訳(メタデータ) (2024-06-05T06:42:27Z) - VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - PhyloTransformer: A Discriminative Model for Mutation Prediction Based
on a Multi-head Self-attention Mechanism [10.468453827172477]
重症急性呼吸器症候群ウイルス2(SARS-CoV-2)は10/19/21で219万人が感染し、死亡率は3.6%となっている。
そこで我々は,トランスフォーマーを用いた識別モデルであるPhylo Transformerを開発した。
論文 参考訳(メタデータ) (2021-11-03T01:30:57Z) - A k-mer Based Approach for SARS-CoV-2 Variant Identification [55.78588835407174]
アミノ酸の順序を保つことで,分類器の精度が向上することを示す。
また,アメリカ疾病予防管理センター(CDC)が報告した,変異の同定に重要な役割を担っているアミノ酸の重要性も示した。
論文 参考訳(メタデータ) (2021-08-07T15:08:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。