論文の概要: DeepVRegulome: DNABERT-based deep-learning framework for predicting the functional impact of short genomic variants on the human regulome
- arxiv url: http://arxiv.org/abs/2511.09026v1
- Date: Thu, 13 Nov 2025 01:26:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-13 22:34:54.363184
- Title: DeepVRegulome: DNABERT-based deep-learning framework for predicting the functional impact of short genomic variants on the human regulome
- Title(参考訳): DeepVRegulome: DNABERTを基盤とした短期ゲノム変異体のヒトレギュロームに対する機能的影響予測のためのディープラーニングフレームワーク
- Authors: Pratik Dutta, Matthew Obusan, Rekha Sathian, Max Chao, Pallavi Surana, Nimisha Papineni, Yanrong Ji, Zhihan Zhou, Han Liu, Alisa Yurovsky, Ramana V Davuluri,
- Abstract要約: Deep VRegulomeはヒトレギュロメにおける機能的破壊的変異の予測と解釈のためのディープラーニング手法である。
生存関連変異および調節領域の優先順位付けにおけるTGAグリオブラストマWGSデータセットの応用について紹介する。
- 参考スコア(独自算出の注目度): 6.877744260030448
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Whole-genome sequencing (WGS) has revealed numerous non-coding short variants whose functional impacts remain poorly understood. Despite recent advances in deep-learning genomic approaches, accurately predicting and prioritizing clinically relevant mutations in gene regulatory regions remains a major challenge. Here we introduce Deep VRegulome, a deep-learning method for prediction and interpretation of functionally disruptive variants in the human regulome, which combines 700 DNABERT fine-tuned models, trained on vast amounts of ENCODE gene regulatory regions, with variant scoring, motif analysis, attention-based visualization, and survival analysis. We showcase its application on TCGA glioblastoma WGS dataset in prioritizing survival-associated mutations and regulatory regions. The analysis identified 572 splice-disrupting and 9,837 transcription-factor binding site altering mutations occurring in greater than 10% of glioblastoma samples. Survival analysis linked 1352 mutations and 563 disrupted regulatory regions to patient outcomes, enabling stratification via non-coding mutation signatures. All the code, fine-tuned models, and an interactive data portal are publicly available.
- Abstract(参考訳): WGS(Whole-Geneome Sequencing)は、機能的影響がほとんど理解されていない多くの非コーディングショート変異体を明らかにしている。
近年のディープラーニングゲノムアプローチの進歩にもかかわらず、遺伝子制御領域における臨床的に関連する突然変異を正確に予測し優先順位付けすることは大きな課題である。
そこで,Deep VRegulomeを紹介する。Deep VRegulomeは,700個のDNABERTを微調整したモデルと,多量のERCODE遺伝子制御領域を訓練し,変量評価,モチーフ解析,注目に基づく可視化,生存分析を併用した,ヒトレギュロームにおける機能的破壊的変異の予測と解釈のためのディープラーニング手法である。
生存関連変異および調節領域の優先順位付けにおけるTGAグリオブラストマWGSデータセットの応用について紹介する。
この分析では、グリオ芽腫の10%以上で発生する変異を改変した572個のスプライス破壊と9,837個の転写因子結合部位を同定した。
生存分析では、1352の突然変異と633の調節領域を患者の結果に関連付け、非コード変異による成層化を可能にした。
すべてのコード、微調整されたモデル、インタラクティブなデータポータルが公開されている。
関連論文リスト
- Dynamicasome: a molecular dynamics-guided and AI-driven pathogenicity prediction catalogue for all genetic mutations [1.5071448753819772]
分子動力学シミュレーションから抽出した詳細なコンフォメーションデータをAIモデルに組み込むことで予測能力を向上することを示す。
疾患遺伝子PMM2の抜本的変異解析およびMDSに対する各変異体の構造モデルについて検討した。
我々の最高のパフォーマンスモデルである神経ネットワークモデルもまた、現在未知のシグニカンスと見なされているいくつかのPMM2変異の病原性を予測する。
論文 参考訳(メタデータ) (2025-09-23T17:33:05Z) - EnTao-GPM: DNA Foundation Model for Predicting the Germline Pathogenic Mutations [16.32431932781823]
病原性哺乳類ゲノム(ヒト、ブタ、マウス)の事前学習を目的としたクロス種
ClinVarとHGMDの微細調整によるゲルムリン突然変異の特殊化
LLMに基づく統計的説明とDNAシークエンディングの統合に関する解釈可能な臨床的枠組み
論文 参考訳(メタデータ) (2025-07-29T11:34:41Z) - GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。
DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。
また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - Predicting loss-of-function impact of genetic mutations: a machine
learning approach [0.0]
本稿では,遺伝子変異の属性に基づいて機械学習モデルを学習し,LoFtoolスコアを予測することを目的とする。
これらの属性には、染色体上の突然変異の位置、アミノ酸の変化、変異によって引き起こされるコドンの変化が含まれていた。
モデルは, 平均2乗誤差, 平均2乗誤差, 平均2乗誤差, 平均絶対誤差, 説明分散の5倍のクロスバリデード平均を用いて評価した。
論文 参考訳(メタデータ) (2024-01-26T19:27:38Z) - Granger causal inference on DAGs identifies genomic loci regulating
transcription [77.58911272503771]
GrID-Netは、DBG構造化システムにおけるGranger因果推論のためのラタグメッセージパッシングを備えたグラフニューラルネットワークに基づくフレームワークである。
我々の応用は、特定の遺伝子の調節を仲介するゲノム座を同定する単一セルマルチモーダルデータの解析である。
論文 参考訳(メタデータ) (2022-10-18T21:15:10Z) - PhyloTransformer: A Discriminative Model for Mutation Prediction Based
on a Multi-head Self-attention Mechanism [10.468453827172477]
重症急性呼吸器症候群ウイルス2(SARS-CoV-2)は10/19/21で219万人が感染し、死亡率は3.6%となっている。
そこで我々は,トランスフォーマーを用いた識別モデルであるPhylo Transformerを開発した。
論文 参考訳(メタデータ) (2021-11-03T01:30:57Z) - Multi-modal Self-supervised Pre-training for Regulatory Genome Across
Cell Types [75.65676405302105]
我々は、GeneBERTと呼ばれる、多モードかつ自己管理的な方法でゲノムデータを事前学習するための、単純かつ効果的なアプローチを提案する。
我々はATAC-seqデータセットで1700万のゲノム配列でモデルを事前訓練する。
論文 参考訳(メタデータ) (2021-10-11T12:48:44Z) - Transcriptome-wide prediction of prostate cancer gene expression from
histopathology images using co-expression based convolutional neural networks [0.8874479658912061]
形態と遺伝子発現の関係を特異的にモデル化する新しい計算効率の高い手法を提案する。
前立腺癌におけるRNA塩基配列推定のためのCNNを用いた第1回トランスクリプトーム解析を行った。
論文 参考訳(メタデータ) (2021-04-19T13:50:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。