論文の概要: DYNA: Disease-Specific Language Model for Variant Pathogenicity
- arxiv url: http://arxiv.org/abs/2406.00164v1
- Date: Fri, 31 May 2024 19:52:17 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-06 08:23:47.944139
- Title: DYNA: Disease-Specific Language Model for Variant Pathogenicity
- Title(参考訳): DYNA : 病原性に関する言語モデル
- Authors: Huixin Zhan, Zijun Zhang,
- Abstract要約: そこで我々は, シームズニューラルネットワークを用いたDYNA:病原性微調整を提案する。
各種の心血管疾患に焦点をあて, 機能低下と機能回復の関係が疾患特異的VEPを規定する。
非コーディングVEPでは、DYNAをRNAスプライシングの転写後調節軸に応用し、確立された臨床VEPガイドラインにおいて最も一般的な非コーディング病原性機構である。
DYNAファインチューニングモデルでは、保持されたまれな変種テストセットにおいて優れた性能を示し、さらに大きな、臨床的に関連のある変種アノテーションで複製される。
- 参考スコア(独自算出の注目度): 9.662269016653296
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Clinical variant classification of pathogenic versus benign genetic variants remains a challenge in clinical genetics. Recently, the proposition of genomic foundation models has improved the generic variant effect prediction (VEP) accuracy via weakly-supervised or unsupervised training. However, these VEPs are not disease-specific, limiting their adaptation at the point of care. To address this problem, we propose DYNA: Disease-specificity fine-tuning via a Siamese neural network broadly applicable to all genomic foundation models for more effective variant effect predictions in disease-specific contexts. We evaluate DYNA in two distinct disease-relevant tasks. For coding VEPs, we focus on various cardiovascular diseases, where gene-disease relationships of loss-of-function vs. gain-of-function dictate disease-specific VEP. For non-coding VEPs, we apply DYNA to an essential post-transcriptional regulatory axis of RNA splicing, the most common non-coding pathogenic mechanism in established clinical VEP guidelines. In both cases, DYNA fine-tunes various pre-trained genomic foundation models on small, rare variant sets. The DYNA fine-tuned models show superior performance in the held-out rare variant testing set and are further replicated in large, clinically-relevant variant annotations in ClinVAR. Thus, DYNA offers a potent disease-specific variant effect prediction method, excelling in intra-gene generalization and generalization to unseen genetic variants, making it particularly valuable for disease associations and clinical applicability.
- Abstract(参考訳): 病原性と良性の遺伝的変異の臨床的変異分類は、臨床遺伝学における課題である。
近年、ゲノム基盤モデルの提案により、弱教師付きまたは教師なしのトレーニングにより、一般的な変動効果予測(VEP)の精度が向上した。
しかしながら、これらのVEPは疾患特異的ではなく、治療の時点で適応を制限する。
この問題に対処するために、我々はDYNAを提案する: 病気特異的な文脈におけるより効果的な変異効果予測のために、シームズニューラルネットワークを介して、すべてのゲノム基盤モデルに広く適用する。
我々はDYNAを2つの異なる疾患関連タスクで評価した。
VEPのコーディングには、機能喪失と機能獲得の関係が疾患特異的なVEPを規定する様々な心血管疾患に焦点をあてる。
非コード型VEPでは、DYNAをRNAスプライシングの転写後調節軸に応用し、確立された臨床VEPガイドラインにおいて最も一般的な非コード病原性機構である。
どちらの場合も、DYNAは小さな稀な変種集合上の様々な事前訓練されたゲノム基盤モデルを微調整する。
DYNAファインチューニングモデルは、保持された稀な変種テストセットにおいて優れた性能を示し、ClinVARの大規模かつ臨床的に関連のある変種アノテーションでさらに複製される。
したがって、DYNAは、遺伝子内一般化および未確認遺伝子変異への一般化に優れた強力な疾患特異的変異効果予測方法を提供し、疾患関連や臨床応用に特に有用である。
関連論文リスト
- Integrating Large Language Models for Genetic Variant Classification [12.244115429231888]
大型言語モデル (LLM) は遺伝学においてトランスフォーメーションツールとして登場した。
本研究では,GPN-MSA,ESM1b,AlphaMissenseを含む最先端LLMの統合について検討した。
提案手法は,よく注釈付けされたProteinGymとClinVarのデータセットを用いて,これらの統合モデルを評価する。
論文 参考訳(メタデータ) (2024-11-07T13:45:56Z) - Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - Path-GPTOmic: A Balanced Multi-modal Learning Framework for Survival Outcome Prediction [14.204637932937082]
本稿では,癌生存率予測のためのマルチモーダルパスGPTOmicフレームワークを提案する。
基礎モデルである scGPT の埋め込み空間は,最初は単一セルRNA-seq で訓練された。
生存予測のためのCox部分的可能性損失に対応する勾配変調機構を提案する。
論文 参考訳(メタデータ) (2024-03-18T00:02:48Z) - ProPath: Disease-Specific Protein Language Model for Variant
Pathogenicity [11.414690866985474]
ProPath と呼ばれる病原性疾患特異的テキストスクレタンパク言語モデルを提案し、シアメーゼネットワークを介して希少なミスセンス変異における擬似log-likelihood 比を捉える。
以上の結果から,ProPathはトレーニング済みのESM1bを超え,両者のデータセット間でAUCを5%以上改善した。
論文 参考訳(メタデータ) (2023-11-06T18:43:47Z) - Multi-modal Variational Autoencoders for normative modelling across
multiple imaging modalities [0.1534667887016089]
本稿では,T1およびDTIデータ間の主観レベルずれを検出するための2つのマルチモーダルVAE規範モデルを提案する。
提案モデルでは, 疾患を検知し, 重症度を把握し, 患者の認知と相関する可能性が示唆された。
論文 参考訳(メタデータ) (2023-03-16T09:14:48Z) - Domain Invariant Model with Graph Convolutional Network for Mammogram
Classification [49.691629817104925]
グラフ畳み込みネットワークを用いたドメイン不変モデル(DIM-GCN)を提案する。
まず,潜伏変数を病原性その他の疾患関連部位に明示的に分解するベイズネットワークを提案する。
マクロな特徴をよりよく捉えるために、我々は、GCN(Graph Convolutional Network)を介して、観察された臨床特性を再構築の目的として活用する。
論文 参考訳(メタデータ) (2022-04-21T08:23:44Z) - rfPhen2Gen: A machine learning based association study of brain imaging
phenotypes to genotypes [71.1144397510333]
56個の脳画像QTを用いてSNPを予測する機械学習モデルを学習した。
アルツハイマー病(AD)リスク遺伝子APOEのSNPは、ラスソとランダムな森林に対して最低のRMSEを有していた。
ランダム・フォレストは、線形モデルによって優先順位付けされなかったが、脳関連疾患と関連があることが知られている追加のSNPを特定した。
論文 参考訳(メタデータ) (2022-03-31T20:15:22Z) - Deep neural networks with controlled variable selection for the
identification of putative causal genetic variants [0.43012765978447565]
本稿では,遺伝的研究のための可変選択を制御した,アンサンブルを用いた解釈可能なニューラルネットワークモデルを提案する。
本手法の利点は,(1)遺伝的変異の非線形効果を柔軟にモデル化し,統計力を向上させること,(2)誤発見率を厳格に制御するために入力層内の複数のノックオフ,(3)重みパラメータやアクティベーションの数を大幅に減らし,計算効率を向上させること,を含む。
論文 参考訳(メタデータ) (2021-09-29T20:57:48Z) - A k-mer Based Approach for SARS-CoV-2 Variant Identification [55.78588835407174]
アミノ酸の順序を保つことで,分類器の精度が向上することを示す。
また,アメリカ疾病予防管理センター(CDC)が報告した,変異の同定に重要な役割を担っているアミノ酸の重要性も示した。
論文 参考訳(メタデータ) (2021-08-07T15:08:15Z) - Adversarial Sample Enhanced Domain Adaptation: A Case Study on
Predictive Modeling with Electronic Health Records [57.75125067744978]
ドメイン適応を容易にするデータ拡張手法を提案する。
逆生成したサンプルはドメイン適応時に使用される。
その結果,本手法の有効性とタスクの一般性が確認された。
論文 参考訳(メタデータ) (2021-01-13T03:20:20Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。