論文の概要: ProPath: Disease-Specific Protein Language Model for Variant
Pathogenicity
- arxiv url: http://arxiv.org/abs/2311.03429v1
- Date: Mon, 6 Nov 2023 18:43:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-08 18:18:57.388211
- Title: ProPath: Disease-Specific Protein Language Model for Variant
Pathogenicity
- Title(参考訳): ProPath: 病原性に特異的なタンパク質言語モデル
- Authors: Huixin Zhan, Zijun (Frank) Zhang
- Abstract要約: ProPath と呼ばれる病原性疾患特異的テキストスクレタンパク言語モデルを提案し、シアメーゼネットワークを介して希少なミスセンス変異における擬似log-likelihood 比を捉える。
以上の結果から,ProPathはトレーニング済みのESM1bを超え,両者のデータセット間でAUCを5%以上改善した。
- 参考スコア(独自算出の注目度): 6.635604919499181
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Clinical variant classification of pathogenic versus benign genetic variants
remains a pivotal challenge in clinical genetics. Recently, the proposition of
protein language models has improved the generic variant effect prediction
(VEP) accuracy via weakly-supervised or unsupervised training. However, these
VEPs are not disease-specific, limiting their adaptation at point-of-care. To
address this problem, we propose a disease-specific \textsc{pro}tein language
model for variant \textsc{path}ogenicity, termed ProPath, to capture the
pseudo-log-likelihood ratio in rare missense variants through a siamese
network. We evaluate the performance of ProPath against pre-trained language
models, using clinical variant sets in inherited cardiomyopathies and
arrhythmias that were not seen during training. Our results demonstrate that
ProPath surpasses the pre-trained ESM1b with an over $5\%$ improvement in AUC
across both datasets. Furthermore, our model achieved the highest performances
across all baselines for both datasets. Thus, our ProPath offers a potent
disease-specific variant effect prediction, particularly valuable for disease
associations and clinical applicability.
- Abstract(参考訳): 病原性と良性の遺伝的変異の臨床的変異分類は、臨床遺伝学において重要な課題である。
近年、タンパク質言語モデルの提案により、弱い教師付きまたは教師なしの訓練により、汎用的変異効果予測(VEP)の精度が向上した。
しかしながら、これらのVEPは疾患特異的ではなく、治療点における適応を制限する。
この問題に対処するために,siamのネットワークを介して希少なミスセンスにおける疑似ログ様度比を捉えるために,propath と呼ばれる変種 \textsc{path} 生成のための病特異的な \textsc{pro}tein 言語モデルを提案する。
訓練中にみられなかった心疾患と不整脈に対する臨床変異セットを用いて,事前学習した言語モデルに対するプロパスの性能評価を行った。
我々の結果は、ProPathが事前訓練されたESM1bを超え、両方のデータセットでAUCが5\%以上改善されていることを示している。
さらに,本モデルは,両データセットのベースライン全体において,最高性能を達成した。
したがって、当社のProPathは、特に疾患関連や臨床応用に有用な、強力な疾患特異的変異効果予測を提供する。
関連論文リスト
- DYNA: Disease-Specific Language Model for Variant Pathogenicity [9.662269016653296]
そこで我々は, シームズニューラルネットワークを用いたDYNA:病原性微調整を提案する。
各種の心血管疾患に焦点をあて, 機能低下と機能回復の関係が疾患特異的VEPを規定する。
非コーディングVEPでは、DYNAをRNAスプライシングの転写後調節軸に応用し、確立された臨床VEPガイドラインにおいて最も一般的な非コーディング病原性機構である。
DYNAファインチューニングモデルでは、保持されたまれな変種テストセットにおいて優れた性能を示し、さらに大きな、臨床的に関連のある変種アノテーションで複製される。
論文 参考訳(メタデータ) (2024-05-31T19:52:17Z) - Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - BeeTLe: A Framework for Linear B-Cell Epitope Prediction and
Classification [0.43512163406551996]
本稿では, 線形B細胞予測と抗体型特異的分類のための, 深層学習に基づく新しいフレームワークを提案する。
そこで本研究では, モデルが抗体の表現を学習するのを助けるために, 固有分解に基づくアミノ酸符号化法を提案する。
最大の公開データベースからキュレートしたデータに対する実験結果から,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2023-09-05T09:18:29Z) - A Fully Automated and Explainable Algorithm for the Prediction of
Malignant Transformation in Oral Epithelial Dysplasia [8.927415909296819]
我々は,口腔悪性転換(OMT)リスクスコアを割り当てる人工知能アルゴリズムを開発した。
このアルゴリズムは、内部のセグメンテーションモデルを用いて、上皮内(および周辺)の核の検出とセグメンテーションに基づいている。
提案された OMTscore は、OED が悪性度に進行するか否かを予測するときに AUROC = 0.74 を得る。
論文 参考訳(メタデータ) (2023-07-06T19:11:00Z) - Unsupervised language models for disease variant prediction [3.6942566104432886]
広い配列のデータセットで訓練された1つのタンパク質LMは、あらゆる遺伝子変異ゼロショットに対して病原性を評価することができる。
臨床的にラベル付けされた疾患関連遺伝子の変異について評価すると,その評価性能は最先端技術に匹敵することがわかった。
論文 参考訳(メタデータ) (2022-12-07T22:28:13Z) - Robust and Agnostic Learning of Conditional Distributional Treatment
Effects [62.44901952244514]
条件平均治療効果(CATE)は、個々の因果効果の最適点予測である。
集約分析では、通常は分布処理効果(DTE)の測定によって対処される。
我々は,多種多様な問題に対して条件付きDTE(CDTE)を学習するための,新しい堅牢でモデルに依存しない手法を提供する。
論文 参考訳(メタデータ) (2022-05-23T17:40:31Z) - A k-mer Based Approach for SARS-CoV-2 Variant Identification [55.78588835407174]
アミノ酸の順序を保つことで,分類器の精度が向上することを示す。
また,アメリカ疾病予防管理センター(CDC)が報告した,変異の同定に重要な役割を担っているアミノ酸の重要性も示した。
論文 参考訳(メタデータ) (2021-08-07T15:08:15Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Bayesian prognostic covariate adjustment [59.75318183140857]
疾患の結果に関する歴史的データは、様々な方法で臨床試験の分析に組み込むことができる。
我々は, 予測モデルからの予後スコアを用いて, 治療効果推定の効率を向上する既存の文献に基づいて構築する。
論文 参考訳(メタデータ) (2020-12-24T05:19:03Z) - Increasing the efficiency of randomized trial estimates via linear
adjustment for a prognostic score [59.75318183140857]
ランダム化実験による因果効果の推定は臨床研究の中心である。
歴史的借用法のほとんどは、厳格なタイプiエラー率制御を犠牲にして分散の削減を達成する。
論文 参考訳(メタデータ) (2020-12-17T21:10:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。