論文の概要: Protein language model rescue mutations highlight variant effects and
structure in clinically relevant genes
- arxiv url: http://arxiv.org/abs/2211.10000v1
- Date: Fri, 18 Nov 2022 03:00:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-21 15:44:00.179168
- Title: Protein language model rescue mutations highlight variant effects and
structure in clinically relevant genes
- Title(参考訳): タンパク質言語モデル救難変異は臨床関連遺伝子における変異効果と構造を強調する
- Authors: Onuralp Soylemez and Pablo Cordero
- Abstract要約: 我々は、培養された医療作用のある遺伝子において既知の病原体変異を特徴付けるために、タンパク質言語モデルの使用を疑問視する。
これらの補償突然変異の予測された効果の体系的解析は、タンパク質の構造的特徴が未承認であることを明らかにする。
我々は、より洗練された共同作業戦略の設計を通知するために、救助突然変異実験を作成、キュレートすることをコミュニティに奨励する。
- 参考スコア(独自算出の注目度): 1.7970523486905976
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite being self-supervised, protein language models have shown remarkable
performance in fundamental biological tasks such as predicting impact of
genetic variation on protein structure and function. The effectiveness of these
models on diverse set of tasks suggests that they learn meaningful
representations of fitness landscape that can be useful for downstream clinical
applications. Here, we interrogate the use of these language models in
characterizing known pathogenic mutations in curated, medically actionable
genes through an exhaustive search of putative compensatory mutations on each
variant's genetic background. Systematic analysis of the predicted effects of
these compensatory mutations reveal unappreciated structural features of
proteins that are missed by other structure predictors like AlphaFold. While
deep mutational scan experiments provide an unbiased estimate of the mutational
landscape, we encourage the community to generate and curate rescue mutation
experiments to inform the design of more sophisticated co-masking strategies
and leverage large language models more effectively for downstream clinical
prediction tasks.
- Abstract(参考訳): タンパク質言語モデルは自己管理されているにもかかわらず、遺伝子変異がタンパク質の構造と機能に与える影響を予測するなど、基本的な生物学的タスクにおいて顕著な性能を示した。
多様なタスクに対するこれらのモデルの有効性は、下流の臨床応用に役立つフィットネスランドスケープの有意義な表現を学習できることを示唆している。
ここでは、これらの言語モデルを用いて、各変異体の遺伝学的背景を包括的に探索することにより、治療対象遺伝子中の既知の病原性突然変異を同定する。
これらの補償突然変異の予測効果を体系的に分析すると、アルファフォールドのような他の構造予測因子が見逃しているタンパク質の構造的特徴が明らかになる。
深部突然変異スキャン実験は突然変異の景観を偏りなく推定するが、より洗練された共同マスク戦略の設計を知らせ、下流の臨床予測タスクにより大きな言語モデルをより効果的に活用するために、救難突然変異実験の生成とキュレーションをコミュニティに促す。
関連論文リスト
- xTrimoPGLM: Unified 100B-Scale Pre-trained Transformer for Deciphering
the Language of Protein [76.18058946124111]
本稿では,タンパク質の理解と生成を同時に行うために,統一されたタンパク質言語モデル xTrimoPGLM を提案する。
xTrimoPGLMは、4つのカテゴリにわたる18のタンパク質理解ベンチマークにおいて、他の高度なベースラインを著しく上回っている。
また、自然の原理に従ってデノボタンパク質配列を生成でき、微調整を監督した後にプログラム可能な生成を行うことができる。
論文 参考訳(メタデータ) (2024-01-11T15:03:17Z) - Efficiently Predicting Protein Stability Changes Upon Single-point
Mutation with Large Language Models [51.57843608615827]
タンパク質の熱安定性を正確に予測する能力は、様々なサブフィールドや生化学への応用において重要である。
タンパク質配列と構造的特徴を統合したESMによる効率的なアプローチを導入し, 単一点突然変異によるタンパク質の熱安定性変化を予測する。
論文 参考訳(メタデータ) (2023-12-07T03:25:49Z) - Multi-level Protein Representation Learning for Blind Mutational Effect
Prediction [5.207307163958806]
本稿では,タンパク質構造解析のためのシーケンシャルおよび幾何学的アナライザをカスケードする,新しい事前学習フレームワークを提案する。
野生型タンパク質の自然選択をシミュレートすることにより、所望の形質に対する突然変異方向を誘導する。
提案手法は,多種多様な効果予測タスクに対して,パブリックデータベースと2つの新しいデータベースを用いて評価する。
論文 参考訳(メタデータ) (2023-06-08T03:00:50Z) - Accurate and Definite Mutational Effect Prediction with Lightweight
Equivariant Graph Neural Networks [2.381587712372268]
本研究では,野生型タンパク質の微小環境を効率的に解析する軽量なグラフ表現学習手法を提案する。
私たちのソリューションは、コミュニティにとって理想的な選択肢となる、幅広いメリットを提供します。
論文 参考訳(メタデータ) (2023-04-13T09:51:49Z) - Structure-informed Language Models Are Protein Designers [69.70134899296912]
配列ベースタンパク質言語モデル(pLM)の汎用的手法であるLM-Designを提案する。
pLMに軽量な構造アダプターを埋め込んだ構造手術を行い,構造意識を付加した構造手術を行った。
実験の結果,我々の手法は最先端の手法よりも大きなマージンで優れていることがわかった。
論文 参考訳(メタデータ) (2023-02-03T10:49:52Z) - Plug & Play Directed Evolution of Proteins with Gradient-based Discrete
MCMC [1.0499611180329804]
機械学習ベースのタンパク質工学の長年の目標は、新しい突然変異の発見を加速することである。
本稿では,シリコにおけるタンパク質の進化のためのサンプリングフレームワークについて紹介する。
これらのモデルを構成することで、未知の突然変異を評価し、機能的タンパク質を含む可能性のある配列空間の領域を探索する能力を向上させることを目指している。
論文 参考訳(メタデータ) (2022-12-20T00:26:23Z) - Unsupervised language models for disease variant prediction [3.6942566104432886]
広い配列のデータセットで訓練された1つのタンパク質LMは、あらゆる遺伝子変異ゼロショットに対して病原性を評価することができる。
臨床的にラベル付けされた疾患関連遺伝子の変異について評価すると,その評価性能は最先端技術に匹敵することがわかった。
論文 参考訳(メタデータ) (2022-12-07T22:28:13Z) - Benchmarking Heterogeneous Treatment Effect Models through the Lens of
Interpretability [82.29775890542967]
治療のパーソナライズされた効果を見積もるのは複雑だが、普及している問題である。
ヘテロジニアス処理効果推定に関する機械学習文献の最近の進歩は、洗練されたが不透明なツールの多くを生み出した。
我々は、ポストホックな特徴重要度法を用いて、モデルの予測に影響を及ぼす特徴を特定する。
論文 参考訳(メタデータ) (2022-06-16T17:59:05Z) - Tranception: protein fitness prediction with autoregressive transformers
and inference-time retrieval [23.49976148784686]
タンパク質配列のフィットネスランドスケープを正確にモデル化する能力は、幅広い応用に不可欠である。
複数の配列アライメントに基づいて訓練されたタンパク質配列の深い生成モデルが、これらの課題に対処するための最も成功したアプローチである。
多様なファミリーから大量の非整合タンパク質配列を訓練した大規模な言語モデルは、これらの問題に対処する。
論文 参考訳(メタデータ) (2022-05-27T04:51:15Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。