論文の概要: Protein language model rescue mutations highlight variant effects and
structure in clinically relevant genes
- arxiv url: http://arxiv.org/abs/2211.10000v1
- Date: Fri, 18 Nov 2022 03:00:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-21 15:44:00.179168
- Title: Protein language model rescue mutations highlight variant effects and
structure in clinically relevant genes
- Title(参考訳): タンパク質言語モデル救難変異は臨床関連遺伝子における変異効果と構造を強調する
- Authors: Onuralp Soylemez and Pablo Cordero
- Abstract要約: 我々は、培養された医療作用のある遺伝子において既知の病原体変異を特徴付けるために、タンパク質言語モデルの使用を疑問視する。
これらの補償突然変異の予測された効果の体系的解析は、タンパク質の構造的特徴が未承認であることを明らかにする。
我々は、より洗練された共同作業戦略の設計を通知するために、救助突然変異実験を作成、キュレートすることをコミュニティに奨励する。
- 参考スコア(独自算出の注目度): 1.7970523486905976
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite being self-supervised, protein language models have shown remarkable
performance in fundamental biological tasks such as predicting impact of
genetic variation on protein structure and function. The effectiveness of these
models on diverse set of tasks suggests that they learn meaningful
representations of fitness landscape that can be useful for downstream clinical
applications. Here, we interrogate the use of these language models in
characterizing known pathogenic mutations in curated, medically actionable
genes through an exhaustive search of putative compensatory mutations on each
variant's genetic background. Systematic analysis of the predicted effects of
these compensatory mutations reveal unappreciated structural features of
proteins that are missed by other structure predictors like AlphaFold. While
deep mutational scan experiments provide an unbiased estimate of the mutational
landscape, we encourage the community to generate and curate rescue mutation
experiments to inform the design of more sophisticated co-masking strategies
and leverage large language models more effectively for downstream clinical
prediction tasks.
- Abstract(参考訳): タンパク質言語モデルは自己管理されているにもかかわらず、遺伝子変異がタンパク質の構造と機能に与える影響を予測するなど、基本的な生物学的タスクにおいて顕著な性能を示した。
多様なタスクに対するこれらのモデルの有効性は、下流の臨床応用に役立つフィットネスランドスケープの有意義な表現を学習できることを示唆している。
ここでは、これらの言語モデルを用いて、各変異体の遺伝学的背景を包括的に探索することにより、治療対象遺伝子中の既知の病原性突然変異を同定する。
これらの補償突然変異の予測効果を体系的に分析すると、アルファフォールドのような他の構造予測因子が見逃しているタンパク質の構造的特徴が明らかになる。
深部突然変異スキャン実験は突然変異の景観を偏りなく推定するが、より洗練された共同マスク戦略の設計を知らせ、下流の臨床予測タスクにより大きな言語モデルをより効果的に活用するために、救難突然変異実験の生成とキュレーションをコミュニティに促す。
関連論文リスト
- Integrating Large Language Models for Genetic Variant Classification [12.244115429231888]
大型言語モデル (LLM) は遺伝学においてトランスフォーメーションツールとして登場した。
本研究では,GPN-MSA,ESM1b,AlphaMissenseを含む最先端LLMの統合について検討した。
提案手法は,よく注釈付けされたProteinGymとClinVarのデータセットを用いて,これらの統合モデルを評価する。
論文 参考訳(メタデータ) (2024-11-07T13:45:56Z) - Retrieval-Enhanced Mutation Mastery: Augmenting Zero-Shot Prediction of Protein Language Model [3.4494754789770186]
タンパク質モデリングの深層学習法は従来の手法に比べて低コストで優れた結果を示した。
突然変異効果予測において、事前学習されたディープラーニングモデルの鍵は、タンパク質配列、構造、機能の間の複雑な関係を正確に解釈することにある。
本研究では,配列と局所構造相互作用から自然特性を包括的に解析する検索強化タンパク質言語モデルを提案する。
論文 参考訳(メタデータ) (2024-10-28T15:28:51Z) - HERMES: Holographic Equivariant neuRal network model for Mutational Effect and Stability prediction [0.0]
HERMESは、突然変異効果と安定性予測のための3次元回転同変構造に基づくニューラルネットワークモデルである。
本稿では,HERMESモデルの組を,異なる戦略で事前学習し,変異の安定性効果を予測するために微調整する。
論文 参考訳(メタデータ) (2024-07-09T09:31:05Z) - Predicting Genetic Mutation from Whole Slide Images via Biomedical-Linguistic Knowledge Enhanced Multi-label Classification [119.13058298388101]
遺伝子変異予測性能を向上させるため,生物知識を付加したPathGenomic Multi-label Transformerを開発した。
BPGTはまず、2つの慎重に設計されたモジュールによって遺伝子前駆体を構成する新しい遺伝子エンコーダを確立する。
BPGTはその後ラベルデコーダを設計し、最終的に2つの調整されたモジュールによる遺伝的突然変異予測を行う。
論文 参考訳(メタデータ) (2024-06-05T06:42:27Z) - Learning to Predict Mutation Effects of Protein-Protein Interactions by Microenvironment-aware Hierarchical Prompt Learning [78.38442423223832]
我々は、新しいコードブック事前学習タスク、すなわちマスク付きマイクロ環境モデリングを開発する。
突然変異効果予測において、最先端の事前学習法よりも優れた性能と訓練効率を示す。
論文 参考訳(メタデータ) (2024-05-16T03:53:21Z) - VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - Efficiently Predicting Protein Stability Changes Upon Single-point
Mutation with Large Language Models [51.57843608615827]
タンパク質の熱安定性を正確に予測する能力は、様々なサブフィールドや生化学への応用において重要である。
タンパク質配列と構造的特徴を統合したESMによる効率的なアプローチを導入し, 単一点突然変異によるタンパク質の熱安定性変化を予測する。
論文 参考訳(メタデータ) (2023-12-07T03:25:49Z) - Multi-level Protein Representation Learning for Blind Mutational Effect
Prediction [5.207307163958806]
本稿では,タンパク質構造解析のためのシーケンシャルおよび幾何学的アナライザをカスケードする,新しい事前学習フレームワークを提案する。
野生型タンパク質の自然選択をシミュレートすることにより、所望の形質に対する突然変異方向を誘導する。
提案手法は,多種多様な効果予測タスクに対して,パブリックデータベースと2つの新しいデータベースを用いて評価する。
論文 参考訳(メタデータ) (2023-06-08T03:00:50Z) - Accurate and Definite Mutational Effect Prediction with Lightweight
Equivariant Graph Neural Networks [2.381587712372268]
本研究では,野生型タンパク質の微小環境を効率的に解析する軽量なグラフ表現学習手法を提案する。
私たちのソリューションは、コミュニティにとって理想的な選択肢となる、幅広いメリットを提供します。
論文 参考訳(メタデータ) (2023-04-13T09:51:49Z) - Benchmarking Heterogeneous Treatment Effect Models through the Lens of
Interpretability [82.29775890542967]
治療のパーソナライズされた効果を見積もるのは複雑だが、普及している問題である。
ヘテロジニアス処理効果推定に関する機械学習文献の最近の進歩は、洗練されたが不透明なツールの多くを生み出した。
我々は、ポストホックな特徴重要度法を用いて、モデルの予測に影響を及ぼす特徴を特定する。
論文 参考訳(メタデータ) (2022-06-16T17:59:05Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。