論文の概要: Mathematics-assisted directed evolution and protein engineering
- arxiv url: http://arxiv.org/abs/2306.04658v1
- Date: Tue, 6 Jun 2023 19:27:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-09 18:23:04.066269
- Title: Mathematics-assisted directed evolution and protein engineering
- Title(参考訳): 数学支援の指向進化とタンパク質工学
- Authors: Yuchi Qiu, Guo-Wei Wei
- Abstract要約: 巨大な突然変異空間のため、タンパク質ライブラリー全体の深い突然変異スキャンを実行することは実験的に不可能である。
これにより、AI支援指向進化(AIDE)やAI支援タンパク質工学(AIPE)が、新たな研究分野として急速に成長した。
我々は、永続的なラプラシアン、永続的なパスラプラシアン、永続的な層ラプラシアン、永続的なハイパーグラフラプラシアン、永続的なハイパーディグラフラプラシアン、進化的ド・ラム=ホッジ理論を含む永続的なトポロジカルラプラシアン(PTL)のクラスが、この制限を効果的に克服できると主張している。
- 参考スコア(独自算出の注目度): 0.913755431537592
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Directed evolution is a molecular biology technique that is transforming
protein engineering by creating proteins with desirable properties and
functions. However, it is experimentally impossible to perform the deep
mutational scanning of the entire protein library due to the enormous
mutational space, which scales as $20^N$ , where N is the number of amino
acids. This has led to the rapid growth of AI-assisted directed evolution
(AIDE) or AI-assisted protein engineering (AIPE) as an emerging research field.
Aided with advanced natural language processing (NLP) techniques, including
long short-term memory, autoencoder, and transformer, sequence-based embeddings
have been dominant approaches in AIDE and AIPE. Persistent Laplacians, an
emerging technique in topological data analysis (TDA), have made
structure-based embeddings a superb option in AIDE and AIPE. We argue that a
class of persistent topological Laplacians (PTLs), including persistent
Laplacians, persistent path Laplacians, persistent sheaf Laplacians, persistent
hypergraph Laplacians, persistent hyperdigraph Laplacians, and evolutionary de
Rham-Hodge theory, can effectively overcome the limitations of the current TDA
and offer a new generation of more powerful TDA approaches. In the general
framework of topological deep learning, mathematics-assisted directed evolution
(MADE) has a great potential for future protein engineering.
- Abstract(参考訳): 有向進化 (directed evolution) は、タンパク質工学を変換し、望ましい性質と機能を持つタンパク質を作製する分子生物学技術である。
しかし、Nがアミノ酸の数である20^N$までスケールする巨大な突然変異空間のため、タンパク質ライブラリー全体の深い突然変異スキャンを実行することは実験的に不可能である。
これにより、AI支援指向進化(AIDE)やAI支援タンパク質工学(AIPE)が、新たな研究分野として急速に成長した。
長期記憶、オートエンコーダ、トランスフォーマーなどの高度な自然言語処理(NLP)技術によって、シーケンスベースの埋め込みはAIDEやAIPEにおいて支配的なアプローチとなっている。
トポロジカルデータ解析(TDA)の新興技術であるPersistent Laplaciansは、構造ベースの埋め込みをAIDEとAIPEのスーパーブオプションにした。
我々は、永続的なラプラシアン、永続的なパスラプラシアン、永続的な層ラプラシアン、永続的なハイパーグラフラプラシアン、永続的なハイパーディグラフラプラシアン、進化的ド・ラム=ホッジ理論を含む永続的なトポロジカルラプラシアン(PTL)のクラスが、現在のTDAの限界を効果的に克服し、より強力なTDAアプローチの新たな世代を提供することができると主張している。
トポロジカルディープラーニングの一般的な枠組みでは、数学支援指向進化(MADE)は将来のタンパク質工学に大きな可能性を秘めている。
関連論文リスト
- GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本研究では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデルを提案する。
このモデルは分子生物学の中心的なドグマに固執し、タンパク質のコード配列を正確に生成する。
また、特にプロモーター配列の即応的な生成を通じて、シーケンス最適化において大きな可能性を示している。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - A Simple yet Effective DDG Predictor is An Unsupervised Antibody Optimizer and Explainer [53.85265022754878]
高速な突然変異スクリーニングのための軽量DDG予測器(Light-DDG)を提案する。
また、Light-DDGを事前学習するための数百万の突然変異データを含む大規模データセットもリリースした。
対象抗体について,変異選好を学習するための新しい変異説明器を提案する。
論文 参考訳(メタデータ) (2025-02-10T09:26:57Z) - Computational Protein Science in the Era of Large Language Models (LLMs) [54.35488233989787]
計算タンパク質科学(Computational protein science)は、タンパク質配列構造-機能パラダイムにおける知識を明らかにすること、および応用を開発することを目的としている。
最近、言語モデル (Language Models, PLM) は、前例のない言語処理と一般化能力のために、AIのマイルストーンとして登場した。
論文 参考訳(メタデータ) (2025-01-17T16:21:18Z) - Large Language Model is Secretly a Protein Sequence Optimizer [24.55348363931866]
本研究では,与えられた野生型配列から,高い適合度を持つタンパク質配列を見つけることを目的としたタンパク質配列工学的問題を考える。
大規模言語モデル(LLM)は、大量のテキストで訓練されているにもかかわらず、秘密裏にタンパク質配列であることを示す。
論文 参考訳(メタデータ) (2025-01-16T03:44:16Z) - NaNa and MiGu: Semantic Data Augmentation Techniques to Enhance Protein Classification in Graph Neural Networks [60.48306899271866]
本稿では,背骨化学および側鎖生物物理情報をタンパク質分類タスクに組み込む新しい意味データ拡張手法を提案する。
具体的には, 分子生物学的, 二次構造, 化学結合, およびタンパク質のイオン特性を活用し, 分類作業を容易にする。
論文 参考訳(メタデータ) (2024-03-21T13:27:57Z) - Efficiently Predicting Mutational Effect on Homologous Proteins by Evolution Encoding [7.067145619709089]
EvolMPNNは進化を意識したタンパク質の埋め込みを学習するための効率的なモデルである。
我々のモデルは最先端の手法よりも最大6.4%向上し,36倍の高速化を実現している。
論文 参考訳(メタデータ) (2024-02-20T23:06:21Z) - Evolutionary Algorithms Simulating Molecular Evolution: A New Field Proposal [0.0716879432974126]
近年のゲノムシークエンシングの進歩により、タンパク質ファミリーの多様性が明らかにされているが、全てのアミノ酸配列の膨大な検索空間と比較して、既知の機能ファミリーのセットは最小限である。
自然には限定的なタンパク質「語彙」があると言えるかもしれない
進化的アルゴリズム、機械学習(ML)、バイオインフォマティクスを組み合わせることで、これまで存在しなかった全く新しいタンパク質の開発を促進することができる。
論文 参考訳(メタデータ) (2024-02-01T19:22:02Z) - Efficiently Predicting Protein Stability Changes Upon Single-point
Mutation with Large Language Models [51.57843608615827]
タンパク質の熱安定性を正確に予測する能力は、様々なサブフィールドや生化学への応用において重要である。
タンパク質配列と構造的特徴を統合したESMによる効率的なアプローチを導入し, 単一点突然変異によるタンパク質の熱安定性変化を予測する。
論文 参考訳(メタデータ) (2023-12-07T03:25:49Z) - A Latent Diffusion Model for Protein Structure Generation [50.74232632854264]
本稿では,タンパク質モデリングの複雑さを低減できる潜在拡散モデルを提案する。
提案手法は, 高い設計性と効率性を有する新規なタンパク質のバックボーン構造を効果的に生成できることを示す。
論文 参考訳(メタデータ) (2023-05-06T19:10:19Z) - Plug & Play Directed Evolution of Proteins with Gradient-based Discrete
MCMC [1.0499611180329804]
機械学習ベースのタンパク質工学の長年の目標は、新しい突然変異の発見を加速することである。
本稿では,シリコにおけるタンパク質の進化のためのサンプリングフレームワークについて紹介する。
これらのモデルを構成することで、未知の突然変異を評価し、機能的タンパク質を含む可能性のある配列空間の領域を探索する能力を向上させることを目指している。
論文 参考訳(メタデータ) (2022-12-20T00:26:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。