Fugu-MT 論文翻訳(概要): Mathematics-assisted directed evolution and protein engineering

論文の概要: Mathematics-assisted directed evolution and protein engineering

arxiv url: http://arxiv.org/abs/2306.04658v1
Date: Tue, 6 Jun 2023 19:27:11 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-09 18:23:04.066269
Title: Mathematics-assisted directed evolution and protein engineering
Title（参考訳）: 数学支援の指向進化とタンパク質工学
Authors: Yuchi Qiu, Guo-Wei Wei
Abstract要約: 巨大な突然変異空間のため、タンパク質ライブラリー全体の深い突然変異スキャンを実行することは実験的に不可能である。これにより、AI支援指向進化(AIDE)やAI支援タンパク質工学(AIPE)が、新たな研究分野として急速に成長した。我々は、永続的なラプラシアン、永続的なパスラプラシアン、永続的な層ラプラシアン、永続的なハイパーグラフラプラシアン、永続的なハイパーディグラフラプラシアン、進化的ド・ラム=ホッジ理論を含む永続的なトポロジカルラプラシアン(PTL)のクラスが、この制限を効果的に克服できると主張している。
参考スコア（独自算出の注目度）: 0.913755431537592
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Directed evolution is a molecular biology technique that is transforming protein engineering by creating proteins with desirable properties and functions. However, it is experimentally impossible to perform the deep mutational scanning of the entire protein library due to the enormous mutational space, which scales as $20^N$ , where N is the number of amino acids. This has led to the rapid growth of AI-assisted directed evolution (AIDE) or AI-assisted protein engineering (AIPE) as an emerging research field. Aided with advanced natural language processing (NLP) techniques, including long short-term memory, autoencoder, and transformer, sequence-based embeddings have been dominant approaches in AIDE and AIPE. Persistent Laplacians, an emerging technique in topological data analysis (TDA), have made structure-based embeddings a superb option in AIDE and AIPE. We argue that a class of persistent topological Laplacians (PTLs), including persistent Laplacians, persistent path Laplacians, persistent sheaf Laplacians, persistent hypergraph Laplacians, persistent hyperdigraph Laplacians, and evolutionary de Rham-Hodge theory, can effectively overcome the limitations of the current TDA and offer a new generation of more powerful TDA approaches. In the general framework of topological deep learning, mathematics-assisted directed evolution (MADE) has a great potential for future protein engineering.
Abstract（参考訳）: 有向進化 (directed evolution) は、タンパク質工学を変換し、望ましい性質と機能を持つタンパク質を作製する分子生物学技術である。しかし、Nがアミノ酸の数である20^N$までスケールする巨大な突然変異空間のため、タンパク質ライブラリー全体の深い突然変異スキャンを実行することは実験的に不可能である。これにより、AI支援指向進化(AIDE)やAI支援タンパク質工学(AIPE)が、新たな研究分野として急速に成長した。長期記憶、オートエンコーダ、トランスフォーマーなどの高度な自然言語処理(NLP)技術によって、シーケンスベースの埋め込みはAIDEやAIPEにおいて支配的なアプローチとなっている。トポロジカルデータ解析(TDA)の新興技術であるPersistent Laplaciansは、構造ベースの埋め込みをAIDEとAIPEのスーパーブオプションにした。我々は、永続的なラプラシアン、永続的なパスラプラシアン、永続的な層ラプラシアン、永続的なハイパーグラフラプラシアン、永続的なハイパーディグラフラプラシアン、進化的ド・ラム=ホッジ理論を含む永続的なトポロジカルラプラシアン(PTL)のクラスが、現在のTDAの限界を効果的に克服し、より強力なTDAアプローチの新たな世代を提供することができると主張している。トポロジカルディープラーニングの一般的な枠組みでは、数学支援指向進化(MADE)は将来のタンパク質工学に大きな可能性を秘めている。

関連論文リスト

Prot42: a Novel Family of Protein Language Models for Target-aware Protein Binder Generation [3.2039076408339353]
本稿では,タンパク質言語モデル(pLM)の新規ファミリーであるProt42を紹介する。注目すべきは、我々のモデルは最大8,192個のアミノ酸を処理し、標準的制限をはるかに超えていることだ。 Prot42は高親和性タンパク質結合体と配列特異的DNA結合タンパク質を産生する。
論文参考訳（メタデータ） (2025-04-06T11:43:12Z)
Strategic priorities for transformative progress in advancing biology with proteomics and artificial intelligence [54.14779179869007]
データ分析から新たな生物学的洞察に至るまで、AIがイノベーションを推進している重要な領域を強調します。その中には、データ生成、共有、分析のためのAIフレンドリーなエコシステムの開発も含まれる。
論文参考訳（メタデータ） (2025-02-21T13:20:33Z)
GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。 DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文参考訳（メタデータ） (2025-02-11T05:39:49Z)
A Simple yet Effective DDG Predictor is An Unsupervised Antibody Optimizer and Explainer [53.85265022754878]
高速な突然変異スクリーニングのための軽量DDG予測器(Light-DDG)を提案する。また、Light-DDGを事前学習するための数百万の突然変異データを含む大規模データセットもリリースした。対象抗体について,変異選好を学習するための新しい変異説明器を提案する。
論文参考訳（メタデータ） (2025-02-10T09:26:57Z)
Computational Protein Science in the Era of Large Language Models (LLMs) [54.35488233989787]
計算タンパク質科学(Computational protein science)は、タンパク質配列構造-機能パラダイムにおける知識を明らかにすること、および応用を開発することを目的としている。最近、言語モデル (Language Models, PLM) は、前例のない言語処理と一般化能力のために、AIのマイルストーンとして登場した。
論文参考訳（メタデータ） (2025-01-17T16:21:18Z)
Large Language Model is Secretly a Protein Sequence Optimizer [24.55348363931866]
本研究では,与えられた野生型配列から,高い適合度を持つタンパク質配列を見つけることを目的としたタンパク質配列工学的問題を考える。大規模言語モデル(LLM)は、大量のテキストで訓練されているにもかかわらず、秘密裏にタンパク質配列であることを示す。
論文参考訳（メタデータ） (2025-01-16T03:44:16Z)
MSAGPT: Neural Prompting Protein Structure Prediction via MSA Generative Pre-Training [48.398329286769304]
マルチシークエンスアライメント(MSA)は、タンパク質ファミリーの進化的軌道を明らかにする上で重要な役割を担っている。 MSAGPTは、低MSA状態下でのMSA生成前訓練を通じてタンパク質構造予測を促進する新しいアプローチである。
論文参考訳（メタデータ） (2024-06-08T04:23:57Z)
NaNa and MiGu: Semantic Data Augmentation Techniques to Enhance Protein Classification in Graph Neural Networks [60.48306899271866]
本稿では,背骨化学および側鎖生物物理情報をタンパク質分類タスクに組み込む新しい意味データ拡張手法を提案する。具体的には, 分子生物学的, 二次構造, 化学結合, およびタンパク質のイオン特性を活用し, 分類作業を容易にする。
論文参考訳（メタデータ） (2024-03-21T13:27:57Z)
Efficiently Predicting Mutational Effect on Homologous Proteins by Evolution Encoding [7.067145619709089]
EvolMPNNは進化を意識したタンパク質の埋め込みを学習するための効率的なモデルである。我々のモデルは最先端の手法よりも最大6.4%向上し,36倍の高速化を実現している。
論文参考訳（メタデータ） (2024-02-20T23:06:21Z)
Evolutionary Algorithms Simulating Molecular Evolution: A New Field Proposal [0.0716879432974126]
近年のゲノムシークエンシングの進歩により、タンパク質ファミリーの多様性が明らかにされているが、全てのアミノ酸配列の膨大な検索空間と比較して、既知の機能ファミリーのセットは最小限である。自然には限定的なタンパク質「語彙」があると言えるかもしれない進化的アルゴリズム、機械学習(ML)、バイオインフォマティクスを組み合わせることで、これまで存在しなかった全く新しいタンパク質の開発を促進することができる。
論文参考訳（メタデータ） (2024-02-01T19:22:02Z)
xTrimoPGLM: Unified 100B-Scale Pre-trained Transformer for Deciphering the Language of Protein [76.18058946124111]
本稿では,タンパク質の理解と生成を同時に行うために,統一されたタンパク質言語モデル xTrimoPGLM を提案する。 xTrimoPGLMは、4つのカテゴリにわたる18のタンパク質理解ベンチマークにおいて、他の高度なベースラインを著しく上回っている。また、自然の原理に従ってデノボタンパク質配列を生成でき、微調整を監督した後にプログラム可能な生成を行うことができる。
論文参考訳（メタデータ） (2024-01-11T15:03:17Z)
Efficiently Predicting Protein Stability Changes Upon Single-point Mutation with Large Language Models [51.57843608615827]
タンパク質の熱安定性を正確に予測する能力は、様々なサブフィールドや生化学への応用において重要である。タンパク質配列と構造的特徴を統合したESMによる効率的なアプローチを導入し, 単一点突然変異によるタンパク質の熱安定性変化を予測する。
論文参考訳（メタデータ） (2023-12-07T03:25:49Z)
A Latent Diffusion Model for Protein Structure Generation [50.74232632854264]
本稿では,タンパク質モデリングの複雑さを低減できる潜在拡散モデルを提案する。提案手法は, 高い設計性と効率性を有する新規なタンパク質のバックボーン構造を効果的に生成できることを示す。
論文参考訳（メタデータ） (2023-05-06T19:10:19Z)
A Survey on Protein Representation Learning: Retrospect and Prospect [42.38007308086495]
タンパク質表現学習は、巨大なタンパク質配列や構造から情報的知識を抽出する上で有望な研究課題である。本稿では,タンパク質表現学習のモチベーションを紹介し,それらを汎用的かつ統一的な枠組みで定式化する。次に、既存のPRL手法を、シーケンスベース、構造ベース、シーケンス構造共モデリングの3つの主要なカテゴリに分割する。
論文参考訳（メタデータ） (2022-12-31T04:01:16Z)
Plug & Play Directed Evolution of Proteins with Gradient-based Discrete MCMC [1.0499611180329804]
機械学習ベースのタンパク質工学の長年の目標は、新しい突然変異の発見を加速することである。本稿では,シリコにおけるタンパク質の進化のためのサンプリングフレームワークについて紹介する。これらのモデルを構成することで、未知の突然変異を評価し、機能的タンパク質を含む可能性のある配列空間の領域を探索する能力を向上させることを目指している。
論文参考訳（メタデータ） (2022-12-20T00:26:23Z)
Learning Geometrically Disentangled Representations of Protein Folding Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文参考訳（メタデータ） (2022-05-20T19:38:00Z)
ODBO: Bayesian Optimization with Search Space Prescreening for Directed Protein Evolution [18.726398852721204]
タンパク質指向進化のための効率的で実験的な設計指向のクローズドループ最適化フレームワークを提案する。 ODBOは、新しい低次元タンパク質エンコーディング戦略と、外乱検出による検索空間事前スクリーニングによって強化されたベイズ最適化を組み合わせている。本研究は, タンパク質指向進化実験を4回実施し, 興味のある変異を見出すためのフレームワークの能力を実証した。
論文参考訳（メタデータ） (2022-05-19T13:21:31Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。