論文の概要: Robust Optimization in Protein Fitness Landscapes Using Reinforcement Learning in Latent Space
- arxiv url: http://arxiv.org/abs/2405.18986v1
- Date: Wed, 29 May 2024 11:03:42 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-30 17:30:13.947665
- Title: Robust Optimization in Protein Fitness Landscapes Using Reinforcement Learning in Latent Space
- Title(参考訳): 潜時空間における強化学習を用いたタンパク質繊維景観のロバスト最適化
- Authors: Minji Lee, Luiz Felipe Vecchietti, Hyunkyu Jung, Hyun Joo Ro, Meeyoung Cha, Ho Min Kim,
- Abstract要約: 大規模タンパク質言語モデルを利用したエンコーダデコーダで学習した潜在空間を効率的にトラバースする最適化手法であるLatProtRLを提案する。
局所最適化を回避すべく, 遅延空間で直接作用する強化学習を用いてマルコフ決定過程をモデル化した。
この結果とin vitroでの評価は, 生成配列が高適合領域に到達できることを示し, ラボイン・ザ・ループシナリオにおけるLatProtRLの有意な可能性を示した。
- 参考スコア(独自算出の注目度): 13.228932754390748
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Proteins are complex molecules responsible for different functions in nature. Enhancing the functionality of proteins and cellular fitness can significantly impact various industries. However, protein optimization using computational methods remains challenging, especially when starting from low-fitness sequences. We propose LatProtRL, an optimization method to efficiently traverse a latent space learned by an encoder-decoder leveraging a large protein language model. To escape local optima, our optimization is modeled as a Markov decision process using reinforcement learning acting directly in latent space. We evaluate our approach on two important fitness optimization tasks, demonstrating its ability to achieve comparable or superior fitness over baseline methods. Our findings and in vitro evaluation show that the generated sequences can reach high-fitness regions, suggesting a substantial potential of LatProtRL in lab-in-the-loop scenarios.
- Abstract(参考訳): タンパク質は自然界の異なる機能の原因となる複雑な分子である。
タンパク質の機能強化と細胞適合性は、様々な産業に大きな影響を及ぼす可能性がある。
しかし、特に低適合性配列から始めると、計算手法によるタンパク質の最適化は困難である。
大規模タンパク質言語モデルを利用したエンコーダデコーダで学習した潜在空間を効率的にトラバースする最適化手法であるLatProtRLを提案する。
局所最適化を回避すべく, 遅延空間で直接作用する強化学習を用いてマルコフ決定過程をモデル化した。
我々は,2つの重要な適合度最適化タスクに対するアプローチを評価し,ベースライン法よりも優れた適合度を達成できることを実証した。
この結果とin vitroでの評価は, 生成配列が高適合領域に到達できることを示し, ラボイン・ザ・ループシナリオにおけるLatProtRLの有意な可能性を示した。
関連論文リスト
- Improving Protein Optimization with Smoothed Fitness Landscapes [27.30455141469762]
本稿では,タンパク質の最適化を容易にするため,フィットネスランドスケープの平滑化を提案する。
このスムーズなランドスケープを最適化すると、複数のメソッドのパフォーマンスが向上する。
本手法は,Gibs sample with Graph-based Smoothing (GGS) と呼ばれ,2.5倍の適合性向上を実現するユニークな能力を示す。
論文 参考訳(メタデータ) (2023-07-02T06:55:31Z) - Improving few-shot learning-based protein engineering with evolutionary
sampling [0.0]
本稿では,高価なウェットラボテストサイクルを加速することを目的とした,新規なタンパク質設計のための数発の学習手法を提案する。
提案手法は, 所望のタンパク質機能に対する個別のフィットネスランドスケープを生成する半教師ありトランスファー学習法と, 新たな進化的モンテカルロ連鎖サンプリングアルゴリズムとから構成される。
予測された高適合性遺伝子アクチベーターを実験的にスクリーニングすることにより,本手法の有効性を実証した。
論文 参考訳(メタデータ) (2023-05-23T23:07:53Z) - Robust Model-Based Optimization for Challenging Fitness Landscapes [96.63655543085258]
タンパク質の設計には、フィットネスのランドスケープの最適化が含まれる。
指導法は, トレーニングセットにおける高適合度サンプルの多彩さに課題を呈する。
デザイン空間における「分離」というこの問題は、既存のモデルベース最適化ツールにおいて重大なボトルネックとなっていることを示す。
本稿では,新しいVAEを検索モデルとして利用して問題を克服する手法を提案する。
論文 参考訳(メタデータ) (2023-05-23T03:47:32Z) - Protein Sequence Design with Batch Bayesian Optimisation [0.0]
タンパク質配列設計は、有用な生物学的機能を持つ新規タンパク質の発見を目的とした、タンパク質工学における挑戦的な問題である。
有向進化は、実験室環境における進化のサイクルを模倣し、反復的プロトコルを実行する、タンパク質配列設計のための広く使われているアプローチである。
本稿では,タンパク質配列設計のための最適化手法であるBatch Bayesian Optimization (Batch BO) に基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2023-03-18T14:53:20Z) - An Empirical Evaluation of Zeroth-Order Optimization Methods on
AI-driven Molecule Optimization [78.36413169647408]
分子目的を最適化するための様々なZO最適化手法の有効性について検討する。
ZO符号に基づく勾配降下(ZO-signGD)の利点を示す。
本稿では,Guurcamol スイートから広く使用されているベンチマークタスクに対して,ZO 最適化手法の有効性を示す。
論文 参考訳(メタデータ) (2022-10-27T01:58:10Z) - Designing Biological Sequences via Meta-Reinforcement Learning and
Bayesian Optimization [68.28697120944116]
メタ強化学習を用いて自己回帰生成モデルを訓練し、選択のための有望なシーケンスを提案する。
我々は,データのサブセットのサンプリングによって誘導されるMDPの分布に対する最適ポリシーを求める問題として,この問題を提起する。
このようなアンサンブルに対するメタラーニングは,報酬の過小評価に対して頑健であり,競争的な結果が得られることを示す。
論文 参考訳(メタデータ) (2022-09-13T18:37:27Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z) - ODBO: Bayesian Optimization with Search Space Prescreening for Directed Protein Evolution [18.726398852721204]
タンパク質指向進化のための効率的で実験的な設計指向のクローズドループ最適化フレームワークを提案する。
ODBOは、新しい低次元タンパク質エンコーディング戦略と、外乱検出による検索空間事前スクリーニングによって強化されたベイズ最適化を組み合わせている。
本研究は, タンパク質指向進化実験を4回実施し, 興味のある変異を見出すためのフレームワークの能力を実証した。
論文 参考訳(メタデータ) (2022-05-19T13:21:31Z) - Using Genetic Programming to Predict and Optimize Protein Function [65.25258357832584]
我々は,進化的手法に基づく遺伝的プログラミングツールPOETを提案し,方向性進化におけるスクリーニングと変異原性を高める。
概念実証として, 化学交換飽和移動機構によって検出されたMRIコントラストを生成するペプチドを用いる。
以上の結果から,POETのような計算モデリングツールは,従来よりも400%優れた機能性を持つペプチドを見つけるのに有効であることが示唆された。
論文 参考訳(メタデータ) (2022-02-08T18:08:08Z) - Guided Generative Protein Design using Regularized Transformers [5.425399390255931]
本稿では,シーケンス生成と適合性の予測を共同で行うディープトランスを用いたオートエンコーダであるReleularized Latent Space Optimization (ReLSO)を紹介する。
大規模ラベル付きデータセットの基本的なシーケンス関数のランドスケープを明示的にモデル化し,勾配に基づく手法を用いて潜在空間内を最適化する。
論文 参考訳(メタデータ) (2022-01-24T20:55:53Z) - EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based
Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。
EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:40:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。