論文の概要: Inverse Protein Folding Using Deep Bayesian Optimization
- arxiv url: http://arxiv.org/abs/2305.18089v1
- Date: Thu, 25 May 2023 02:15:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-30 15:03:30.456419
- Title: Inverse Protein Folding Using Deep Bayesian Optimization
- Title(参考訳): ディープベイズ最適化を用いた逆タンパク質フォールディング
- Authors: Natalie Maus and Yimeng Zeng and Daniel Allen Anderson and Phillip
Maffettone and Aaron Solomon and Peyton Greenside and Osbert Bastani and
Jacob R. Gardner
- Abstract要約: 逆タンパク質の折り畳みは、タンパク質の設計の「トップダウン」において重要な問題として表面化されている。
本稿では「深み」や「ラテント空間」の最近の進歩を応用した最適化問題として、生成した逆折りたたみを改良する問題を提起する。
本手法は, TMスコアとRMSDを用いて, 目的の背骨構造に対する構造誤差を大幅に低減したタンパク質配列を連続的に生成する。
- 参考スコア(独自算出の注目度): 18.77797005929986
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Inverse protein folding -- the task of predicting a protein sequence from its
backbone atom coordinates -- has surfaced as an important problem in the "top
down", de novo design of proteins. Contemporary approaches have cast this
problem as a conditional generative modelling problem, where a large generative
model over protein sequences is conditioned on the backbone. While these
generative models very rapidly produce promising sequences, independent draws
from generative models may fail to produce sequences that reliably fold to the
correct backbone. Furthermore, it is challenging to adapt pure generative
approaches to other settings, e.g., when constraints exist. In this paper, we
cast the problem of improving generated inverse folds as an optimization
problem that we solve using recent advances in "deep" or "latent space"
Bayesian optimization. Our approach consistently produces protein sequences
with greatly reduced structural error to the target backbone structure as
measured by TM score and RMSD while using fewer computational resources.
Additionally, we demonstrate other advantages of an optimization-based approach
to the problem, such as the ability to handle constraints.
- Abstract(参考訳): 逆タンパク質折り畳み(inverse protein folding) -- バックボーン原子座標からタンパク質配列を予測するタスク -- は、タンパク質の「トップダウン」における重要な問題として表面化した。
現代のアプローチでは、タンパク質配列上の大きな生成モデルがバックボーンに条件付けされている条件付き生成モデル問題としてこの問題が取り上げられている。
これらの生成モデルは、非常に高速に有望なシーケンスを生成するが、生成モデルからの独立な描画は、正しいバックボーンに確実に折り畳まれるシーケンスを生成できない可能性がある。
さらに、制約がある場合など、純粋な生成アプローチを他の設定に適応させることは困難である。
本稿では,近年のベイズ最適化における「深い」あるいは「相対空間」を用いて解く最適化問題として,生成する逆折りたたみを改良する問題を取り上げる。
本手法は, tmスコアとrmsdで測定した目標骨格構造に対する構造的誤差を大幅に低減したタンパク質配列を, 少ない計算資源で一貫して生成する。
さらに,制約に対処する能力など,この問題に対する最適化ベースのアプローチの他の利点を示す。
関連論文リスト
- Non-negative Weighted DAG Structure Learning [12.139158398361868]
本研究は,真DAGを夜間観測から学習する問題に対処する。
本稿では, ar を返すことが保証される手法に基づく DAG 回復アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-09-12T09:41:29Z) - Conditional Denoising Diffusion for Sequential Recommendation [62.127862728308045]
GAN(Generative Adversarial Networks)とVAE(VAE)の2つの顕著な生成モデル
GANは不安定な最適化に苦しむ一方、VAEは後続の崩壊と過度に平らな世代である。
本稿では,シーケンスエンコーダ,クロスアテンティブデノナイジングデコーダ,ステップワイズディフューザを含む条件付きデノナイジング拡散モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T15:32:59Z) - Symmetric Tensor Networks for Generative Modeling and Constrained
Combinatorial Optimization [72.41480594026815]
ポートフォリオ最適化からロジスティクスに至るまで、制約付き最適化問題は業界に多い。
これらの問題の解決における主要な障害の1つは、有効な検索空間を制限する非自明なハード制約の存在である。
本研究では、Ax=bという形の任意の整数値等式制約をU(1)対称ネットワーク(TN)に直接エンコードし、それらの適用性を量子に着想を得た生成モデルとして活用する。
論文 参考訳(メタデータ) (2022-11-16T18:59:54Z) - Designing Biological Sequences via Meta-Reinforcement Learning and
Bayesian Optimization [68.28697120944116]
メタ強化学習を用いて自己回帰生成モデルを訓練し、選択のための有望なシーケンスを提案する。
我々は,データのサブセットのサンプリングによって誘導されるMDPの分布に対する最適ポリシーを求める問題として,この問題を提起する。
このようなアンサンブルに対するメタラーニングは,報酬の過小評価に対して頑健であり,競争的な結果が得られることを示す。
論文 参考訳(メタデータ) (2022-09-13T18:37:27Z) - Combining Genetic Programming and Particle Swarm Optimization to
Simplify Rugged Landscapes Exploration [7.25130576615102]
元の関数のスムーズな代理モデルを構築するための新しい手法を提案する。
GP-FST-PSOサロゲートモデル(GP-FST-PSO Surrogate Model)と呼ばれる提案アルゴリズムは,グローバルな最適探索と,元のベンチマーク関数の視覚的近似の生成の両方において満足な結果が得られる。
論文 参考訳(メタデータ) (2022-06-07T12:55:04Z) - Generative power of a protein language model trained on multiple
sequence alignments [0.5639904484784126]
進化に関連したタンパク質配列の大規模なアンサンブルから始まる計算モデルは、タンパク質ファミリーの表現を捉えている。
MSA Transformerのような複数の配列アライメントに基づいて訓練されたタンパク質言語モデルは、この目的に対して非常に魅力的な候補である。
マスク付き言語モデリングの目的を直接利用して,MSA変換器を用いてシーケンスを生成する反復手法を提案し,検証する。
論文 参考訳(メタデータ) (2022-04-14T16:59:05Z) - EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based
Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。
EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:40:29Z) - Intermediate Layer Optimization for Inverse Problems using Deep
Generative Models [86.29330440222199]
ILOは、深層生成モデルを用いて逆問題を解決するための新しい最適化アルゴリズムである。
提案手法は,StyleGAN-2 や PULSE で導入した最先端手法よりも幅広い逆問題に対して優れていることを示す。
論文 参考訳(メタデータ) (2021-02-15T06:52:22Z) - AdaLead: A simple and robust adaptive greedy search algorithm for
sequence design [55.41644538483948]
我々は、容易で、拡張性があり、堅牢な進化的欲求アルゴリズム(AdaLead)を開発した。
AdaLeadは、様々な生物学的に動機づけられたシーケンスデザインの課題において、アートアプローチのより複雑な状態を克服する、驚くほど強力なベンチマークである。
論文 参考訳(メタデータ) (2020-10-05T16:40:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。