論文の概要: Deep learning-guided evolutionary optimization for protein design
- arxiv url: http://arxiv.org/abs/2603.02753v1
- Date: Tue, 03 Mar 2026 08:53:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-04 21:38:10.718759
- Title: Deep learning-guided evolutionary optimization for protein design
- Title(参考訳): 深層学習誘導型タンパク質設計のための進化的最適化
- Authors: Erik Hartman, Di Tang, Johan Malmström,
- Abstract要約: 本稿では,進化的探索とベイズ最適化を組み合わせてシーケンス空間を効率的にナビゲートするフレームワークBoGAを提案する。
遺伝的アルゴリズムをサロゲートモデリングループ内に提案ジェネレータとして統合することにより、事前評価とサロゲートモデル予測に基づいて候補を優先順位付けする。
本稿では, 塩基配列および構造設計タスクのベンチマークによるBoGAの有用性を実証し, ペプチド結合体の設計への応用について述べる。
- 参考スコア(独自算出の注目度): 1.9779444191427633
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Designing novel proteins with desired characteristics remains a significant challenge due to the large sequence space and the complexity of sequence-function relationships. Efficient exploration of this space to identify sequences that meet specific design criteria is crucial for advancing therapeutics and biotechnology. Here, we present BoGA (Bayesian Optimization Genetic Algorithm), a framework that combines evolutionary search with Bayesian optimization to efficiently navigate the sequence space. By integrating a genetic algorithm as a stochastic proposal generator within a surrogate modeling loop, BoGA prioritizes candidates based on prior evaluations and surrogate model predictions, enabling data-efficient optimization. We demonstrate the utility of BoGA through benchmarking on sequence and structure design tasks, followed by its application in designing peptide binders against pneumolysin, a key virulence factor of \textit{Streptococcus pneumoniae}. BoGA accelerates the discovery of high-confidence binders, demonstrating the potential for efficient protein design across diverse objectives. The algorithm is implemented within the BoPep suite and is available under an MIT license at \href{https://github.com/ErikHartman/bopep}{GitHub}.
- Abstract(参考訳): 所望の特性を持つ新規なタンパク質を設計することは、大きな配列空間と配列-機能関係の複雑さのために依然として大きな課題である。
この領域を効率的に探索し、特定の設計基準を満たす配列を特定することは、治療やバイオテクノロジーの進歩に不可欠である。
本稿では,進化的探索とベイズ最適化を組み合わせてシーケンス空間を効率的にナビゲートするBoGA(Bayesian Optimization Genetic Algorithm)を提案する。
遺伝的アルゴリズムを確率的提案生成器としてサロゲートモデリングループに統合することにより、事前評価とサロゲートモデル予測に基づいて候補を優先順位付けし、データ効率の最適化を可能にする。
本稿では, 塩基配列および構造設計タスクのベンチマークによるBoGAの有用性を実証し, 次いで, 肺炎球菌の重要な病原性因子であるニューモリシンに対するペプチド結合体の設計に応用した。
BoGAは高信頼バインダーの発見を加速し、様々な目的にまたがる効率的なタンパク質設計の可能性を示す。
このアルゴリズムはBoPepスイート内で実装されており、MITライセンスで \href{https://github.com/ErikHartman/bopep}{GitHub} で利用可能である。
関連論文リスト
- Accelerating De Novo Genome Assembly via Quantum-Assisted Graph Optimization with Bitstring Recovery [0.0]
ゲノムシークエンシングは、遺伝情報の解読、生物の同定、疾患の理解、パーソナライズド医療の進歩に不可欠である。
デノボゲノム組換えは、その計算複雑性が高く、時間と精度の両方に影響を及ぼすため、重大な課題を呈している。
本稿では,古典的前処理と統合された量子コンピューティングに基づく最適化アルゴリズムを用いて,ゲノム組立プロセスを高速化するハイブリッドアプローチを提案する。
論文 参考訳(メタデータ) (2026-01-29T19:03:55Z) - Efficient Protein Optimization via Structure-aware Hamiltonian Dynamics [16.336540408998598]
HADESはハミルトニアン力学を利用したベイズ最適化法であり、構造対応の近似後部から効率的にサンプリングする。
このような連続状態系から離散的なタンパク質配列を提案するために、位置離散化手順を導入する。
実験により,本手法はシリコン内評価において最先端のベースラインを上回っていることが示された。
論文 参考訳(メタデータ) (2026-01-16T05:53:53Z) - GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。
DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。
また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - Protein Design with Guided Discrete Diffusion [67.06148688398677]
タンパク質設計における一般的なアプローチは、生成モデルと条件付きサンプリングのための識別モデルを組み合わせることである。
離散拡散モデルのためのガイダンス手法であるdiffusioN Optimized Smpling (NOS)を提案する。
NOSは、構造に基づく手法の重要な制限を回避し、シーケンス空間で直接設計を行うことができる。
論文 参考訳(メタデータ) (2023-05-31T16:31:24Z) - Designing Biological Sequences via Meta-Reinforcement Learning and
Bayesian Optimization [68.28697120944116]
メタ強化学習を用いて自己回帰生成モデルを訓練し、選択のための有望なシーケンスを提案する。
我々は,データのサブセットのサンプリングによって誘導されるMDPの分布に対する最適ポリシーを求める問題として,この問題を提起する。
このようなアンサンブルに対するメタラーニングは,報酬の過小評価に対して頑健であり,競争的な結果が得られることを示す。
論文 参考訳(メタデータ) (2022-09-13T18:37:27Z) - ODBO: Bayesian Optimization with Search Space Prescreening for Directed Protein Evolution [18.726398852721204]
タンパク質指向進化のための効率的で実験的な設計指向のクローズドループ最適化フレームワークを提案する。
ODBOは、新しい低次元タンパク質エンコーディング戦略と、外乱検出による検索空間事前スクリーニングによって強化されたベイズ最適化を組み合わせている。
本研究は, タンパク質指向進化実験を4回実施し, 興味のある変異を見出すためのフレームワークの能力を実証した。
論文 参考訳(メタデータ) (2022-05-19T13:21:31Z) - Accelerating Bayesian Optimization for Biological Sequence Design with
Denoising Autoencoders [28.550684606186884]
我々は,識別可能なマルチタスクガウスプロセスヘッドを用いて,デノナイズドオートエンコーダを共同で訓練する手法を開発した。
我々はZINCデータセットに基づく小分子上でLaMBOを評価し,蛍光タンパク質をターゲットとした新しい大規模分子タスクを導入する。
論文 参考訳(メタデータ) (2022-03-23T21:58:45Z) - Improving RNA Secondary Structure Design using Deep Reinforcement
Learning [69.63971634605797]
本稿では,RNA配列設計に強化学習を適用した新しいベンチマークを提案する。このベンチマークでは,目的関数を配列の二次構造における自由エネルギーとして定義する。
本稿では,これらのアルゴリズムに対して行うアブレーション解析の結果と,バッチ間でのアルゴリズムの性能を示すグラフを示す。
論文 参考訳(メタデータ) (2021-11-05T02:54:06Z) - EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based
Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。
EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:40:29Z) - AdaLead: A simple and robust adaptive greedy search algorithm for
sequence design [55.41644538483948]
我々は、容易で、拡張性があり、堅牢な進化的欲求アルゴリズム(AdaLead)を開発した。
AdaLeadは、様々な生物学的に動機づけられたシーケンスデザインの課題において、アートアプローチのより複雑な状態を克服する、驚くほど強力なベンチマークである。
論文 参考訳(メタデータ) (2020-10-05T16:40:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。