論文の概要: ProteinZero: Self-Improving Protein Generation via Online Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2506.07459v1
- Date: Mon, 09 Jun 2025 06:08:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-10 16:33:10.824888
- Title: ProteinZero: Self-Improving Protein Generation via Online Reinforcement Learning
- Title(参考訳): ProteinZero: オンライン強化学習による自己改善タンパク質生成
- Authors: Ziwen Wang, Jiajun Fan, Ruihan Guo, Thao Nguyen, Heng Ji, Ge Liu,
- Abstract要約: 本稿では,逆折り畳みモデルの計算的拡張性,自動化,継続的な自己改善を可能にする新しいフレームワークであるProteinZeroを提案する。
ProteinZeroは、タンパク質設計のすべての主要な指標において、既存の手法を大幅に上回っている。
特に、CATH-4.3上で実行されるRL全体は、報酬を含む3日以内に1つの8X GPUノードで実行できる。
- 参考スコア(独自算出の注目度): 49.2607661375311
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Protein generative models have shown remarkable promise in protein design but still face limitations in success rate, due to the scarcity of high-quality protein datasets for supervised pretraining. We present ProteinZero, a novel framework that enables scalable, automated, and continuous self-improvement of the inverse folding model through online reinforcement learning. To achieve computationally tractable online feedback, we introduce efficient proxy reward models based on ESM-fold and a novel rapid ddG predictor that significantly accelerates evaluation speed. ProteinZero employs a general RL framework balancing multi-reward maximization, KL-divergence from a reference model, and a novel protein-embedding level diversity regularization that prevents mode collapse while promoting higher sequence diversity. Through extensive experiments, we demonstrate that ProteinZero substantially outperforms existing methods across every key metric in protein design, achieving significant improvements in structural accuracy, designability, thermodynamic stability, and sequence diversity. Most impressively, ProteinZero reduces design failure rates by approximately 36% - 48% compared to widely-used methods like ProteinMPNN, ESM-IF and InstructPLM, consistently achieving success rates exceeding 90% across diverse and complex protein folds. Notably, the entire RL run on CATH-4.3 can be done with a single 8 X GPU node in under 3 days, including reward computation. Our work establishes a new paradigm for protein design where models evolve continuously from their own generated outputs, opening new possibilities for exploring the vast protein design space.
- Abstract(参考訳): タンパク質生成モデルは、タンパク質設計において顕著な将来性を示しているが、教師付き事前学習のための高品質なタンパク質データセットが不足しているため、成功率の限界に直面している。
本稿では、オンライン強化学習を通じて、逆折り畳みモデルのスケーラブルで自動化され、継続的な自己改善を可能にする新しいフレームワークであるProteinZeroを提案する。
計算的に抽出可能なオンラインフィードバックを実現するために,ESMフォールドに基づく効率的なプロキシ報酬モデルと,評価速度を大幅に高速化する新しい高速ddG予測器を導入する。
ProteinZeroは、マルチリワードの最大化、参照モデルからのKL分割のバランスをとる一般的なRLフレームワークと、より高い配列の多様性を促進しながらモード崩壊を防ぐ新しいタンパク質埋め込みレベルの多様性正規化を採用している。
広範な実験を通じて、タンパク質ゼロはタンパク質設計における主要な指標の全てにおいて既存の手法を大幅に上回っており、構造精度、設計性、熱力学的安定性、配列多様性の大幅な改善が達成されていることを実証した。
もっとも印象的なことに、ProteinZeroは、ProteinMPNN、ESM-IF、InstructPLMといった広く使われている手法と比較して、設計失敗率を約36%から48%削減し、多種多様な複雑なタンパク質折り畳みの90%を超える成功率を一貫して達成している。
特に、CATH-4.3上で実行されるRL全体は、報酬計算を含む3日以内に1つの8X GPUノードで実行できる。
我々の研究は、モデルが生成した出力から連続的に進化するタンパク質設計の新しいパラダイムを確立し、巨大なタンパク質設計空間を探索する新たな可能性を開く。
関連論文リスト
- The Dance of Atoms-De Novo Protein Design with Diffusion Model [9.521115574728915]
デノボタンパク質の設計は、自然に存在しない特定の構造と機能を持つタンパク質を作成することを指す。
近年、高品質なタンパク質構造と配列データの蓄積と技術進歩が、タンパク質設計における生成人工知能(AI)モデルの成功の道を開いた。
様々な生成AIモデルの中で、拡散モデルはタンパク質設計において最も有望な結果をもたらした。
論文 参考訳(メタデータ) (2025-04-23T07:45:00Z) - SFM-Protein: Integrative Co-evolutionary Pre-training for Advanced Protein Sequence Representation [97.99658944212675]
タンパク質基盤モデルのための新しい事前学習戦略を導入する。
アミノ酸残基間の相互作用を強調し、短距離および長距離の共進化的特徴の抽出を強化する。
大規模タンパク質配列データセットを用いて学習し,より優れた一般化能力を示す。
論文 参考訳(メタデータ) (2024-10-31T15:22:03Z) - Model-based reinforcement learning for protein backbone design [1.7383284836821535]
我々はAlphaZeroを用いてタンパク質のバックボーンを生成することを提案する。
既存のモンテカルロ木探索(MCTS)フレームワークを,新しいしきい値に基づく報酬と二次目的を取り入れて拡張する。
AlphaZeroは、トップダウンのタンパク質設計タスクにおいて、ベースラインMCTSを100%以上上回っている。
論文 参考訳(メタデータ) (2024-05-03T10:24:33Z) - Efficiently Predicting Mutational Effect on Homologous Proteins by Evolution Encoding [7.067145619709089]
EvolMPNNは進化を意識したタンパク質の埋め込みを学習するための効率的なモデルである。
我々のモデルは最先端の手法よりも最大6.4%向上し,36倍の高速化を実現している。
論文 参考訳(メタデータ) (2024-02-20T23:06:21Z) - xTrimoPGLM: Unified 100B-Scale Pre-trained Transformer for Deciphering the Language of Protein [74.64101864289572]
本稿では,タンパク質の理解と生成を同時に行うために,統一されたタンパク質言語モデル xTrimoPGLM を提案する。
xTrimoPGLMは、4つのカテゴリにわたる18のタンパク質理解ベンチマークにおいて、他の高度なベースラインを著しく上回っている。
また、自然の原理に従ってデノボタンパク質配列を生成でき、微調整を監督した後にプログラム可能な生成を行うことができる。
論文 参考訳(メタデータ) (2024-01-11T15:03:17Z) - Structure-informed Language Models Are Protein Designers [69.70134899296912]
配列ベースタンパク質言語モデル(pLM)の汎用的手法であるLM-Designを提案する。
pLMに軽量な構造アダプターを埋め込んだ構造手術を行い,構造意識を付加した構造手術を行った。
実験の結果,我々の手法は最先端の手法よりも大きなマージンで優れていることがわかった。
論文 参考訳(メタデータ) (2023-02-03T10:49:52Z) - Plug & Play Directed Evolution of Proteins with Gradient-based Discrete
MCMC [1.0499611180329804]
機械学習ベースのタンパク質工学の長年の目標は、新しい突然変異の発見を加速することである。
本稿では,シリコにおけるタンパク質の進化のためのサンプリングフレームワークについて紹介する。
これらのモデルを構成することで、未知の突然変異を評価し、機能的タンパク質を含む可能性のある配列空間の領域を探索する能力を向上させることを目指している。
論文 参考訳(メタデータ) (2022-12-20T00:26:23Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。