論文の概要: Relaxed Sequence Sampling for Diverse Protein Design
- arxiv url: http://arxiv.org/abs/2510.23786v1
- Date: Mon, 27 Oct 2025 19:18:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-29 15:35:36.427862
- Title: Relaxed Sequence Sampling for Diverse Protein Design
- Title(参考訳): 逆タンパク質設計のためのリラクシドシーケンスサンプリング
- Authors: Joohwan Ko, Aristofanis Rontogiannis, Yih-En Andrew Ban, Axel Elaldi, Nicholas Franklin,
- Abstract要約: 本稿では,タンパク質設計のための構造情報と進化情報を統合するフレームワークであるRelaxed Sequence Samplingを紹介する。
RSSは連続ロジット空間で動作し、勾配誘導探索とタンパク質言語モデルインフォームドジャンプを組み合わせた。
インサイリコタンパク質バインダー設計タスクでは、RSSは5$times$より多くの設計可能な構造と2-3$times$RSOベースラインよりも大きな構造多様性を生成する。
- 参考スコア(独自算出の注目度): 3.8965526520330123
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Protein design using structure prediction models such as AlphaFold2 has shown remarkable success, but existing approaches like relaxed sequence optimization (RSO) rely on single-path gradient descent and ignore sequence-space constraints, limiting diversity and designability. We introduce Relaxed Sequence Sampling (RSS), a Markov chain Monte Carlo (MCMC) framework that integrates structural and evolutionary information for protein design. RSS operates in continuous logit space, combining gradient-guided exploration with protein language model-informed jumps. Its energy function couples AlphaFold2-derived structural objectives with ESM2-derived sequence priors, balancing accuracy and biological plausibility. In an in silico protein binder design task, RSS produces 5$\times$ more designable structures and 2-3$\times$ greater structural diversity than RSO baselines, at equal computational cost. These results highlight RSS as a principled approach for efficiently exploring the protein design landscape.
- Abstract(参考訳): AlphaFold2のような構造予測モデルを用いたタンパク質の設計は顕著に成功したが、緩和配列最適化(RSO)のような既存のアプローチは、単一パス勾配勾配に依存し、配列空間の制約を無視し、多様性と設計可能性を制限する。
タンパク質設計のための構造情報と進化情報を統合したマルコフ連鎖モンテカルロ(MCMC)フレームワークであるRelaxed Sequence Sampling(RSS)を紹介する。
RSSは連続ロジット空間で動作し、勾配誘導探索とタンパク質言語モデルインフォームドジャンプを組み合わせた。
そのエネルギー関数は、AlphaFold2由来の構造的目的とESM2由来の配列前駆体とを結合し、精度と生物学的妥当性のバランスをとる。
サイリコタンパク質バインダー設計タスクでは、RSSは5$\times$より多くの設計可能な構造と2-3$\times$同じ計算コストでRSOベースラインよりも大きな構造多様性を生成する。
これらの結果は、タンパク質設計の景観を効率的に探索するための原則的アプローチとしてRSSを強調している。
関連論文リスト
- PRISM: Enhancing Protein Inverse Folding through Fine-Grained Retrieval on Structure-Sequence Multimodal Representations [42.870409939729974]
逆フォールディングのための多モーダル検索拡張生成フレームワークであるPRISMを提案する。
既知のタンパク質から潜在的なモチーフの微細な表現を回収し、それらをハイブリッドなセルフクロスアテンションデコーダと統合する。
PRISMは、パープレキシティとアミノ酸の回収の両方において新しい技術状態を確立し、フォールドビリティの指標も改善した。
論文 参考訳(メタデータ) (2025-10-12T00:45:22Z) - AMix-1: A Pathway to Test-Time Scalable Protein Foundation Model [92.51919604882984]
本稿では,Flow Bayesian Networks上に構築された強力なタンパク質基盤モデルAMix-1を紹介する。
AMix-1は、事前学習のスケーリング法則、創発的能力分析、コンテキスト内学習機構、テスト時間スケーリングアルゴリズムを含む、体系的なトレーニング手法によって強化されている。
この基盤を基盤として、タンパク質設計を汎用フレームワークに統合するためのマルチシーケンスアライメント(MSA)ベースのコンテキスト内学習戦略を考案した。
論文 参考訳(メタデータ) (2025-07-11T17:02:25Z) - A Model-Centric Review of Deep Learning for Protein Design [0.0]
ディープラーニングはタンパク質設計を変換し、正確な構造予測、シーケンス最適化、de novoタンパク質生成を可能にした。
ProtGPT2、ProteinMPNN、RFdiffusionなどの生成モデルは、自然進化に基づく制限を超えてシーケンスとバックボーンの設計を可能にした。
最近では、ESM3を含む共同シーケンス構造共設計モデルが両方のモダリティを統一されたフレームワークに統合し、設計性が向上した。
論文 参考訳(メタデータ) (2025-02-26T14:31:21Z) - Sequence-Augmented SE(3)-Flow Matching For Conditional Protein Backbone Generation [55.93511121486321]
タンパク質構造生成のための新しいシーケンス条件付きフローマッチングモデルFoldFlow-2を紹介する。
我々は、以前の作業のPDBデータセットよりも桁違いに大きい新しいデータセットでFoldFlow-2を大規模にトレーニングします。
我々はFoldFlow-2が従来のタンパク質構造に基づく生成モデルよりも優れていることを実証的に観察した。
論文 参考訳(メタデータ) (2024-05-30T17:53:50Z) - Functional Geometry Guided Protein Sequence and Backbone Structure
Co-Design [12.585697288315846]
本稿では,自動検出機能部位に基づくタンパク質配列と構造を共同設計するモデルを提案する。
NAEProは、全シーケンスでグローバルな相関を捉えることができる、注目層と同変層のインターリービングネットワークによって駆動される。
実験結果から,本モデルは全競技種の中で,最高アミノ酸回収率,TMスコア,最低RMSDを実現していることがわかった。
論文 参考訳(メタデータ) (2023-10-06T16:08:41Z) - Structure-informed Language Models Are Protein Designers [69.70134899296912]
配列ベースタンパク質言語モデル(pLM)の汎用的手法であるLM-Designを提案する。
pLMに軽量な構造アダプターを埋め込んだ構造手術を行い,構造意識を付加した構造手術を行った。
実験の結果,我々の手法は最先端の手法よりも大きなマージンで優れていることがわかった。
論文 参考訳(メタデータ) (2023-02-03T10:49:52Z) - Protein Sequence and Structure Co-Design with Equivariant Translation [19.816174223173494]
既存のアプローチは自己回帰モデルまたは拡散モデルを用いてタンパク質配列と構造の両方を生成する。
本稿では,タンパク質配列と構造共設計が可能な新しいアプローチを提案する。
我々のモデルは、幾何学的制約と文脈特徴からの相互作用を推論する三角法を意識したエンコーダで構成されている。
全てのタンパク質アミノ酸は翻訳工程で1ショットずつ更新され、推論プロセスが大幅に加速される。
論文 参考訳(メタデータ) (2022-10-17T06:00:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。