論文の概要: Protein Counterfactuals via Diffusion-Guided Latent Optimization
- arxiv url: http://arxiv.org/abs/2603.10811v1
- Date: Wed, 11 Mar 2026 14:19:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-12 16:22:32.993086
- Title: Protein Counterfactuals via Diffusion-Guided Latent Optimization
- Title(参考訳): 拡散誘導潜時最適化によるタンパク質対策
- Authors: Weronika Kłos, Sidney Bender, Lukas Kades,
- Abstract要約: ディープラーニングモデルは、前例のない精度でタンパク質特性を予測することができるが、工学的改良された変異体に対する機械的な洞察や実用的なガイダンスを提供することは滅多にない。
ミニマルかつ生物学的に妥当な配列編集を計算し、モデルの予測を所望の目標状態に戻すフレームワークであるMCCOP(Manifold-Constrained Counterfactual Optimization for Proteins)を紹介する。
GFP蛍光緩和, 熱力学的安定性向上, E3リガーゼ活性回復という3つのタンパク質工学的課題についてMCCOPを評価し, 離散的および連続的ベースラインよりもスペーサーで, より妥当な反物を生成することを示した。
- 参考スコア(独自算出の注目度): 0.764671395172401
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning models can predict protein properties with unprecedented accuracy but rarely offer mechanistic insight or actionable guidance for engineering improved variants. When a model flags an antibody as unstable, the protein engineer is left without recourse: which mutations would rescue stability while preserving function? We introduce Manifold-Constrained Counterfactual Optimization for Proteins (MCCOP), a framework that computes minimal, biologically plausible sequence edits that flip a model's prediction to a desired target state. MCCOP operates in a continuous joint sequence-structure latent space and employs a pretrained diffusion model as a manifold prior, balancing three objectives: validity (achieving the target property), proximity (minimizing mutations), and plausibility (producing foldable proteins). We evaluate MCCOP on three protein engineering tasks - GFP fluorescence rescue, thermodynamic stability enhancement, and E3 ligase activity recovery - and show that it generates sparser, more plausible counterfactuals than both discrete and continuous baselines. The recovered mutations align with known biophysical mechanisms, including chromophore packing and hydrophobic core consolidation, establishing MCCOP as a tool for both model interpretation and hypothesis-driven protein design. Our code is publicly available at github.com/weroks/mccop.
- Abstract(参考訳): ディープラーニングモデルは、前例のない精度でタンパク質特性を予測することができるが、工学的改良された変異体に対する機械的な洞察や実用的なガイダンスを提供することは滅多にない。
モデルが抗体を不安定であるとフラグ付けると、タンパク質エンジニアは無関係に残され、どの変異が機能を維持しながら安定性を救えるのか?
ミニマルかつ生物学的に妥当な配列編集を計算し、モデルの予測を所望の目標状態に戻すフレームワークであるMCCOP(Manifold-Constrained Counterfactual Optimization for Proteins)を紹介する。
MCCOPは連続的な結合配列構造潜在空間で動作し、事前訓練された拡散モデルを多様体として利用し、妥当性(目的特性を達成する)、近接性(突然変異の最小化)、可塑性(折り畳み可能なタンパク質の生成)の3つの目的のバランスをとる。
GFP蛍光緩和, 熱力学的安定性向上, E3リガーゼ活性回復という3つのタンパク質工学的課題についてMCCOPを評価し, 離散的および連続的ベースラインよりもスペーサーで, より妥当な反物を生成することを示した。
修復された突然変異は、染色体パッキングや疎水性核融合などの既知の生体物理機構と一致し、MCCOPをモデル解釈と仮説駆動タンパク質設計の両方のツールとして確立した。
私たちのコードはgithub.com/weroks/mccopで公開されています。
関連論文リスト
- Capturing Protein Free Energy Landscape using Efficient Quantum Encoding [0.0]
本研究は, ペプチドおよび小タンパク質の折り畳み構造を予測するための, ターンベース符号化アルゴリズムを提案する。
我々は、3次元の面中心立方体格子上に折り畳み過程を符号化する目的関数からハミルトニアンを構築した。
最小エネルギーの折り畳み構成を特定するため,IBM 133量子ビットハードウェア上に実装された変分量子固有解器を用いる。
論文 参考訳(メタデータ) (2025-10-17T05:06:43Z) - ProteinAE: Protein Diffusion Autoencoders for Structure Encoding [64.77182442408254]
本稿では,新規かつ合理化されたタンパク質拡散オートエンコーダであるProteinAEを紹介する。
プロテインAEは、タンパク質のバックボーン座標を直接E(3)から連続的でコンパクトな潜在空間にマッピングする。
本研究では,既存のオートエンコーダよりも優れた,最先端の再構築品質を実現することを実証する。
論文 参考訳(メタデータ) (2025-10-12T14:30:32Z) - Reimagining Target-Aware Molecular Generation through Retrieval-Enhanced Aligned Diffusion [22.204642926984526]
Retrieval-Augmented GenerationとSE(3)-同変拡散モデルとを融合した最初のREADが導入された。
CBGBenchでは非常に競争力があり、最先端のジェネレーティブモデルやネイティブな足場を超越している。
論文 参考訳(メタデータ) (2025-06-17T13:09:11Z) - ProteinZero: Self-Improving Protein Generation via Online Reinforcement Learning [49.2607661375311]
本稿では,逆折り畳みモデルの計算的拡張性,自動化,継続的な自己改善を可能にする新しいフレームワークであるProteinZeroを提案する。
ProteinZeroは、タンパク質設計のすべての主要な指標において、既存の手法を大幅に上回っている。
特に、CATH-4.3上で実行されるRL全体は、報酬を含む3日以内に1つの8X GPUノードで実行できる。
論文 参考訳(メタデータ) (2025-06-09T06:08:59Z) - JanusDDG: A Thermodynamics-Compliant Model for Sequence-Based Protein Stability via Two-Fronts Multi-Head Attention [0.0]
残基の変化がタンパク質の安定性にどのように影響するかを理解することは 機能的なタンパク質を設計するのに重要である。
タンパク質言語モデル(PLM)の最近の進歩は、計算タンパク質分析に革命をもたらした。
我々は PLM 由来の埋め込みと双方向のクロスアテンショントランスフォーマアーキテクチャを利用するディープラーニングフレームワーク JanusDDG を紹介する。
論文 参考訳(メタデータ) (2025-04-04T09:02:32Z) - Protein Conformation Generation via Force-Guided SE(3) Diffusion Models [48.48934625235448]
新しいタンパク質コンホメーションを生成するために、深層生成モデリング技術が用いられている。
本稿では,タンパク質コンフォメーション生成のための力誘導SE(3)拡散モデルConfDiffを提案する。
論文 参考訳(メタデータ) (2024-03-21T02:44:08Z) - Plug & Play Directed Evolution of Proteins with Gradient-based Discrete
MCMC [1.0499611180329804]
機械学習ベースのタンパク質工学の長年の目標は、新しい突然変異の発見を加速することである。
本稿では,シリコにおけるタンパク質の進化のためのサンプリングフレームワークについて紹介する。
これらのモデルを構成することで、未知の突然変異を評価し、機能的タンパク質を含む可能性のある配列空間の領域を探索する能力を向上させることを目指している。
論文 参考訳(メタデータ) (2022-12-20T00:26:23Z) - Independent SE(3)-Equivariant Models for End-to-End Rigid Protein
Docking [57.2037357017652]
我々は、剛体タンパク質ドッキング、すなわち、個々の非結合構造からタンパク質-タンパク質複合体の3次元構造を計算的に予測する。
本研究では, タンパク質の回転と翻訳を予測し, 1つのタンパク質をドッキング位置に置くために, ペアワイズ非独立なSE(3)-等変グラフマッチングネットワークを設計する。
我々のモデルはEquiDockと呼ばれ、結合ポケットを近似し、キーポイントマッチングとアライメントを用いてドッキングポーズを予測する。
論文 参考訳(メタデータ) (2021-11-15T18:46:37Z) - EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based
Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。
EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:40:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。