論文の概要: Repurposing Protein Language Models for Latent Flow-Based Fitness Optimization
- arxiv url: http://arxiv.org/abs/2602.02425v1
- Date: Mon, 02 Feb 2026 18:25:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-03 19:28:34.355676
- Title: Repurposing Protein Language Models for Latent Flow-Based Fitness Optimization
- Title(参考訳): 潜在フローベース適合度最適化のためのタンパク質言語モデルの再検討
- Authors: Amaru Caceres Arroyo, Lea Bogensperger, Ahmed Allam, Michael Krauthammer, Konrad Schindler, Dominik Narnhofer,
- Abstract要約: CHASEは、事前訓練されたタンパク質言語モデルの進化的知識を再利用するフレームワークである。
AAVおよびGFPタンパク質設計ベンチマークの最先端性能を達成する。
- 参考スコア(独自算出の注目度): 24.267946140577806
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Protein fitness optimization is challenged by a vast combinatorial landscape where high-fitness variants are extremely sparse. Many current methods either underperform or require computationally expensive gradient-based sampling. We present CHASE, a framework that repurposes the evolutionary knowledge of pretrained protein language models by compressing their embeddings into a compact latent space. By training a conditional flow-matching model with classifier-free guidance, we enable the direct generation of high-fitness variants without predictor-based guidance during the ODE sampling steps. CHASE achieves state-of-the-art performance on AAV and GFP protein design benchmarks. Finally, we show that bootstrapping with synthetic data can further enhance performance in data-constrained settings.
- Abstract(参考訳): タンパク質の適合性最適化は、高度に適合した変異が極めて希薄な、膨大な組み合わせの景観に挑戦されている。
現在の多くの手法は性能が劣るか、計算に高価な勾配に基づくサンプリングを必要とする。
本稿では,その埋め込みをコンパクトな潜在空間に圧縮することにより,事前学習されたタンパク質言語モデルの進化的知識を再利用するフレームワークCHASEを提案する。
条件付きフローマッチングモデルを分類器フリーガイダンスで訓練することにより、ODEサンプリングステップ中に予測子ベースのガイダンスを使わずに、高適合性の変種を直接生成できる。
CHASE は AAV および GFP タンパク質設計ベンチマークの最先端性能を達成する。
最後に、合成データによるブートストラップにより、データ制約された設定におけるパフォーマンスをさらに向上させることができることを示す。
関連論文リスト
- Visual Autoregressive Modelling for Monocular Depth Estimation [69.01449528371916]
本稿では,視覚的自己回帰(VAR)に基づく単眼深度推定手法を提案する。
提案手法は,大規模テキスト・画像VARモデルに適応し,スケールワイド・コンディショナル・アップサンプリング機構を導入する。
本研究では,屋内ベンチマークにおける制約付きトレーニング条件下での最先端性能と,屋外データセットに適用した場合の強い性能について報告する。
論文 参考訳(メタデータ) (2025-12-27T17:08:03Z) - Elastic ViTs from Pretrained Models without Retraining [74.5386166956142]
ビジョンファウンデーションモデルは優れたパフォーマンスを達成するが、事前決定されたサイズの限られたセットでしか利用できない。
本稿では, プルーニングされた視覚変換器のためのシングルショットネットワーク近似であるSnapViTを紹介する。
提案手法は,進化的アルゴリズムを用いて近似した勾配情報とクロスネットワーク構造相関を効率的に結合する。
論文 参考訳(メタデータ) (2025-10-20T16:15:03Z) - Steering Generative Models with Experimental Data for Protein Fitness Optimization [25.404040461393876]
タンパク質の適合性最適化は、可能なシーケンスの大きな設計空間において、所望の量的特性を最大化する配列を見つけることを伴う。
ラベル付きデータによるタンパク質生成モデルの最近の進歩は、有望なアプローチである。
本研究では,ラベル付きシーケンス適合性ペアの少量(数百)を用いた適合度最適化について検討する。
論文 参考訳(メタデータ) (2025-05-21T04:30:48Z) - Sample as You Infer: Predictive Coding With Langevin Dynamics [11.515490109360012]
汎用的な深層生成モデルにおけるパラメータ学習のための新しいアルゴリズムを提案する。
提案手法は,標準変分自動エンコーダトレーニングから得られる性能と超越性を実現するために,標準PCアルゴリズムを改良する。
論文 参考訳(メタデータ) (2023-11-22T19:36:47Z) - Protein Design with Guided Discrete Diffusion [67.06148688398677]
タンパク質設計における一般的なアプローチは、生成モデルと条件付きサンプリングのための識別モデルを組み合わせることである。
離散拡散モデルのためのガイダンス手法であるdiffusioN Optimized Smpling (NOS)を提案する。
NOSは、構造に基づく手法の重要な制限を回避し、シーケンス空間で直接設計を行うことができる。
論文 参考訳(メタデータ) (2023-05-31T16:31:24Z) - Robust Model-Based Optimization for Challenging Fitness Landscapes [96.63655543085258]
タンパク質の設計には、フィットネスのランドスケープの最適化が含まれる。
指導法は, トレーニングセットにおける高適合度サンプルの多彩さに課題を呈する。
デザイン空間における「分離」というこの問題は、既存のモデルベース最適化ツールにおいて重大なボトルネックとなっていることを示す。
本稿では,新しいVAEを検索モデルとして利用して問題を克服する手法を提案する。
論文 参考訳(メタデータ) (2023-05-23T03:47:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。