論文の概要: Meta-Learning for Cross-Task Generalization in Protein Mutation Property Prediction
- arxiv url: http://arxiv.org/abs/2510.20943v1
- Date: Thu, 23 Oct 2025 19:09:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 09:00:15.300306
- Title: Meta-Learning for Cross-Task Generalization in Protein Mutation Property Prediction
- Title(参考訳): タンパク質変異特性予測におけるクロスタスク一般化のためのメタラーニング
- Authors: Srivathsan Badrinarayanan, Yue Su, Janghoon Ock, Alan Pham, Sanya Ahuja, Amir Barati Farimani,
- Abstract要約: モデル非依存型メタラーニング(MAML)のタンパク質突然変異特性予測への応用について紹介する。
また,シークエンスに変異を直接組み込むために,セパレータトークンを用いた新規な突然変異符号化戦略を導入する。
我々の突然変異エンコーディングは、標準的なトランスフォーマーが未知のトークンとして突然変異位置を扱い、性能を著しく低下させる限界に対処する。
- 参考スコア(独自算出の注目度): 9.083239192939661
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Protein mutations can have profound effects on biological function, making accurate prediction of property changes critical for drug discovery, protein engineering, and precision medicine. Current approaches rely on fine-tuning protein-specific transformers for individual datasets, but struggle with cross-dataset generalization due to heterogeneous experimental conditions and limited target domain data. We introduce two key innovations: (1) the first application of Model-Agnostic Meta-Learning (MAML) to protein mutation property prediction, and (2) a novel mutation encoding strategy using separator tokens to directly incorporate mutations into sequence context. We build upon transformer architectures integrating them with MAML to enable rapid adaptation to new tasks through minimal gradient steps rather than learning dataset-specific patterns. Our mutation encoding addresses the critical limitation where standard transformers treat mutation positions as unknown tokens, significantly degrading performance. Evaluation across three diverse protein mutation datasets (functional fitness, thermal stability, and solubility) demonstrates significant advantages over traditional fine-tuning. In cross-task evaluation, our meta-learning approach achieves 29% better accuracy for functional fitness with 65% less training time, and 94% better accuracy for solubility with 55% faster training. The framework maintains consistent training efficiency regardless of dataset size, making it particularly valuable for industrial applications and early-stage protein design where experimental data is limited. This work establishes a systematic application of meta-learning to protein mutation analysis and introduces an effective mutation encoding strategy, offering transformative methodology for cross-domain generalization in protein engineering.
- Abstract(参考訳): タンパク質変異は生物学的機能に大きな影響を与え、薬物発見、タンパク質工学、精密医療において重要な特性変化を正確に予測する。
現在のアプローチでは、個々のデータセットに対して微調整されたタンパク質特異的トランスフォーマーを頼っているが、不均一な実験条件と限られたターゲット領域データによるクロスデータセットの一般化に苦慮している。
本稿では,(1)タンパク質変異特性予測へのモデル非依存的メタラーニング(MAML)の最初の応用,(2)シークエンスに直接突然変異を組み込むセパレータトークンを用いた新規な突然変異符号化戦略を紹介する。
我々は、データセット固有のパターンを学習するのではなく、最小限の勾配ステップで新しいタスクへの迅速な適応を可能にするために、MAMLとそれらを統合したトランスフォーマーアーキテクチャを構築している。
我々の突然変異エンコーディングは、標準的なトランスフォーマーが未知のトークンとして突然変異位置を扱い、性能を著しく低下させる限界に対処する。
3つの多様なタンパク質変異データセット(機能的適合性、熱安定性、溶解度)による評価は、従来の微調整よりも大きな利点を示している。
クロスタスク評価では、我々のメタラーニングアプローチは、トレーニング時間が65%少なく、トレーニングが55%速く、溶解度が94%向上する機能フィットネスの精度を29%向上させる。
このフレームワークはデータセットのサイズに関わらず、一貫したトレーニング効率を維持しており、実験データに制限のある産業アプリケーションやアーリーステージのタンパク質設計に特に有用である。
この研究は、タンパク質変異解析へのメタラーニングの体系的応用を確立し、タンパク質工学におけるクロスドメイン一般化のための変換手法を提供する効果的な突然変異符号化戦略を導入する。
関連論文リスト
- ProteinAE: Protein Diffusion Autoencoders for Structure Encoding [64.77182442408254]
本稿では,新規かつ合理化されたタンパク質拡散オートエンコーダであるProteinAEを紹介する。
プロテインAEは、タンパク質のバックボーン座標を直接E(3)から連続的でコンパクトな潜在空間にマッピングする。
本研究では,既存のオートエンコーダよりも優れた,最先端の再構築品質を実現することを実証する。
論文 参考訳(メタデータ) (2025-10-12T14:30:32Z) - ProtCLIP: Function-Informed Protein Multi-Modal Learning [18.61302416993122]
ProtCLIPは,機能認識タンパク質の埋め込みを表現した多モード基盤モデルである。
当社のProtCLIPは,5つのクロスモーダル変換ベンチマークにおいて,平均75%の大幅な改善を実現している。
実験により,タンパク質多量性基盤モデルとしてのProtCLIPの異常なポテンシャルが検証された。
論文 参考訳(メタデータ) (2024-12-28T04:23:47Z) - Learning to Predict Mutation Effects of Protein-Protein Interactions by Microenvironment-aware Hierarchical Prompt Learning [78.38442423223832]
我々は、新しいコードブック事前学習タスク、すなわちマスク付きマイクロ環境モデリングを開発する。
突然変異効果予測において、最先端の事前学習法よりも優れた性能と訓練効率を示す。
論文 参考訳(メタデータ) (2024-05-16T03:53:21Z) - Efficiently Predicting Mutational Effect on Homologous Proteins by Evolution Encoding [7.067145619709089]
EvolMPNNは進化を意識したタンパク質の埋め込みを学習するための効率的なモデルである。
我々のモデルは最先端の手法よりも最大6.4%向上し,36倍の高速化を実現している。
論文 参考訳(メタデータ) (2024-02-20T23:06:21Z) - Efficiently Predicting Protein Stability Changes Upon Single-point
Mutation with Large Language Models [51.57843608615827]
タンパク質の熱安定性を正確に予測する能力は、様々なサブフィールドや生化学への応用において重要である。
タンパク質配列と構造的特徴を統合したESMによる効率的なアプローチを導入し, 単一点突然変異によるタンパク質の熱安定性変化を予測する。
論文 参考訳(メタデータ) (2023-12-07T03:25:49Z) - Accurate and Definite Mutational Effect Prediction with Lightweight
Equivariant Graph Neural Networks [2.381587712372268]
本研究では,野生型タンパク質の微小環境を効率的に解析する軽量なグラフ表現学習手法を提案する。
私たちのソリューションは、コミュニティにとって理想的な選択肢となる、幅広いメリットを提供します。
論文 参考訳(メタデータ) (2023-04-13T09:51:49Z) - Reprogramming Pretrained Language Models for Protein Sequence
Representation Learning [68.75392232599654]
エンドツーエンドの表現学習フレームワークである辞書学習(R2DL)による表現学習を提案する。
R2DLは、タンパク質配列の埋め込みを学ぶために、事前訓練された英語モデルを再プログラムする。
我々のモデルは,事前訓練および標準教師付き手法によって設定されたベースラインに対して,最大105ドルの精度でデータ効率を大幅に向上させることができる。
論文 参考訳(メタデータ) (2023-01-05T15:55:18Z) - SESNet: sequence-structure feature-integrated deep learning method for
data-efficient protein engineering [6.216757583450049]
タンパク質変異体の適合度を予測するための教師付きディープラーニングモデルであるSESNetを開発した。
SESNetは,シーケンスと関数の関係を予測するための最先端モデルよりも優れていることを示す。
我々のモデルは、タンパク質変異体の適合性の予測において、特に高次変異体に対して驚くほど高い精度を達成することができる。
論文 参考訳(メタデータ) (2022-12-29T01:49:52Z) - Using Genetic Programming to Predict and Optimize Protein Function [65.25258357832584]
我々は,進化的手法に基づく遺伝的プログラミングツールPOETを提案し,方向性進化におけるスクリーニングと変異原性を高める。
概念実証として, 化学交換飽和移動機構によって検出されたMRIコントラストを生成するペプチドを用いる。
以上の結果から,POETのような計算モデリングツールは,従来よりも400%優れた機能性を持つペプチドを見つけるのに有効であることが示唆された。
論文 参考訳(メタデータ) (2022-02-08T18:08:08Z) - EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based
Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。
EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:40:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。