論文の概要: Rank-and-Reason: Multi-Agent Collaboration Accelerates Zero-Shot Protein Mutation Prediction
- arxiv url: http://arxiv.org/abs/2602.00197v2
- Date: Tue, 03 Feb 2026 04:26:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 16:18:58.824831
- Title: Rank-and-Reason: Multi-Agent Collaboration Accelerates Zero-Shot Protein Mutation Prediction
- Title(参考訳): Rank-and-Reason: ゼロショットタンパク質変異予測を加速する多エージェント協調
- Authors: Yang Tan, Yuanxi Yu, Can Wu, Bozitao Zhong, Mingchen Li, Guisheng Fan, Jiankang Zhu, Yafeng Liang, Nanqing Dong, Liang Hong,
- Abstract要約: ウェットラブ検証プロセスを自動化する2段階のエージェントフレームワークであるRan-and-Reason(VenusRAR)を提案する。
Rank-Stageでは、計算専門家と仮想生物学者がコンテキスト対応のマルチモーダルアンサンブルをまとめ、ProteinGym上で0.551(vs.0.518)の新しいスピアマン相関記録を樹立した。
Reason-Stageでは、エージェント専門家パネルが、幾何学的および構造的制約に対して候補を監査するチェーン・オブ・シンキングを採用し、ProteinGym-DMS99で最高5ヒット率を最大367%改善している。
- 参考スコア(独自算出の注目度): 20.82228986381723
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Zero-shot mutation prediction is vital for low-resource protein engineering, yet existing protein language models (PLMs) often yield statistically confident results that ignore fundamental biophysical constraints. Currently, selecting candidates for wet-lab validation relies on manual expert auditing of PLM outputs, a process that is inefficient, subjective, and highly dependent on domain expertise. To address this, we propose Rank-and-Reason (VenusRAR), a two-stage agentic framework to automate this workflow and maximize expected wet-lab fitness. In the Rank-Stage, a Computational Expert and Virtual Biologist aggregate a context-aware multi-modal ensemble, establishing a new Spearman correlation record of 0.551 (vs. 0.518) on ProteinGym. In the Reason-Stage, an agentic Expert Panel employs chain-of-thought reasoning to audit candidates against geometric and structural constraints, improving the Top-5 Hit Rate by up to 367% on ProteinGym-DMS99. The wet-lab validation on Cas12i3 nuclease further confirms the framework's efficacy, achieving a 46.7% positive rate and identifying two novel mutants with 4.23-fold and 5.05-fold activity improvements. Code and datasets are released on GitHub (https://github.com/ai4protein/VenusRAR/).
- Abstract(参考訳): ゼロショット変異予測は低リソースのタンパク質工学には不可欠であるが、既存のタンパク質言語モデル(PLM)は基本的な生物学的制約を無視した統計的に確実な結果をもたらすことが多い。
現在、ウェットラブ検証の候補を選択するには、PLM出力のマニュアル専門家監査(非効率で主観的で、ドメインの専門知識に強く依存するプロセス)に依存している。
そこで我々は,このワークフローを自動化し,期待されるウェットラブ適合度を最大化するための2段階のエージェントフレームワークであるRang-and-Reason(VenusRAR)を提案する。
Rank-Stageでは、計算専門家と仮想生物学者がコンテキスト対応のマルチモーダルアンサンブルをまとめ、ProteinGym上で0.551(vs.0.518)の新しいスピアマン相関記録を樹立した。
Reason-Stageでは、エージェント専門家パネルが、幾何学的および構造的制約に対して候補を監査するチェーン・オブ・シンキングを採用し、ProteinGym-DMS99で最高5ヒット率を最大367%改善している。
Cas12i3ヌクレアーゼのウェットラブによる検証により、このフレームワークの有効性が確認され、46.7%の陽性率と4.23倍および5.05倍の活性改善を持つ2つの新規変異株が同定された。
コードとデータセットはGitHubでリリースされている(https://github.com/ai4oprotein/VenusRAR/)。
関連論文リスト
- Self Distillation Fine-Tuning of Protein Language Models Improves Versatility in Protein Design [61.2846583160056]
Supervised Fine-tuning (SFT) は、大規模言語モデルを特殊なドメインに適応するための標準的なアプローチである。
これは、高品質なアノテートされたデータは、自然言語よりもタンパク質の入手がはるかに難しいためである。
生成したタンパク質配列の忠実度,信頼性,新規性を改善するために設計された,PLMの高速SFTのための簡易かつ汎用的なレシピを提案する。
論文 参考訳(メタデータ) (2025-12-10T05:34:47Z) - Low-N Protein Activity Optimization with FolDE [15.733324207723328]
本稿では,終末成功を最大化するALDE法であるFolDEを提案する。
20のタンパク質標的のシミュレーションにおいて、FolDEは最高のベースライン法よりも上位10%の変異体を23%多く発見している。
また、バッチの多様性を向上させる定数線形バッチセレクタも導入する。
論文 参考訳(メタデータ) (2025-10-28T04:24:39Z) - Meta-Learning for Cross-Task Generalization in Protein Mutation Property Prediction [9.083239192939661]
モデル非依存型メタラーニング(MAML)のタンパク質突然変異特性予測への応用について紹介する。
また,シークエンスに変異を直接組み込むために,セパレータトークンを用いた新規な突然変異符号化戦略を導入する。
我々の突然変異エンコーディングは、標準的なトランスフォーマーが未知のトークンとして突然変異位置を扱い、性能を著しく低下させる限界に対処する。
論文 参考訳(メタデータ) (2025-10-23T19:09:06Z) - Eigen-1: Adaptive Multi-Agent Refinement with Monitor-Based RAG for Scientific Reasoning [53.45095336430027]
暗黙的な検索と構造化された協調を組み合わせた統合フレームワークを開発する。
Humanity's Last Exam (HLE) Bio/Chem Goldでは,48.3%の精度を実現している。
SuperGPQAとTRQAの結果はドメイン間の堅牢性を確認した。
論文 参考訳(メタデータ) (2025-09-25T14:05:55Z) - DISPROTBENCH: A Disorder-Aware, Task-Rich Benchmark for Evaluating Protein Structure Prediction in Realistic Biological Contexts [76.59606029593085]
DisProtBenchは、構造障害および複雑な生物学的条件下でタンパク質構造予測モデル(PSPM)を評価するためのベンチマークである。
DisProtBenchはデータの複雑さ、タスクの多様性、解釈可能性という3つの重要な軸にまたがっている。
その結果,機能的予測障害と相関する低信頼領域を有する障害下でのモデルロバスト性に有意な変動が認められた。
論文 参考訳(メタデータ) (2025-06-18T23:58:22Z) - ProteinZero: Self-Improving Protein Generation via Online Reinforcement Learning [49.2607661375311]
本稿では,逆折り畳みモデルの計算的拡張性,自動化,継続的な自己改善を可能にする新しいフレームワークであるProteinZeroを提案する。
ProteinZeroは、タンパク質設計のすべての主要な指標において、既存の手法を大幅に上回っている。
特に、CATH-4.3上で実行されるRL全体は、報酬を含む3日以内に1つの8X GPUノードで実行できる。
論文 参考訳(メタデータ) (2025-06-09T06:08:59Z) - DisorderUnetLM: Validating ProteinUnet for efficient protein intrinsic disorder prediction [0.0]
内因性障害領域の予測は、タンパク質の機能やダイナミクスを理解する上で重要な意味を持つ。
近年,タンパク質言語モデル(pLM)に基づく新しい世代の予測器が出現している。
本稿では、タンパク質Unetの考え方に基づく新しい障害UnetLM障害予測器について紹介する。
論文 参考訳(メタデータ) (2024-04-11T20:14:14Z) - Efficiently Predicting Protein Stability Changes Upon Single-point
Mutation with Large Language Models [51.57843608615827]
タンパク質の熱安定性を正確に予測する能力は、様々なサブフィールドや生化学への応用において重要である。
タンパク質配列と構造的特徴を統合したESMによる効率的なアプローチを導入し, 単一点突然変異によるタンパク質の熱安定性変化を予測する。
論文 参考訳(メタデータ) (2023-12-07T03:25:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。