論文の概要: AgentPLM: Agentic Protein Language Models with Reasoning-Augmented Decoding for Protein Sequence Design
- arxiv url: http://arxiv.org/abs/2606.02386v2
- Date: Tue, 09 Jun 2026 09:11:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-10 13:21:50.518263
- Title: AgentPLM: Agentic Protein Language Models with Reasoning-Augmented Decoding for Protein Sequence Design
- Title(参考訳): AgentPLM:タンパク質配列設計のための推論デコード付きエージェントタンパク質言語モデル
- Authors: Sahil Rahman, Maxx Richard Rahman,
- Abstract要約: タンパク質言語モデル(PLM)は、外部の生物物理学的フィードバックやリダイレクト生成のメカニズムを持たない単一の前方通過で配列を生成する。
本稿では,ツールコールによる自己回帰生成をインターリーブするReasoning-Augmented Decoding (RAD)を用いて,事前学習したPLMを組み込むことにより,この問題に対処するAgentPLMを紹介する。
我々は、デノボ酵素設計、抗体最適化、耐熱性、PPIインターフェース設計、および標準オラクルAPIによるゼロショット適合性予測を含むベンチマークタスクにおいて、AgentPLMを評価した。
- 参考スコア(独自算出の注目度): 0.48342038441006796
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Protein language models (PLMs) are passive oracles: they generate sequences in a single forward pass with no mechanism to consult external biophysical feedback or redirect generation when a candidate violates thermodynamic or structural constraints. We introduce AgentPLM, which addresses this by equipping a pre-trained PLM with i) Reasoning-Augmented Decoding (RAD), which interleaves autoregressive generation with tool calls (ESMFold, FoldX, AutoDock Vina), and ii) Contrastive Agent Policy Optimisation (CAPO), a trajectory-level extension of direct preference optimisation that trains the policy end-to-end to learn when oracle feedback is informative rather than merely imitating high-fitness sequences. We evaluate AgentPLM on benchmark tasks spanning de novo enzyme design, antibody optimisation, thermostability, PPI interface design, and zero-shot fitness prediction with standardised oracle APIs and controlled sequence-identity splits. AgentPLM achieves state-of-the-art results with a gain in antibody top-10% hit rate over the strongest passive baseline, providing mechanistic evidence of online error correction without explicit backtracking.
- Abstract(参考訳): タンパク質言語モデル(PLM)は受動的オラクル(英語版)であり、熱力学または構造的制約に違反した場合、外部の生体物理学的フィードバックやリダイレクト生成のメカニズムを持たない単一の前方通過でシーケンスを生成する。
我々はAgentPLMを導入し、事前訓練されたPLMを装着することでこの問題に対処する。
一 ツールコール(ESMFold、FoldX、AutoDock Vina)と自己回帰生成をインターリーブする推論拡張復号(RAD)
二 コントラクティブ・エージェント・ポリシー・オプティマイゼーション(CAPO、Contrastive Agent Policy Optimisation、コントラクティブ・エージェント・ポリシー・オプティマイゼーション)とは、直接選好最適化の軌跡レベルの拡張で、オラクルのフィードバックが単に適合度の高いシーケンスを模倣するのではなく、いつ情報的であるかを学ぶために、政策をエンドツーエンドに訓練するものである。
我々は,de novo酵素設計,抗体最適化,耐熱性,PPIインターフェース設計,およびゼロショット適合度予測を標準化されたオラクルAPIと制御シーケンスアイデンティティスプリットで行うベンチマークタスクにおいて,AgentPLMを評価する。
AgentPLMは、最強の受動的ベースラインよりも10%以上の抗体ヒット率で最先端の結果を達成し、明示的なバックトラックを伴わずにオンラインエラー訂正の機械的証拠を提供する。
関連論文リスト
- IterInject: Indirect Prompt Injection Against LLM Agents via Feedback-Guided Iterative Optimization [33.58630045185762]
既存の攻撃は、エージェント固有の防御に適応できない静的ペイロードに依存している。
インジェクション,診断,診断のループを閉じるフィードバック誘導反復型フレームワークである oursys を導入する。
ステップは、失敗パターンから新しい偽の種を生成し、戦略空間を自己進化させる。
論文 参考訳(メタデータ) (2026-05-23T17:00:06Z) - SEVerA: Verified Synthesis of Self-Evolving Agents [12.9624447364193]
自己進化型エージェントフレームワークは、安全性や正確性の正式な保証を提供しない。
エージェントコード生成を制約付き学習問題として定式化し、ハードな形式仕様とソフトな目的とを組み合わせてタスクユーティリティをキャプチャする。
探索はFGGMコールを含む候補パラメトリックプログラムを合成し、検証は全てのパラメータ値に対する厳しい制約に関して正当性を証明し、制約のない学習に還元する。
論文 参考訳(メタデータ) (2026-03-26T07:32:20Z) - Dynamic analysis enhances issue resolution [53.50448142467294]
DAIRA(Dynamic Analysis-enhanced Issue Resolution Agent)は、エージェントの推論サイクルに動的解析を組み込む自動修復フレームワークである。
テストトレース駆動の方法論によって駆動されるDAIRAは、軽量モニタを使用して重要なランタイムデータを抽出する。
Gemini 3 Flash Previewを使用すると、DAIRAは新たな最先端(SOTA)パフォーマンスを確立し、SWE-bench Verifiedデータセットで79.4%の解像度を達成する。
論文 参考訳(メタデータ) (2026-03-23T14:48:54Z) - Execution-State-Aware LLM Reasoning for Automated Proof-of-Vulnerability Generation [36.950993500170014]
本稿では,PoV生成を反復的仮説検証法として再構成するエージェントフレームワークであるDrillAgentを提案する。
我々は、実世界のC/C++脆弱性の大規模なベンチマークであるSEC-bench上でDrillAgentを評価する。
論文 参考訳(メタデータ) (2026-02-14T03:17:27Z) - AgentDevel: Reframing Self-Evolving LLM Agents as Release Engineering [8.201374511929538]
AgentDevelは、現行のエージェントを反復的に実行するリリースエンジニアリングパイプラインである。
実行トレースから実装盲の症状レベルの品質信号を生成する。
主要な症状パターンを集約し、監査可能なエンジニアリング仕様を生成する。
論文 参考訳(メタデータ) (2026-01-08T05:49:01Z) - EVE: A Generator-Verifier System for Generative Policies [27.92559083553638]
生成的アーキテクチャに基づくビジュモータポリシーは、強い性能を示すが、分散シフトの下では劣化する。
Eveはモジュール型ジェネレータと検証器のインタラクションフレームワークで、テスト時に事前訓練された生成ポリシーのパフォーマンスを高める。
論文 参考訳(メタデータ) (2025-12-24T21:36:34Z) - Self Distillation Fine-Tuning of Protein Language Models Improves Versatility in Protein Design [61.2846583160056]
Supervised Fine-tuning (SFT) は、大規模言語モデルを特殊なドメインに適応するための標準的なアプローチである。
これは、高品質なアノテートされたデータは、自然言語よりもタンパク質の入手がはるかに難しいためである。
生成したタンパク質配列の忠実度,信頼性,新規性を改善するために設計された,PLMの高速SFTのための簡易かつ汎用的なレシピを提案する。
論文 参考訳(メタデータ) (2025-12-10T05:34:47Z) - Alita-G: Self-Evolving Generative Agent for Agent Generation [54.49365835457433]
汎用エージェントをドメインエキスパートに変換するフレームワークであるALITA-Gを提案する。
このフレームワークでは、ジェネラリストエージェントが対象ドメインタスクのキュレートされたスイートを実行する。
計算コストを削減しながら、大きな利益を得ることができます。
論文 参考訳(メタデータ) (2025-10-27T17:59:14Z) - AegisLLM: Scaling Agentic Systems for Self-Reflective Defense in LLM Security [74.22452069013289]
AegisLLMは、敵の攻撃や情報漏洩に対する協調的なマルチエージェント防御である。
テスト時のエージェント推論システムのスケーリングは,モデルの有用性を損なうことなく,ロバスト性を大幅に向上させることを示す。
アンラーニングやジェイルブレイクを含む主要な脅威シナリオに対する総合的な評価は、AegisLLMの有効性を示している。
論文 参考訳(メタデータ) (2025-04-29T17:36:05Z) - Steering Masked Discrete Diffusion Models via Discrete Denoising Posterior Prediction [88.65168366064061]
本稿では,確率論的推論の課題として,事前学習したMDMを操る作業を行う新しいフレームワークであるDDPPを紹介する。
私たちのフレームワークは、3つの新しい目標のファミリーにつながります。
Wet-lab Validation(ウェット・ラブ・バリデーション)を用いて,報酬最適化タンパク質配列の過渡的発現を観察する。
論文 参考訳(メタデータ) (2024-10-10T17:18:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。