論文の概要: Purely Agentic Black-Box Optimization for Biological Design
- arxiv url: http://arxiv.org/abs/2601.22382v1
- Date: Thu, 29 Jan 2026 22:45:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-02 18:28:15.108295
- Title: Purely Agentic Black-Box Optimization for Biological Design
- Title(参考訳): 生体設計のための純エージェントブラックボックス最適化
- Authors: Natalie Maus, Yimeng Zeng, Haydn Thomas Jones, Yining Huang, Gaurav Ng Goel, Alden Rose, Kyurae Kim, Hyun-Su Lee, Marcelo Der Torossian Torres, Fangping Wan, Cesar de la Fuente-Nunez, Mark Yatskar, Osbert Bastani, Jacob R. Gardner,
- Abstract要約: 小分子の薬物発見、抗微生物ペプチド開発、タンパク質工学など、生物設計における重要な課題はブラックボックス最適化である。
既存の手法は主に生の構造データに依存しており、豊かな科学文献の活用に苦慮している。
我々は、生物学的ブラックボックス最適化を、完全にエージェント的、言語に基づく推論プロセスとして用いた。
- 参考スコア(独自算出の注目度): 34.69167338457496
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Many key challenges in biological design-such as small-molecule drug discovery, antimicrobial peptide development, and protein engineering-can be framed as black-box optimization over vast, complex structured spaces. Existing methods rely mainly on raw structural data and struggle to exploit the rich scientific literature. While large language models (LLMs) have been added to these pipelines, they have been confined to narrow roles within structure-centered optimizers. We instead cast biological black-box optimization as a fully agentic, language-based reasoning process. We introduce Purely Agentic BLack-box Optimization (PABLO), a hierarchical agentic system that uses scientific LLMs pretrained on chemistry and biology literature to generate and iteratively refine biological candidates. On both the standard GuacaMol molecular design and antimicrobial peptide optimization tasks, PABLO achieves state-of-the-art performance, substantially improving sample efficiency and final objective values over established baselines. Compared to prior optimization methods that incorporate LLMs, PABLO achieves competitive token usage per run despite relying on LLMs throughout the optimization loop. Beyond raw performance, the agentic formulation offers key advantages for realistic design: it naturally incorporates semantic task descriptions, retrieval-augmented domain knowledge, and complex constraints. In follow-up in vitro validation, PABLO-optimized peptides showed strong activity against drug-resistant pathogens, underscoring the practical potential of PABLO for therapeutic discovery.
- Abstract(参考訳): 小分子の薬物発見、抗微生物ペプチド開発、タンパク質工学など、生物設計における多くの課題は、広大な複雑な構造空間上でのブラックボックス最適化とみなすことができる。
既存の手法は主に生の構造データに依存しており、豊かな科学文献の活用に苦慮している。
大きな言語モデル(LLM)がこれらのパイプラインに追加されているが、構造中心のオプティマイザ内の狭い役割に限定されている。
代わりに、生物学的ブラックボックス最適化を、完全にエージェント的、言語ベースの推論プロセスとして用いた。
本稿では, 化学・生物学の文献に事前学習された科学的LLMを用いて, 生物候補の生成と改良を行う階層型エージェントシステムであるPurely Agentic BLack-box Optimization (PABLO)を紹介する。
標準のGuacaMol分子設計と抗菌ペプチド最適化のタスクの両方において、PABLOは最先端性能を実現し、確立されたベースラインよりも試料効率と最終目標値を大幅に改善する。
LLMを組み込んだ以前の最適化手法と比較して、PABLOは最適化ループ全体を通してLLMに依存するにもかかわらず、1ラン当たりの競合トークン使用率を達成する。
エージェントの定式化は、生のパフォーマンス以外にも、現実的な設計に重要な利点をもたらします。
その後のin vitroでの検証では、PABLO最適化ペプチドは薬剤耐性病原体に対して強い活性を示し、治療的発見のためのPABLOの実用的可能性を強調した。
関連論文リスト
- Self Distillation Fine-Tuning of Protein Language Models Improves Versatility in Protein Design [61.2846583160056]
Supervised Fine-tuning (SFT) は、大規模言語モデルを特殊なドメインに適応するための標準的なアプローチである。
これは、高品質なアノテートされたデータは、自然言語よりもタンパク質の入手がはるかに難しいためである。
生成したタンパク質配列の忠実度,信頼性,新規性を改善するために設計された,PLMの高速SFTのための簡易かつ汎用的なレシピを提案する。
論文 参考訳(メタデータ) (2025-12-10T05:34:47Z) - ChemBOMAS: Accelerated BO in Chemistry with LLM-Enhanced Multi-Agent System [72.63341091857959]
本稿では,大規模言語モデル(LLM)によるベイズ最適化を高速化するマルチエージェントシステムであるChemBOMASを紹介する。
データ駆動型戦略は、わずか1%のラベル付きサンプルに微調整された8BスケールのLCMレジストレータを含む。
知識駆動型戦略では、検索空間の分割においてLLMを導くために、ハイブリッドなRetrieval-Augmented Generationアプローチを採用している。
ChemBOMASはベースライン方式に比べて最適化効率を最大5倍に向上させた。
論文 参考訳(メタデータ) (2025-09-10T16:24:08Z) - DrugImproverGPT: A Large Language Model for Drug Optimization with Fine-Tuning via Structured Policy Optimization [53.27954325490941]
大規模言語モデル(LLM)の微調整は、特定の目的に向けて結果を生成するために不可欠である。
本研究は,薬物最適化LSMに基づく生成モデルを微調整するための新しい強化学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-02-11T04:00:21Z) - Constrained composite Bayesian optimization for rational synthesis of polymeric particles [0.7499722271664147]
本研究では,制約付きおよび複合ベイズ最適化(CCBO)を統合し,ブラックボックス実現可能性制約の下で効率的な目標値最適化を行う。
CCBOは戦略的に不可能な条件を回避し、あらかじめ定義された大きさの目標に向けて効率的に粒子生産を最適化した。
実験では、ポリ(乳酸-コ-グリコール酸)粒子の300nmおよび3.0$mu$mの合理的合成を電気散布により導くためのCCBO機能を検証した。
論文 参考訳(メタデータ) (2024-11-06T14:40:03Z) - LightCPPgen: An Explainable Machine Learning Pipeline for Rational Design of Cell Penetrating Peptides [0.32985979395737786]
我々は,機械学習(ML)と最適化アルゴリズムの長所を活かして,CPPのデノボ設計に革新的なアプローチを導入する。
私たちの戦略はLight CPPgenと呼ばれ、LightGBMベースの予測モデルと遺伝的アルゴリズム(GA)を統合しています。
GAソリューションは、元の非貫通ペプチドとの類似性を最大化しつつ、候補配列の透過性スコアを特にターゲットとしている。
論文 参考訳(メタデータ) (2024-05-31T10:57:25Z) - Large Language Models to Enhance Bayesian Optimization [57.474613739645605]
本稿では,大規模言語モデル(LLM)の能力をベイズ最適化に組み込む新しいアプローチであるLLAMBOを提案する。
高いレベルでは、自然言語のBO問題を枠組み化し、LLMが歴史的評価に照らした有望な解を反復的に提案し、評価することを可能にする。
以上の結果から,LLAMBOはゼロショットウォームスタートに有効であり,サロゲートモデリングや候補サンプリングの促進,特に観察が不十分な場合の探索の初期段階において有効であることが示唆された。
論文 参考訳(メタデータ) (2024-02-06T11:44:06Z) - Designing Biological Sequences via Meta-Reinforcement Learning and
Bayesian Optimization [68.28697120944116]
メタ強化学習を用いて自己回帰生成モデルを訓練し、選択のための有望なシーケンスを提案する。
我々は,データのサブセットのサンプリングによって誘導されるMDPの分布に対する最適ポリシーを求める問題として,この問題を提起する。
このようなアンサンブルに対するメタラーニングは,報酬の過小評価に対して頑健であり,競争的な結果が得られることを示す。
論文 参考訳(メタデータ) (2022-09-13T18:37:27Z) - ODBO: Bayesian Optimization with Search Space Prescreening for Directed Protein Evolution [18.726398852721204]
タンパク質指向進化のための効率的で実験的な設計指向のクローズドループ最適化フレームワークを提案する。
ODBOは、新しい低次元タンパク質エンコーディング戦略と、外乱検出による検索空間事前スクリーニングによって強化されたベイズ最適化を組み合わせている。
本研究は, タンパク質指向進化実験を4回実施し, 興味のある変異を見出すためのフレームワークの能力を実証した。
論文 参考訳(メタデータ) (2022-05-19T13:21:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。