論文の概要: SEISMO: Increasing Sample Efficiency in Molecular Optimization with a Trajectory-Aware LLM Agent
- arxiv url: http://arxiv.org/abs/2602.00663v1
- Date: Sat, 31 Jan 2026 11:23:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-03 19:28:33.323422
- Title: SEISMO: Increasing Sample Efficiency in Molecular Optimization with a Trajectory-Aware LLM Agent
- Title(参考訳): SEISMO: 軌道認識LDMエージェントを用いた分子最適化におけるサンプル効率の向上
- Authors: Fabian P. Krüger, Andrea Hunklinger, Adrian Wolny, Tim J. Adler, Igor Tetko, Santiago David Villalba,
- Abstract要約: オンライン推論時間分子最適化エージェントSEISMOを紹介する。
集団ベースの学習やバッチ学習を必要とせずに、すべてのオラクルコール後に更新される。
従来の方法よりも曲線の2~3倍高い面積を達成し、50オラクルコール以内のタスクスコアに到達することが多い。
- 参考スコア(独自算出の注目度): 0.7377073690542307
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Optimizing the structure of molecules to achieve desired properties is a central bottleneck across the chemical sciences, particularly in the pharmaceutical industry where it underlies the discovery of new drugs. Since molecular property evaluation often relies on costly and rate-limited oracles, such as experimental assays, molecular optimization must be highly sample-efficient. To address this, we introduce SEISMO, an LLM agent that performs strictly online, inference-time molecular optimization, updating after every oracle call without the need for population-based or batched learning. SEISMO conditions each proposal on the full optimization trajectory, combining natural-language task descriptions with scalar scores and, when available, structured explanatory feedback. Across the Practical Molecular Optimization benchmark of 23 tasks, SEISMO achieves a 2-3 times higher area under the optimisation curve than prior methods, often reaching near-maximal task scores within 50 oracle calls. Our additional medicinal-chemistry tasks show that providing explanatory feedback further improves efficiency, demonstrating that leveraging domain knowledge and structured information is key to sample-efficient molecular optimization.
- Abstract(参考訳): 望ましい性質を達成するために分子の構造を最適化することは、化学科学、特に新薬の発見の根底にある製薬業界における中心的なボトルネックである。
分子特性評価は、しばしば、実験的なアッセイのようなコストと速度に制限されたオラクルに依存しているため、分子最適化は高いサンプリング効率でなければならない。
そこで本研究では,LLMエージェントであるSEISMOを紹介した。このエージェントは,集団学習やバッチ学習を必要とせずに,分子最適化を厳格にオンラインに行い,各オラクルコールの後に更新する。
SEISMOは、自然言語タスク記述をスカラースコアと組み合わせ、利用可能な場合、構造化された説明フィードバックを組み込んだ完全な最適化軌道について、それぞれ提案条件を定めている。
23タスクの実用的分子最適化のベンチマークでは、SEISMOは最適化曲線の2~3倍の領域を達成し、50オークルコール以内のタスクスコアに到達する。
我々の追加の医薬化学タスクは、説明的フィードバックを提供することにより、さらに効率が向上し、ドメイン知識と構造化情報を活用することが、サンプリング効率の分子最適化の鍵であることを証明している。
関連論文リスト
- Purely Agentic Black-Box Optimization for Biological Design [34.69167338457496]
小分子の薬物発見、抗微生物ペプチド開発、タンパク質工学など、生物設計における重要な課題はブラックボックス最適化である。
既存の手法は主に生の構造データに依存しており、豊かな科学文献の活用に苦慮している。
我々は、生物学的ブラックボックス最適化を、完全にエージェント的、言語に基づく推論プロセスとして用いた。
論文 参考訳(メタデータ) (2026-01-29T22:45:07Z) - ChemBOMAS: Accelerated BO in Chemistry with LLM-Enhanced Multi-Agent System [72.63341091857959]
本稿では,大規模言語モデル(LLM)によるベイズ最適化を高速化するマルチエージェントシステムであるChemBOMASを紹介する。
データ駆動型戦略は、わずか1%のラベル付きサンプルに微調整された8BスケールのLCMレジストレータを含む。
知識駆動型戦略では、検索空間の分割においてLLMを導くために、ハイブリッドなRetrieval-Augmented Generationアプローチを採用している。
ChemBOMASはベースライン方式に比べて最適化効率を最大5倍に向上させた。
論文 参考訳(メタデータ) (2025-09-10T16:24:08Z) - ChemActor: Enhancing Automated Extraction of Chemical Synthesis Actions with LLM-Generated Data [53.78763789036172]
ケミカルエグゼキュータとして完全微調整された大規模言語モデル(LLM)であるChemActorを紹介し,非構造化実験手順と構造化動作シーケンスを変換する。
このフレームワークは、分散分散に基づくデータ選択モジュールと汎用LLMを統合し、単一の分子入力からマシン実行可能なアクションを生成する。
反応記述(R2D)と記述記述処理(D2A)のタスクの実験により、ChemActorは最先端のパフォーマンスを達成し、ベースラインモデルよりも10%高い性能を示した。
論文 参考訳(メタデータ) (2025-06-30T05:11:19Z) - DrugImproverGPT: A Large Language Model for Drug Optimization with Fine-Tuning via Structured Policy Optimization [53.27954325490941]
大規模言語モデル(LLM)の微調整は、特定の目的に向けて結果を生成するために不可欠である。
本研究は,薬物最適化LSMに基づく生成モデルを微調整するための新しい強化学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-02-11T04:00:21Z) - Conditional Latent Space Molecular Scaffold Optimization for Accelerated Molecular Design [14.63544637436396]
CLaSMO ( Conditional Latent Space Molecular Scaffold Optimization) を導入する。
CLaSMOは、条件変分オートエンコーダ(CVAE)とLatent Space Bayesian Optimization(LSBO)を統合し、分子を戦略的に修飾する。
LSBO設定は, 分子最適化の試料効率を向上し, 実世界の適用可能性の高い分子を得るのに有効である。
論文 参考訳(メタデータ) (2024-11-03T03:17:38Z) - Text-Guided Multi-Property Molecular Optimization with a Diffusion Language Model [20.250683535089617]
変換器を用いた拡散言語モデル(TransDLM)を用いたテキスト誘導多目的分子最適化手法を提案する。
物理的、化学的に詳細なセマンティクスを特異的な分子表現と融合することにより、TransDLMは様々な情報ソースを効果的に統合し、正確な最適化を導く。
論文 参考訳(メタデータ) (2024-10-17T14:30:27Z) - XMOL: Explainable Multi-property Optimization of Molecules [2.320539066224081]
複数の分子特性を同時に最適化するために,分子のマルチプロパティ最適化(XMOL)を提案する。
我々のアプローチは、最先端の幾何学的拡散モデルに基づいており、それらをマルチプロパティ最適化に拡張している。
最適化プロセス全体を通して解釈的および説明可能な技術を統合する。
論文 参考訳(メタデータ) (2024-09-12T06:35:04Z) - DrugAssist: A Large Language Model for Molecule Optimization [29.95488215594247]
DrugAssistは、人間と機械の対話を通じて最適化を行う対話型分子最適化モデルである。
DrugAssistは、単一および複数プロパティの最適化において、主要な結果を得た。
分子最適化タスクの微調整言語モデルのための,MomoOpt-Instructionsと呼ばれる大規模命令ベースデータセットを公開している。
論文 参考訳(メタデータ) (2023-12-28T10:46:56Z) - Optimizing Molecules using Efficient Queries from Property Evaluations [66.66290256377376]
汎用的なクエリベースの分子最適化フレームワークであるQMOを提案する。
QMOは効率的なクエリに基づいて入力分子の所望の特性を改善する。
QMOは, 有機分子を最適化するベンチマークタスクにおいて, 既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-03T18:51:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。