論文の概要: Evaluating the Progression of Large Language Model Capabilities for Small-Molecule Drug Design
- arxiv url: http://arxiv.org/abs/2604.16279v1
- Date: Fri, 17 Apr 2026 17:40:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-20 22:00:20.03405
- Title: Evaluating the Progression of Large Language Model Capabilities for Small-Molecule Drug Design
- Title(参考訳): 小分子医薬品設計のための大規模言語モデル機能の進展評価
- Authors: Shriram Chennakesavalu, Kirill Shmilovich, Hayley Weir, Colin Grambow, John Bradshaw, Patricia Suriana, Chen Cheng, Kangway Chuang,
- Abstract要約: 分子特性予測, 分子表現変換, 分子設計を対象とする, 化学的に座屈した一連のタスクについて紹介する。
我々はこれらのタスクを強化学習環境として定式化し、評価とポストトレーニングの統一的なアプローチを可能にする。
私たちの環境でポストトレーニングされた小さなモデルは、かなり弱いベースモデルにもかかわらず、最先端のフロンティアモデルと競合する。
- 参考スコア(独自算出の注目度): 5.312232639944646
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models (LLMs) have the potential to accelerate small molecule drug design due to their ability to reason about information from diverse sources and formats. However, their practical utility remains unclear due to the lack of benchmarks that reflect real-world scenarios. In this work, we introduce a suite of chemically-grounded tasks spanning molecular property prediction, molecular representation transformations, and molecular design. Importantly, we formulate these tasks as reinforcement learning (RL) environments, enabling a unified approach for evaluation and post-training. Across three model families, we find that frontier models are increasingly proficient at chemical tasks, but that there is significant room for improvement, especially in experimental settings with low data. Critically, we show that RL-based post-training can substantially improve performance. A smaller model post-trained on our environments becomes competitive with state-of-the-art frontier models, despite a significantly weaker base model. This suggests a practical route toward employing LLMs in drug discovery; by combining carefully-designed evaluation tasks with targeted post-training, we can both elucidate and close critical capability gaps.
- Abstract(参考訳): LLM(Large Language Models)は、様々なソースやフォーマットから情報を引き出す能力によって、小さな分子の薬物設計を加速する可能性がある。
しかし、実際のシナリオを反映したベンチマークが欠如しているため、実用性はまだ不明である。
本稿では, 分子特性予測, 分子表現変換, 分子設計にまたがる, 化学的に座屈した一連のタスクを紹介する。
重要なことは、これらのタスクを強化学習(RL)環境として定式化し、評価とポストトレーニングのための統一的なアプローチを可能にすることである。
3つのモデルファミリー全体では、フロンティアモデルが化学処理に長けていることが分かるが、特に低データの実験環境では、改善の余地は大きい。
批判的に、RLベースのポストトレーニングは性能を大幅に向上させることができる。
私たちの環境でポストトレーニングされた小さなモデルは、かなり弱いベースモデルにもかかわらず、最先端のフロンティアモデルと競合する。
本研究は, 薬物発見におけるLSMの活用に向けた実践的な道筋を示唆するものであり, 慎重に設計された評価タスクと目標とするポストトレーニングを組み合わせることで, 限界能力ギャップの解明と近接化を両立させることができる。
関連論文リスト
- MolRGen: A Training and Evaluation Setting for De Novo Molecular Generation with Reasonning Models [48.34354151490484]
我々は、推論に基づく大規模言語モデルのトレーニングと評価のためのベンチマークとデータセットであるMorRGenを紹介する。
まず,textitde novo分子生成と特性予測のためのモデルの評価と訓練を行う。
第2に、生成分子の品質と多様性の両方をキャプチャする、多様性を意識した新しいトップ・ドルスコアを導入する。
論文 参考訳(メタデータ) (2026-03-18T20:21:04Z) - MMAI Gym for Science: Training Liquid Foundation Models for Drug Discovery [41.21168385964764]
MMAI Gymは、タスク固有の推論、トレーニング、ベンチマークのレシピと同様に、ワンストップの分子データフォーマットとモダリティである。
MMAI Gymを用いて、これらの用途に効率的な液体基礎モデル(LFM)を訓練し、より小さな目的に訓練された基礎モデルは、分子ベンチマークにおいてより大規模な汎用モデルや専門モデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2026-03-03T20:51:51Z) - Agentic reinforcement learning empowers next-generation chemical language models for molecular design and synthesis [51.83339196548892]
ChemCraftは、知識ストレージから化学推論を分離する新しいフレームワークである。
ChemCraftは最小の推論コストで優れたパフォーマンスを実現する。
この研究は、AI支援化学のコスト効率とプライバシ保護のパラダイムを確立する。
論文 参考訳(メタデータ) (2026-01-25T04:23:34Z) - NovoMolGen: Rethinking Molecular Language Model Pretraining [14.403924658046806]
我々は、デノボ分子生成のための15億分子を事前訓練したトランスフォーマーベースの基礎モデルであるNovoMolGenを紹介する。
実験的な分析により,事前学習中の測定値と実際の下流のパフォーマンスとの間には弱い相関関係が認められた。
NovoMolGenは、新しい最先端の結果を確立し、制約のない分子生成タスクとゴール指向の分子生成タスクの両方において、Moll-LLMや特殊生成モデルよりも大幅に優れている。
論文 参考訳(メタデータ) (2025-08-19T00:04:48Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - Deep Learning for Virtual Screening: Five Reasons to Use ROC Cost
Functions [80.12620331438052]
深層学習は サイリコの何十億もの分子を 迅速にスクリーニングする 重要なツールとなりました
その重要性にもかかわらず、厳密なクラス不均衡、高い決定しきい値、いくつかのデータセットにおける基底真理ラベルの欠如など、これらのモデルのトレーニングにおいて重大な課題が続いている。
このような場合、クラス不均衡に対するロバスト性から、レシーバ動作特性(ROC)を直接最適化することを好んで論じる。
論文 参考訳(メタデータ) (2020-06-25T08:46:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。