論文の概要: Do Larger Models Really Win in Drug Discovery? A Benchmark Assessment of Model Scaling in AI-Driven Molecular Property and Activity Prediction
- arxiv url: http://arxiv.org/abs/2604.26498v1
- Date: Wed, 29 Apr 2026 10:01:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-30 15:59:36.346864
- Title: Do Larger Models Really Win in Drug Discovery? A Benchmark Assessment of Model Scaling in AI-Driven Molecular Property and Activity Prediction
- Title(参考訳): 大規模モデルは創薬に本当に勝つのか?AI駆動型分子特性のモデルスケーリングと活動予測のベンチマーク評価
- Authors: Jinjiang Guo,
- Abstract要約: 分子特性と活性予測には,コンパクトで特殊なモデルが依然として有効であることを示す。
古典的なML、GNN、事前訓練されたシーケンスモデルのパフォーマンスの違いは、しばしば控えめでエンドポイントに依存している。
その結果, 予測性能は, 分子表現, 誘導バイアス, データ構造, エンドポイント生物学, 検証プロトコルの整合性に依存することが示唆された。
- 参考スコア(独自算出の注目度): 0.152292571922932
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid growth of molecular foundation models and general-purpose large language models has encouraged a scale-centric view of artificial intelligence in drug discovery, in which larger pretrained models are expected to supersede compact cheminformatics models and task-specific graph neural networks (GNNs). We test this assumption on 22 molecular property and activity endpoints, including public ADMET and Tox21 benchmarks and two internal anti-infective activity datasets. Across 167,056 held-out task--molecule evaluations under structure-similarity-separated five-fold cross-validation (37,756 ADMET, 77,946 Tox21, 49,266 anti-TB and 2,088 antimalaria), classical machine-learning (ML) models such as RF(ECFP4) and ExtraTrees(RDKit descriptors) win ten primary-metric tasks, GNNs such as GIN and Ligandformer win nine, and pretrained molecular sequence models such as MoLFormer and ChemBERTa2 win three. Rule-based SAR reasoning baselines, represented by GPT5.5-SAR and Opus4.7-SAR, do not win under the prespecified primary metrics, although train-fold-derived SAR knowledge provides measurable but uneven gains for SAR reasoning and interpretation. These results indicate that compact, specialized models remain highly effective for molecular property and activity prediction. The performance differences among classical ML, GNN and pretrained sequence models are often modest and endpoint-dependent, whereas larger or more general models do not provide a universal predictive advantage. Large models may still add value for zero-shot reasoning, SAR interpretation and hypothesis generation, but the results suggest that predictive performance depends on the alignment among molecular representation, inductive bias, data regime, endpoint biology and validation protocol.
- Abstract(参考訳): 分子基盤モデルと汎用的な大規模言語モデルの急速な成長は、薬物発見における人工知能のスケール中心的な視点を促進し、より大規模な事前学習モデルでは、コンパクトなケミノフォマティクスモデルとタスク固有のグラフニューラルネットワーク(GNN)に取って代わることが期待されている。
この仮定は、ADMETとTox21ベンチマークと2つの内部抗感染活性データセットを含む22の分子特性および活性終端上で検証する。
167,056件のタスク-分子の評価は、構造相似性の5倍のクロスバリデーション(37,756 ADMET, 77,946 Tox21, 49,266 anti-TB, 2,088 antimalaria)、RF(ECFP4)やExtraTrees(RDKit descriptors)のような古典的な機械学習(ML)モデルで10回の一次測定タスクを勝ち取り、GINやLigandformerのようなGNNが9回、MoLFormerやChemBERTa2のような事前訓練された分子シーケンスモデルが3回当選した。
GPT5.5-SARとOpus4.7-SARで表されるルールベースのSAR推論ベースラインは、事前に定義された一次基準の下では勝利しない。
これらの結果は、コンパクトで特殊なモデルが分子特性や活動予測に高い効果を保っていることを示唆している。
古典的なML、GNN、事前訓練されたシーケンスモデルのパフォーマンスの違いは、しばしば適度でエンドポイントに依存している。
大規模モデルは、ゼロショット推論、SAR解釈、仮説生成に価値を加えるかもしれないが、結果は、予測性能が分子表現、帰納バイアス、データ構造、エンドポイント生物学、検証プロトコルの整合性に依存することを示唆している。
関連論文リスト
- Investigating the Impact of Histopathological Foundation Models on Regressive Prediction of Homologous Recombination Deficiency [52.50039435394964]
回帰に基づくタスクの基礎モデルを体系的に評価する。
我々は5つの最先端基礎モデルを用いて、スライド画像全体(WSI)からパッチレベルの特徴を抽出する。
乳房、子宮内膜、肺がんコホートにまたがるこれらの抽出された特徴に基づいて、連続したRDDスコアを予測するモデルが訓練されている。
論文 参考訳(メタデータ) (2026-01-29T14:06:50Z) - Geometric Multi-color Message Passing Graph Neural Networks for Blood-brain Barrier Permeability Prediction [1.488392495573075]
本稿では,幾何学的多色メッセージパッシンググラフニューラルネットワーク(GMC-MPNN)を提案する。
本モデルは,血液脳関門透過性を規定する空間的関係と化学的文脈を捉えるために,原子タイプに基づく重み付きカラーサブグラフを構築した。
論文 参考訳(メタデータ) (2025-07-25T03:38:46Z) - UniGenX: a unified generative foundation model that couples sequence, structure and function to accelerate scientific design across proteins, molecules and materials [62.72989417755985]
自然系における関数の統一生成モデルUniGenXを提案する。
UniGenXはシンボルトークンと数値トークンの混合ストリームとして異種入力を表す。
ドメイン間のファンクション・アウェア・ジェネレーションに対して、最先端または競合的なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-03-09T16:43:07Z) - CogDPM: Diffusion Probabilistic Models via Cognitive Predictive Coding [62.075029712357]
本研究は認知拡散確率モデル(CogDPM)を紹介する。
CogDPMは拡散モデルの階層的サンプリング能力に基づく精度推定法と拡散モデル固有の性質から推定される精度重み付きガイダンスを備える。
我々は,Universal Kindomの降水量と表面風速データセットを用いた実世界の予測タスクにCogDPMを適用した。
論文 参考訳(メタデータ) (2024-05-03T15:54:50Z) - Uni-QSAR: an Auto-ML Tool for Molecular Property Prediction [15.312021665242154]
分子特性予測タスクのための強力なオートMLツールUni-QSARを提案する。
Uni-QSARは、1Dシーケンシャルトークンの分子表現学習(MRL)、2Dトポロジーグラフと3Dコンバータを事前学習モデルと組み合わせて、大規模未ラベルデータからのリッチ表現を活用する。
論文 参考訳(メタデータ) (2023-04-24T16:29:08Z) - Unraveling Key Elements Underlying Molecular Property Prediction: A
Systematic Study [27.56700461408765]
分子特性予測の根底にある重要な要素はほとんど未発見のままである。
我々は,MoreculeNetデータセット上の様々な表現を用いて,代表モデルの広範囲な評価を行う。
合計で62,820モデル、固定表現の50,220モデル、SMILES配列の4,200モデル、分子グラフの8,400モデルを含む訓練を行った。
論文 参考訳(メタデータ) (2022-09-26T14:07:59Z) - On the Generalization and Adaption Performance of Causal Models [99.64022680811281]
異なる因果発見は、データ生成プロセスを一連のモジュールに分解するために提案されている。
このようなモジュラニューラル因果モデルの一般化と適応性能について検討する。
我々の分析では、モジュラーニューラル因果モデルが、低データレギュレーションにおけるゼロおよび少数ショットの適応において、他のモデルよりも優れていることを示している。
論文 参考訳(メタデータ) (2022-06-09T17:12:32Z) - A multi-stage machine learning model on diagnosis of esophageal
manometry [50.591267188664666]
このフレームワークには、飲み込みレベルにおけるディープラーニングモデルと、学習レベルにおける機能ベースの機械学習モデルが含まれている。
これは、生のマルチスワローデータからHRM研究のCC診断を自動的に予測する最初の人工知能モデルである。
論文 参考訳(メタデータ) (2021-06-25T20:09:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。