論文の概要: Pretrained Joint Predictions for Scalable Batch Bayesian Optimization of Molecular Designs
- arxiv url: http://arxiv.org/abs/2511.10590v2
- Date: Fri, 14 Nov 2025 15:52:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-17 14:38:02.362359
- Title: Pretrained Joint Predictions for Scalable Batch Bayesian Optimization of Molecular Designs
- Title(参考訳): 分子設計のスケーラブルバッチベイズ最適化のための事前制約付き結合予測
- Authors: Miles Wang-Henderson, Benjamin Kaufman, Edward Williams, Ryan Pederson, Matteo Rossi, Owen Howell, Carl Underkoffler, Narbe Mardirossian, John Parkhill,
- Abstract要約: バッチベイズ最適化における結合親和性のスケーラブルな確率的サロゲートを得る方法を示す。
これにより、設計間のヘッジと、それらを近似するために共同予測密度から素早くサンプリングする能力の並列取得関数が要求される。
この研究の鍵となるのは、ENNにおける先行ネットワークの重要性と、下流のパフォーマンスを改善するために合成データでそれらを事前訓練する方法の調査である。
- 参考スコア(独自算出の注目度): 1.3505106522886807
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Batched synthesis and testing of molecular designs is the key bottleneck of drug development. There has been great interest in leveraging biomolecular foundation models as surrogates to accelerate this process. In this work, we show how to obtain scalable probabilistic surrogates of binding affinity for use in Batch Bayesian Optimization (Batch BO). This demands parallel acquisition functions that hedge between designs and the ability to rapidly sample from a joint predictive density to approximate them. Through the framework of Epistemic Neural Networks (ENNs), we obtain scalable joint predictive distributions of binding affinity on top of representations taken from large structure-informed models. Key to this work is an investigation into the importance of prior networks in ENNs and how to pretrain them on synthetic data to improve downstream performance in Batch BO. Their utility is demonstrated by rediscovering known potent EGFR inhibitors on a semi-synthetic benchmark in up to 5x fewer iterations, as well as potent inhibitors from a real-world small-molecule library in up to 10x fewer iterations, offering a promising solution for large-scale drug discovery applications.
- Abstract(参考訳): 分子設計のバッチ合成と試験が医薬品開発の重要なボトルネックである。
生体分子基盤モデルをサロゲートとして利用してこのプロセスを加速することに大きな関心が寄せられている。
本研究では,Batch Bayesian Optimization (Batch BO) において,結合親和性のスケーラブルな確率的サロゲートを得る方法について述べる。
これにより、設計間のヘッジと、それらを近似するために共同予測密度から素早くサンプリングする能力の並列取得関数が要求される。
エピステミックニューラルネットワーク(ENN)の枠組みを用いて,大規模構造インフォームドモデルから得られた表現の上に結合親和性のスケーラブルな結合予測分布を求める。
この研究の鍵となるのは、ENNにおける先行ネットワークの重要性と、Batch BOの下流性能を改善するために合成データでそれらを事前訓練する方法である。
彼らの実用性は、既知の強力なEGFR阻害剤を、半合成のベンチマークで最大5倍の繰り返しで再発見し、また、現実世界の小さな分子ライブラリの強力な阻害剤を最大10倍の繰り返しで検出し、大規模な薬物発見アプリケーションに有望な解決策を提供する。
関連論文リスト
- Reimagining Target-Aware Molecular Generation through Retrieval-Enhanced Aligned Diffusion [22.204642926984526]
Retrieval-Augmented GenerationとSE(3)-同変拡散モデルとを融合した最初のREADが導入された。
CBGBenchでは非常に競争力があり、最先端のジェネレーティブモデルやネイティブな足場を超越している。
論文 参考訳(メタデータ) (2025-06-17T13:09:11Z) - Aligning Target-Aware Molecule Diffusion Models with Exact Energy Optimization [147.7899503829411]
AliDiffは、事前訓練されたターゲット拡散モデルと望ましい機能特性を整合させる新しいフレームワークである。
最先端の結合エネルギーを持つ分子を最大7.07 Avg. Vina Scoreで生成することができる。
論文 参考訳(メタデータ) (2024-07-01T06:10:29Z) - YZS-model: A Predictive Model for Organic Drug Solubility Based on Graph Convolutional Networks and Transformer-Attention [9.018408514318631]
伝統的な手法は複雑な分子構造を見逃し、不正確な結果をもたらすことが多い。
本稿では,グラフ畳み込みネットワーク(GCN),トランスフォーマーアーキテクチャ,Long Short-Term Memory(LSTM)ネットワークを統合するディープラーニングフレームワークであるYZS-Modelを紹介する。
YZS-Modelは、R2$ 0.59、RMSE$ 0.57を達成し、ベンチマークモデルを上回った。
論文 参考訳(メタデータ) (2024-06-27T12:40:29Z) - Learning Energy-Based Models by Cooperative Diffusion Recovery Likelihood [64.95663299945171]
高次元データに基づくエネルギーベースモデル(EBM)の訓練は、困難かつ時間を要する可能性がある。
EBMと、GANや拡散モデルのような他の生成フレームワークとの間には、サンプル品質に顕著なギャップがある。
本研究では,協調拡散回復可能性 (CDRL) を提案する。
論文 参考訳(メタデータ) (2023-09-10T22:05:24Z) - Protein Design with Guided Discrete Diffusion [67.06148688398677]
タンパク質設計における一般的なアプローチは、生成モデルと条件付きサンプリングのための識別モデルを組み合わせることである。
離散拡散モデルのためのガイダンス手法であるdiffusioN Optimized Smpling (NOS)を提案する。
NOSは、構造に基づく手法の重要な制限を回避し、シーケンス空間で直接設計を行うことができる。
論文 参考訳(メタデータ) (2023-05-31T16:31:24Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - Deep Learning for Virtual Screening: Five Reasons to Use ROC Cost
Functions [80.12620331438052]
深層学習は サイリコの何十億もの分子を 迅速にスクリーニングする 重要なツールとなりました
その重要性にもかかわらず、厳密なクラス不均衡、高い決定しきい値、いくつかのデータセットにおける基底真理ラベルの欠如など、これらのモデルのトレーニングにおいて重大な課題が続いている。
このような場合、クラス不均衡に対するロバスト性から、レシーバ動作特性(ROC)を直接最適化することを好んで論じる。
論文 参考訳(メタデータ) (2020-06-25T08:46:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。