論文の概要: Generative Multi-Objective Bayesian Optimization with Scalable Batch Evaluations for Sample-Efficient De Novo Molecular Design
- arxiv url: http://arxiv.org/abs/2512.17659v1
- Date: Fri, 19 Dec 2025 14:59:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-22 19:25:54.447745
- Title: Generative Multi-Objective Bayesian Optimization with Scalable Batch Evaluations for Sample-Efficient De Novo Molecular Design
- Title(参考訳): サンプル効率の良いデノボ分子設計のためのスケーラブルバッチ評価を用いた多目的ベイズ最適化
- Authors: Madhav R. Muthyala, Farshud Sorourifar, Tianhong Tan, You Peng, Joel A. Paulson,
- Abstract要約: この研究は、デ・ノボ分子設計/発見のための代替的なモジュラーな「世代最適化」フレームワークを導入する。
我々は、最先端の潜在空間と離散的な分子最適化法に対して、このフレームワークをベンチマークする。
具体的には、持続的なエネルギー貯蔵に関するケーススタディにおいて、我々のアプローチは、新規で多種多様で高性能な有機(キノン系)陰極材料を迅速に発見することを示した。
- 参考スコア(独自算出の注目度): 1.8517039579627974
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Designing molecules that must satisfy multiple, often conflicting objectives is a central challenge in molecular discovery. The enormous size of chemical space and the cost of high-fidelity simulations have driven the development of machine learning-guided strategies for accelerating design with limited data. Among these, Bayesian optimization (BO) offers a principled framework for sample-efficient search, while generative models provide a mechanism to propose novel, diverse candidates beyond fixed libraries. However, existing methods that couple the two often rely on continuous latent spaces, which introduces both architectural entanglement and scalability challenges. This work introduces an alternative, modular "generate-then-optimize" framework for de novo multi-objective molecular design/discovery. At each iteration, a generative model is used to construct a large, diverse pool of candidate molecules, after which a novel acquisition function, qPMHI (multi-point Probability of Maximum Hypervolume Improvement), is used to optimally select a batch of candidates most likely to induce the largest Pareto front expansion. The key insight is that qPMHI decomposes additively, enabling exact, scalable batch selection via only simple ranking of probabilities that can be easily estimated with Monte Carlo sampling. We benchmark the framework against state-of-the-art latent-space and discrete molecular optimization methods, demonstrating significant improvements across synthetic benchmarks and application-driven tasks. Specifically, in a case study related to sustainable energy storage, we show that our approach quickly uncovers novel, diverse, and high-performing organic (quinone-based) cathode materials for aqueous redox flow battery applications.
- Abstract(参考訳): 複数の、しばしば矛盾する目的を満たさなければならない分子を設計することは、分子発見における中心的な課題である。
化学空間の巨大化と高忠実度シミュレーションのコストにより、限られたデータで設計を加速するための機械学習誘導戦略の開発が進められている。
これらのうち、ベイズ最適化(BO)は、サンプル効率の高い探索のための原則化されたフレームワークを提供し、生成モデルは、固定ライブラリを超えて、新しい多様な候補を提案するメカニズムを提供する。
しかし、この2つを結合する既存のメソッドは、アーキテクチャの絡み合いとスケーラビリティの課題をもたらす、連続的な潜伏空間に依存していることが多い。
この研究は、デ・ノボ多目的分子設計/発見のための代替的なモジュラーな「世代最適化」フレームワークを導入する。
各イテレーションにおいて、生成モデルは、多種多様な候補分子のプールを構築するために使用され、その後、新しい獲得関数であるqPMHI(最大超体積改善の多点確率)を用いて、最も大きなパレート前縁展開を誘導する可能性が最も高い候補のバッチを最適に選択する。
重要な洞察は、qPMHIは加法的に分解し、モンテカルロサンプリングで容易に推定できる確率の単純なランキングだけで、正確にスケーラブルなバッチ選択を可能にすることである。
我々は、最先端の潜在空間および離散分子最適化手法に対してフレームワークをベンチマークし、合成ベンチマークとアプリケーション駆動タスク間で大幅な改善を示す。
具体的には, 持続的エネルギー貯蔵に関するケーススタディにおいて, 新規で多様性があり, 高性能な有機(キノン系)陰極材料を速やかに発見し, 水酸化レドックスフロー電池を応用した。
関連論文リスト
- Reward driven discovery of the optimal microstructure representations with invariant variational autoencoders [0.015295722752489374]
変分オートエンコーダ(VAE)はそのような低次元表現を構築する強力な手段を提供する。
VAEは試行錯誤や経験分析によって最適化されることが多い。
本研究では,潜在空間表現を評価するための報酬ベース戦略について検討した。
論文 参考訳(メタデータ) (2025-09-30T20:15:42Z) - Bayesian Optimization for Molecules Should Be Pareto-Aware [6.877358955271652]
多目的ベイズ最適化(MOBO)は、分子設計におけるトレードオフをナビゲートするための原則的な枠組みを提供する。
我々は、期待改善(EI)を用いた単純な固定重スカラー化ベースラインに対して単純なMOBO戦略をベンチマークする。
以上の結果から, 強い決定論的インスタンス化であっても, 低データ体制下では性能が低下する可能性が示唆された。
論文 参考訳(メタデータ) (2025-07-18T07:12:19Z) - Iterative Distillation for Reward-Guided Fine-Tuning of Diffusion Models in Biomolecular Design [58.8094854658848]
生体分子設計における報酬誘導生成のための微調整拡散モデルの問題に対処する。
本稿では,拡散モデルによる任意の報酬関数の最適化を可能にする,反復蒸留に基づく微調整フレームワークを提案する。
KLの発散最小化と相まって,既存のRL法と比較してトレーニングの安定性とサンプル効率を向上させる。
論文 参考訳(メタデータ) (2025-07-01T05:55:28Z) - Aligning Target-Aware Molecule Diffusion Models with Exact Energy Optimization [147.7899503829411]
AliDiffは、事前訓練されたターゲット拡散モデルと望ましい機能特性を整合させる新しいフレームワークである。
最先端の結合エネルギーを持つ分子を最大7.07 Avg. Vina Scoreで生成することができる。
論文 参考訳(メタデータ) (2024-07-01T06:10:29Z) - Accelerating Black-Box Molecular Property Optimization by Adaptively
Learning Sparse Subspaces [0.0]
提案手法は,様々なベンチマークや実世界の問題において,既存のMPO手法よりも大幅に優れていることを示す。
具体的には,100ドル未満のクエリで100ドル以上の代替品の集合から,ほぼ最適分子を定期的に見つけることができることを示す。
論文 参考訳(メタデータ) (2024-01-02T18:34:29Z) - BOtied: Multi-objective Bayesian optimization with tied multivariate ranks [33.414682601242006]
本稿では,非支配解と結合累積分布関数の極端量子化との自然な関係を示す。
このリンクにより、我々はPareto対応CDFインジケータと関連する取得関数BOtiedを提案する。
種々の合成および実世界の問題に対する実験により,BOtied は最先端MOBO 取得関数より優れていることが示された。
論文 参考訳(メタデータ) (2023-06-01T04:50:06Z) - Sample-efficient Multi-objective Molecular Optimization with GFlowNets [5.030493242666028]
ハイパーネットワークに基づくGFlowNets(HN-GFN)を利用した多目的ベイズ最適化(MOBO)アルゴリズムを提案する。
HN-GFNは、単一の嗜好条件のハイパーネットワークを用いて、目的間の様々なトレードオフを探索することを学ぶ。
実世界の様々な環境での実験により、我々のフレームワークは、候補品質とサンプル効率の点で、既存の手法よりも圧倒的に優れていることが示された。
論文 参考訳(メタデータ) (2023-02-08T13:30:28Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。