論文の概要: Accelerating Black-Box Molecular Property Optimization by Adaptively
Learning Sparse Subspaces
- arxiv url: http://arxiv.org/abs/2401.01398v1
- Date: Tue, 2 Jan 2024 18:34:29 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-04 15:59:02.607451
- Title: Accelerating Black-Box Molecular Property Optimization by Adaptively
Learning Sparse Subspaces
- Title(参考訳): スパース部分空間の適応学習によるブラックボックス分子特性最適化の高速化
- Authors: Farshud Sorourifar, Thomas Banker, Joel A. Paulson
- Abstract要約: 提案手法は,様々なベンチマークや実世界の問題において,既存のMPO手法よりも大幅に優れていることを示す。
具体的には,100ドル未満のクエリで100ドル以上の代替品の集合から,ほぼ最適分子を定期的に見つけることができることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Molecular property optimization (MPO) problems are inherently challenging
since they are formulated over discrete, unstructured spaces and the labeling
process involves expensive simulations or experiments, which fundamentally
limits the amount of available data. Bayesian optimization (BO) is a powerful
and popular framework for efficient optimization of noisy, black-box objective
functions (e.g., measured property values), thus is a potentially attractive
framework for MPO. To apply BO to MPO problems, one must select a structured
molecular representation that enables construction of a probabilistic surrogate
model. Many molecular representations have been developed, however, they are
all high-dimensional, which introduces important challenges in the BO process
-- mainly because the curse of dimensionality makes it difficult to define and
perform inference over a suitable class of surrogate models. This challenge has
been recently addressed by learning a lower-dimensional encoding of a SMILE or
graph representation of a molecule in an unsupervised manner and then
performing BO in the encoded space. In this work, we show that such methods
have a tendency to "get stuck," which we hypothesize occurs since the mapping
from the encoded space to property values is not necessarily well-modeled by a
Gaussian process. We argue for an alternative approach that combines numerical
molecular descriptors with a sparse axis-aligned Gaussian process model, which
is capable of rapidly identifying sparse subspaces that are most relevant to
modeling the unknown property function. We demonstrate that our proposed method
substantially outperforms existing MPO methods on a variety of benchmark and
real-world problems. Specifically, we show that our method can routinely find
near-optimal molecules out of a set of more than $>100$k alternatives within
100 or fewer expensive queries.
- Abstract(参考訳): 分子特性最適化(mpo)の問題は、離散的で非構造的な空間上で定式化され、ラベル付けプロセスには費用のかかるシミュレーションや実験が伴うため、本質的に困難である。
ベイズ最適化(bayesian optimization, bo)は、ノイズの多いブラックボックス目的関数(例えば、測定されたプロパティ値)の効率的な最適化のための強力なフレームワークであり、mpoにとって魅力的なフレームワークである。
BOをMPO問題に適用するには、確率的代理モデルの構築を可能にする構造的分子表現を選択する必要がある。
しかし、多くの分子表現が開発されているが、それらはすべて高次元であり、BO過程において重要な課題をもたらす。
この課題は近年、分子の笑顔やグラフ表現の低次元エンコーディングを教師なしで学習し、エンコードされた空間でboを実行することで解決されている。
本研究では,そのような手法が「行き詰まる」傾向があることを示し,符号化空間からプロパティ値への写像がガウス過程によって必ずしもうまくモデル化されるとは限らないことを仮定する。
我々は、数値的分子記述子と、未知の性質関数のモデル化に最も関係のあるスパース部分空間を迅速に識別できるスパース軸整合ガウス過程モデルを組み合わせた別のアプローチを議論する。
提案手法は,様々なベンチマークや実世界の問題において,既存のMPO法よりも大幅に優れていることを示す。
具体的には,100ドル未満のクエリで100ドル以上の代替品の集合から,ほぼ最適分子を定期的に見つけることができることを示す。
関連論文リスト
- Score-based Diffusion Models in Function Space [140.792362459734]
拡散モデルは、最近、生成モデリングの強力なフレームワークとして登場した。
本稿では,関数空間における拡散モデルをトレーニングするためのDDO(Denoising Diffusion Operators)という,数学的に厳密なフレームワークを提案する。
データ解像度に依存しない固定コストで、対応する離散化アルゴリズムが正確なサンプルを生成することを示す。
論文 参考訳(メタデータ) (2023-02-14T23:50:53Z) - Monte Carlo Neural PDE Solver for Learning PDEs via Probabilistic
Representation [62.017505017414564]
教師なしの方法でニューラルソルバを訓練することが不可欠である。
既存の手法は妥当な精度を達成し、重要な計算課題と不正確なシミュレーションをもたらす。
PDEの確率的表現を用いて教師なしニューラルソルバを訓練するためのモンテカルロPDEソルバを提案する。
対流拡散, アレン・カーン, ナヴィエ・ストークス方程式に関する実験により, 精度と効率が著しく向上した。
論文 参考訳(メタデータ) (2023-02-10T08:05:19Z) - An Empirical Evaluation of Zeroth-Order Optimization Methods on
AI-driven Molecule Optimization [78.36413169647408]
分子目的を最適化するための様々なZO最適化手法の有効性について検討する。
ZO符号に基づく勾配降下(ZO-signGD)の利点を示す。
本稿では,Guurcamol スイートから広く使用されているベンチマークタスクに対して,ZO 最適化手法の有効性を示す。
論文 参考訳(メタデータ) (2022-10-27T01:58:10Z) - Improving Small Molecule Generation using Mutual Information Machine [0.0]
MolMIMは、小さな分子の薬物発見のための確率論的オートエンコーダである。
有効性, 特異性, 新規性の観点から, MolMIM の優れた世代を実証した。
次に,CMA-ES, ナイーブなブラックボックスと勾配自由探索アルゴリズムを, プロパティ誘導分子最適化のタスクとして, MolMIM の潜在空間上で利用する。
論文 参考訳(メタデータ) (2022-08-18T18:32:48Z) - Combining Latent Space and Structured Kernels for Bayesian Optimization
over Combinatorial Spaces [27.989924313988016]
我々は、高価なブラックボックス関数評価を用いて、空間(シーケンス、ツリー、グラフなど)を最適化する問題を考察する。
空間に対する最近のBOアプローチは、構造体の潜在表現を学習することで連続空間上のBOへの還元である。
本稿では,この欠点を克服するための原則的アプローチであるLADDERを提案する。
論文 参考訳(メタデータ) (2021-11-01T18:26:22Z) - A data-driven peridynamic continuum model for upscaling molecular
dynamics [3.1196544696082613]
分子動力学データから最適線形ペリダイナミックソリッドモデルを抽出する学習フレームワークを提案する。
我々は,符号変化の影響関数を持つ離散化LPSモデルに対して,十分な適切な正当性条件を提供する。
このフレームワークは、結果のモデルが数学的に適切であり、物理的に一貫したものであり、トレーニング中に使用するものと異なる設定によく当てはまることを保証します。
論文 参考訳(メタデータ) (2021-08-04T07:07:47Z) - Conservative Objective Models for Effective Offline Model-Based
Optimization [78.19085445065845]
計算設計の問題は、合成生物学からコンピュータアーキテクチャまで、様々な場面で発生している。
本研究では,分布外入力に対する接地的目標の実際の値を低くする目的関数のモデルを学習する手法を提案する。
COMは、様々なMBO問題に対して、既存のメソッドの実装と性能の面では単純である。
論文 参考訳(メタデータ) (2021-07-14T17:55:28Z) - Designing Air Flow with Surrogate-assisted Phenotypic Niching [117.44028458220427]
品質多様性アルゴリズムであるサロゲート支援表現型ニッチを導入する。
計算に高価な表現型特徴を用いることで、大規模で多様な行動群を発見することができる。
本研究では,2次元流体力学最適化問題における気流の種類を明らかにする。
論文 参考訳(メタデータ) (2021-05-10T10:45:28Z) - High-Dimensional Bayesian Optimization with Sparse Axis-Aligned
Subspaces [14.03847432040056]
スパース軸整列部分空間上で定義される代理モデルは、柔軟性とパーシモニーの間に魅力的な妥協をもたらすと我々は主張する。
提案手法は,ハミルトニアンモンテカルロを推論に用い,未知の目的関数のモデル化に関連するスパース部分空間を迅速に同定できることを実証する。
論文 参考訳(メタデータ) (2021-02-27T23:06:24Z) - Continuous surrogate-based optimization algorithms are well-suited for
expensive discrete problems [9.655888042539495]
本研究では, 連続代理モデルを用いることで, 最先端の離散代理モデルと競合する性能を示す実証的証拠を示す。
異なる離散構造と時間的制約に関する我々の実験は、どのアルゴリズムがどの種類の問題でうまく機能するかについての洞察を与える。
論文 参考訳(メタデータ) (2020-11-06T15:27:45Z) - Goal-directed Generation of Discrete Structures with Conditional
Generative Models [85.51463588099556]
本稿では,強化学習目標を直接最適化し,期待される報酬を最大化するための新しいアプローチを提案する。
提案手法は、ユーザ定義プロパティを持つ分子の生成と、所定の目標値を評価する短いピソン表現の同定という2つのタスクで検証する。
論文 参考訳(メタデータ) (2020-10-05T20:03:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。