論文の概要: Accelerating Black-Box Molecular Property Optimization by Adaptively
Learning Sparse Subspaces
- arxiv url: http://arxiv.org/abs/2401.01398v1
- Date: Tue, 2 Jan 2024 18:34:29 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-04 15:59:02.607451
- Title: Accelerating Black-Box Molecular Property Optimization by Adaptively
Learning Sparse Subspaces
- Title(参考訳): スパース部分空間の適応学習によるブラックボックス分子特性最適化の高速化
- Authors: Farshud Sorourifar, Thomas Banker, Joel A. Paulson
- Abstract要約: 提案手法は,様々なベンチマークや実世界の問題において,既存のMPO手法よりも大幅に優れていることを示す。
具体的には,100ドル未満のクエリで100ドル以上の代替品の集合から,ほぼ最適分子を定期的に見つけることができることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Molecular property optimization (MPO) problems are inherently challenging
since they are formulated over discrete, unstructured spaces and the labeling
process involves expensive simulations or experiments, which fundamentally
limits the amount of available data. Bayesian optimization (BO) is a powerful
and popular framework for efficient optimization of noisy, black-box objective
functions (e.g., measured property values), thus is a potentially attractive
framework for MPO. To apply BO to MPO problems, one must select a structured
molecular representation that enables construction of a probabilistic surrogate
model. Many molecular representations have been developed, however, they are
all high-dimensional, which introduces important challenges in the BO process
-- mainly because the curse of dimensionality makes it difficult to define and
perform inference over a suitable class of surrogate models. This challenge has
been recently addressed by learning a lower-dimensional encoding of a SMILE or
graph representation of a molecule in an unsupervised manner and then
performing BO in the encoded space. In this work, we show that such methods
have a tendency to "get stuck," which we hypothesize occurs since the mapping
from the encoded space to property values is not necessarily well-modeled by a
Gaussian process. We argue for an alternative approach that combines numerical
molecular descriptors with a sparse axis-aligned Gaussian process model, which
is capable of rapidly identifying sparse subspaces that are most relevant to
modeling the unknown property function. We demonstrate that our proposed method
substantially outperforms existing MPO methods on a variety of benchmark and
real-world problems. Specifically, we show that our method can routinely find
near-optimal molecules out of a set of more than $>100$k alternatives within
100 or fewer expensive queries.
- Abstract(参考訳): 分子特性最適化(mpo)の問題は、離散的で非構造的な空間上で定式化され、ラベル付けプロセスには費用のかかるシミュレーションや実験が伴うため、本質的に困難である。
ベイズ最適化(bayesian optimization, bo)は、ノイズの多いブラックボックス目的関数(例えば、測定されたプロパティ値)の効率的な最適化のための強力なフレームワークであり、mpoにとって魅力的なフレームワークである。
BOをMPO問題に適用するには、確率的代理モデルの構築を可能にする構造的分子表現を選択する必要がある。
しかし、多くの分子表現が開発されているが、それらはすべて高次元であり、BO過程において重要な課題をもたらす。
この課題は近年、分子の笑顔やグラフ表現の低次元エンコーディングを教師なしで学習し、エンコードされた空間でboを実行することで解決されている。
本研究では,そのような手法が「行き詰まる」傾向があることを示し,符号化空間からプロパティ値への写像がガウス過程によって必ずしもうまくモデル化されるとは限らないことを仮定する。
我々は、数値的分子記述子と、未知の性質関数のモデル化に最も関係のあるスパース部分空間を迅速に識別できるスパース軸整合ガウス過程モデルを組み合わせた別のアプローチを議論する。
提案手法は,様々なベンチマークや実世界の問題において,既存のMPO法よりも大幅に優れていることを示す。
具体的には,100ドル未満のクエリで100ドル以上の代替品の集合から,ほぼ最適分子を定期的に見つけることができることを示す。
関連論文リスト
- Text-Guided Multi-Property Molecular Optimization with a Diffusion Language Model [77.50732023411811]
変換器を用いた拡散言語モデル(TransDLM)を用いたテキスト誘導多目的分子最適化手法を提案する。
TransDLMは標準化された化学命名法を分子の意味表現として利用し、プロパティ要求をテキスト記述に暗黙的に埋め込む。
提案手法は, 分子構造類似性を最適化し, ベンチマークデータセットの化学的特性を向上するための最先端手法を超越した手法である。
論文 参考訳(メタデータ) (2024-10-17T14:30:27Z) - MING: A Functional Approach to Learning Molecular Generative Models [46.189683355768736]
本稿では,関数表現に基づく分子生成モデル学習のための新しいパラダイムを提案する。
本稿では,関数空間における分子分布を学習する拡散モデルである分子インプリシットニューラルジェネレーション(MING)を提案する。
論文 参考訳(メタデータ) (2024-10-16T13:02:02Z) - Derivative-Free Guidance in Continuous and Discrete Diffusion Models with Soft Value-Based Decoding [84.3224556294803]
拡散モデルは、画像、分子、DNA、RNA、タンパク質配列の自然なデザイン空間を捉えるのに優れている。
これらの設計空間の自然性を保ちながら、下流の報酬関数を最適化することを目指している。
提案アルゴリズムは,中間雑音状態が将来高い報酬をもたらすことの先駆けとして,ソフトバリュー関数を統合する。
論文 参考訳(メタデータ) (2024-08-15T16:47:59Z) - Sensitivity analysis using the Metamodel of Optimal Prognosis [0.0]
仮想プロトタイピングプロセス内の実例では、物理モデルの複雑さを減らすことは必ずしも不可能である。
本稿では,実際の問題に対して最適なメタモデルを選択するための自動アプローチを提案する。
論文 参考訳(メタデータ) (2024-08-07T07:09:06Z) - Score-based Diffusion Models in Function Space [140.792362459734]
拡散モデルは、最近、生成モデリングの強力なフレームワークとして登場した。
本稿では,関数空間における拡散モデルをトレーニングするためのDDO(Denoising Diffusion Operators)という,数学的に厳密なフレームワークを提案する。
データ解像度に依存しない固定コストで、対応する離散化アルゴリズムが正確なサンプルを生成することを示す。
論文 参考訳(メタデータ) (2023-02-14T23:50:53Z) - Monte Carlo Neural PDE Solver for Learning PDEs via Probabilistic Representation [59.45669299295436]
教師なしニューラルソルバのトレーニングのためのモンテカルロPDEソルバを提案する。
我々は、マクロ現象をランダム粒子のアンサンブルとみなすPDEの確率的表現を用いる。
対流拡散, アレン・カーン, ナヴィエ・ストークス方程式に関する実験により, 精度と効率が著しく向上した。
論文 参考訳(メタデータ) (2023-02-10T08:05:19Z) - Combining Latent Space and Structured Kernels for Bayesian Optimization
over Combinatorial Spaces [27.989924313988016]
我々は、高価なブラックボックス関数評価を用いて、空間(シーケンス、ツリー、グラフなど)を最適化する問題を考察する。
空間に対する最近のBOアプローチは、構造体の潜在表現を学習することで連続空間上のBOへの還元である。
本稿では,この欠点を克服するための原則的アプローチであるLADDERを提案する。
論文 参考訳(メタデータ) (2021-11-01T18:26:22Z) - A data-driven peridynamic continuum model for upscaling molecular
dynamics [3.1196544696082613]
分子動力学データから最適線形ペリダイナミックソリッドモデルを抽出する学習フレームワークを提案する。
我々は,符号変化の影響関数を持つ離散化LPSモデルに対して,十分な適切な正当性条件を提供する。
このフレームワークは、結果のモデルが数学的に適切であり、物理的に一貫したものであり、トレーニング中に使用するものと異なる設定によく当てはまることを保証します。
論文 参考訳(メタデータ) (2021-08-04T07:07:47Z) - Designing Air Flow with Surrogate-assisted Phenotypic Niching [117.44028458220427]
品質多様性アルゴリズムであるサロゲート支援表現型ニッチを導入する。
計算に高価な表現型特徴を用いることで、大規模で多様な行動群を発見することができる。
本研究では,2次元流体力学最適化問題における気流の種類を明らかにする。
論文 参考訳(メタデータ) (2021-05-10T10:45:28Z) - High-Dimensional Bayesian Optimization with Sparse Axis-Aligned
Subspaces [14.03847432040056]
スパース軸整列部分空間上で定義される代理モデルは、柔軟性とパーシモニーの間に魅力的な妥協をもたらすと我々は主張する。
提案手法は,ハミルトニアンモンテカルロを推論に用い,未知の目的関数のモデル化に関連するスパース部分空間を迅速に同定できることを実証する。
論文 参考訳(メタデータ) (2021-02-27T23:06:24Z) - Goal-directed Generation of Discrete Structures with Conditional
Generative Models [85.51463588099556]
本稿では,強化学習目標を直接最適化し,期待される報酬を最大化するための新しいアプローチを提案する。
提案手法は、ユーザ定義プロパティを持つ分子の生成と、所定の目標値を評価する短いピソン表現の同定という2つのタスクで検証する。
論文 参考訳(メタデータ) (2020-10-05T20:03:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。