論文の概要: NEBULA: Neural Empirical Bayes Under Latent Representations for Efficient and Controllable Design of Molecular Libraries
- arxiv url: http://arxiv.org/abs/2407.03428v1
- Date: Wed, 3 Jul 2024 18:10:43 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-08 20:10:41.353744
- Title: NEBULA: Neural Empirical Bayes Under Latent Representations for Efficient and Controllable Design of Molecular Libraries
- Title(参考訳): NEBULA:分子ライブラリーの効率的かつ制御可能な設計のための潜在表現下での神経経験的ベイズ
- Authors: Ewa M. Nowara, Pedro O. Pinheiro, Sai Pooja Mahajan, Omar Mahmood, Andrew Martin Watkins, Saeed Saremi, Michael Maser,
- Abstract要約: NEBULAはシード化合物を中心とした大規模分子ライブラリーをスケーラブルに生成するための,最初の潜伏3次元生成モデルである。
NEBULAは、サンプルの品質を犠牲にすることなく、既存の方法よりもほぼ1桁早く大きな分子ライブラリを生成する。
ここでのアプローチは、機械学習ベースの薬物発見に極めて有効になることを期待しています。
- 参考スコア(独自算出の注目度): 5.350316354464512
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We present NEBULA, the first latent 3D generative model for scalable generation of large molecular libraries around a seed compound of interest. Such libraries are crucial for scientific discovery, but it remains challenging to generate large numbers of high quality samples efficiently. 3D-voxel-based methods have recently shown great promise for generating high quality samples de novo from random noise (Pinheiro et al., 2023). However, sampling in 3D-voxel space is computationally expensive and use in library generation is prohibitively slow. Here, we instead perform neural empirical Bayes sampling (Saremi & Hyvarinen, 2019) in the learned latent space of a vector-quantized variational autoencoder. NEBULA generates large molecular libraries nearly an order of magnitude faster than existing methods without sacrificing sample quality. Moreover, NEBULA generalizes better to unseen drug-like molecules, as demonstrated on two public datasets and multiple recently released drugs. We expect the approach herein to be highly enabling for machine learning-based drug discovery. The code is available at https://github.com/prescient-design/nebula
- Abstract(参考訳): NEBULAはシード化合物を中心とした大規模分子ライブラリーをスケーラブルに生成するための,最初の潜伏3次元生成モデルである。
このようなライブラリーは科学的な発見には不可欠であるが、大量の高品質のサンプルを効率的に生成することは依然として困難である。
3D-voxel-based method has shown great quality sample de novo from random noise (Pinheiro et al , 2023)。
しかし, 3D-voxel空間でのサンプリングは計算コストが高く, ライブラリ生成における利用は極めて遅い。
ここでは、ベクトル量子化された変分オートエンコーダの学習潜在空間において、ニューラルネットワークによるベイズサンプリング(Saremi & Hyvarinen, 2019)を行う。
NEBULAは、サンプルの品質を犠牲にすることなく、既存の方法よりもほぼ1桁早く大きな分子ライブラリを生成する。
さらに、NEBULAは2つの公開データセットと最近リリースされた複数の薬物で示されるように、目に見えない薬物のような分子を一般化する。
ここでのアプローチは、機械学習ベースの薬物発見に極めて有効になることを期待しています。
コードはhttps://github.com/prescient-design/nebulaで公開されている。
関連論文リスト
- RGFN: Synthesizable Molecular Generation Using GFlowNets [51.33672611338754]
本稿では,化学反応の空間内で直接動作するGFlowNetフレームワークの拡張であるReaction-GFlowNetを提案する。
RGFNは、生成した候補の同等の品質を維持しながら、アウト・オブ・ボックスの合成を可能にする。
提案手法の有効性を,事前訓練されたプロキシモデルやGPUアクセラレーションドッキングなど,さまざまなオラクルモデルに適用した。
論文 参考訳(メタデータ) (2024-06-01T13:11:11Z) - Structure-based drug design by denoising voxel grids [5.9535699822923]
タンパク質構造を条件とした新しい3次元分子のスコアベース生成モデルであるVoxBindを提案する。
我々のアプローチは分子を3次元原子密度格子として表現し、学習と生成に3次元ボクセル除去ネットワークを活用する。
論文 参考訳(メタデータ) (2024-05-07T02:48:15Z) - 3D molecule generation by denoising voxel grids [5.50581548670289]
正規格子上に原子密度を表す3次元分子を生成するための新しいスコアベース手法を提案する。
我々は、雑音分子のスムーズな分布から実際の分子の分布への写像を学習する認知ニューラルネットワークを訓練する。
我々の実験では、VoxMolは、薬品のような分子の分布を、技術の状態よりもよく捉えつつ、サンプルを生成するのが速いことが示されている。
論文 参考訳(メタデータ) (2023-06-13T00:38:51Z) - Semi-supervised 3D Object Detection with Proficient Teachers [114.54835359657707]
自律運転のシナリオにおけるクラウドベースの3Dオブジェクト検出器の優位性は、大量の正確なラベル付きサンプルに大きく依存している。
Pseudo-Labeling法はSSLフレームワークで一般的に使用されているが、教師モデルの低品質な予測は、その性能を著しく制限している。
そこで本研究では,教師モデルをさらに高度化することで,半教師付き3次元物体検出のためのPseudo-Labelingフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-26T04:54:03Z) - Exploring Chemical Space with Score-based Out-of-distribution Generation [57.15855198512551]
生成微分方程式(SDE)にアウト・オブ・ディストリビューション制御を組み込んだスコアベース拡散方式を提案する。
いくつかの新しい分子は現実世界の薬物の基本的な要件を満たしていないため、MOODは特性予測器からの勾配を利用して条件付き生成を行う。
我々はMOODがトレーニング分布を超えて化学空間を探索できることを実験的に検証し、既存の方法で見いだされた分子、そして元のトレーニングプールの上位0.01%までも生成できることを実証した。
論文 参考訳(メタデータ) (2022-06-06T06:17:11Z) - NeuSample: Neural Sample Field for Efficient View Synthesis [129.10351459066501]
本稿では,ニューラルサンプル場を命名する軽量モジュールを提案する。
提案したサンプルフィールドは、線をサンプル分布にマッピングし、点座標に変換し、ボリュームレンダリングのために放射場に供給することができる。
我々はNeuSampleが高速な推論速度を保ちながら、NeRFよりも優れたレンダリング品質を実現することを示す。
論文 参考訳(メタデータ) (2021-11-30T16:43:49Z) - Fully Spiking Variational Autoencoder [66.58310094608002]
スパイキングニューラルネットワーク(SNN)は、超高速で超低エネルギー消費のニューロモルフィックデバイス上で動作することができる。
本研究では,SNNを用いた可変オートエンコーダ(VAE)を構築し,画像生成を実現する。
論文 参考訳(メタデータ) (2021-09-26T06:10:14Z) - MoleHD: Ultra-Low-Cost Drug Discovery using Hyperdimensional Computing [2.7462881838152913]
分子特性予測のための脳誘発超次元計算(HDC)に基づくMoleHDを提案する。
MoleHDは、ランダムスプリットとスキャフォールドスプリットで、平均3つのデータセットでROC-AUCスコアを達成している。
私たちの知る限りでは、この方法が初めてHDCベースの薬物発見法である。
論文 参考訳(メタデータ) (2021-06-05T13:33:21Z) - Generate Novel Molecules With Target Properties Using Conditional
Generative Models [0.0]
トレーニングセット内の分子と同様の小さな分子を生成する新しいニューラルネットワークを提案する。
我々のネットワークは,分子量,ログP,薬物類似度の定量的評価を指標として,従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-09-15T18:59:26Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。