論文の概要: Saturn: Sample-efficient Generative Molecular Design using Memory Manipulation
- arxiv url: http://arxiv.org/abs/2405.17066v1
- Date: Mon, 27 May 2024 11:37:36 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-28 15:42:27.326079
- Title: Saturn: Sample-efficient Generative Molecular Design using Memory Manipulation
- Title(参考訳): サターン:メモリ・マニピュレーションを用いた高効率生成分子設計
- Authors: Jeff Guo, Philippe Schwaller,
- Abstract要約: 創薬のための分子設計は、最近実験的な検証の波に到達した。
下流の成功の最も重要な要因は、シリコオラクルが所望の端点とよく相関しているかどうかである。
本稿では,Augmented Memoryアルゴリズムを活用し,生成分子設計におけるMambaアーキテクチャの最初の応用例を示す。
- 参考スコア(独自算出の注目度): 0.4037357056611557
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative molecular design for drug discovery has very recently achieved a wave of experimental validation, with language-based backbones being the most common architectures employed. The most important factor for downstream success is whether an in silico oracle is well correlated with the desired end-point. To this end, current methods use cheaper proxy oracles with higher throughput before evaluating the most promising subset with high-fidelity oracles. The ability to directly optimize high-fidelity oracles would greatly enhance generative design and be expected to improve hit rates. However, current models are not efficient enough to consider such a prospect, exemplifying the sample efficiency problem. In this work, we introduce Saturn, which leverages the Augmented Memory algorithm and demonstrates the first application of the Mamba architecture for generative molecular design. We elucidate how experience replay with data augmentation improves sample efficiency and how Mamba synergistically exploits this mechanism. Saturn outperforms 22 models on multi-parameter optimization tasks relevant to drug discovery and may possess sufficient sample efficiency to consider the prospect of directly optimizing high-fidelity oracles.
- Abstract(参考訳): 創薬のための分子設計は、最近、実験的な検証の波に到達し、言語ベースのバックボーンが最もよく使われているアーキテクチャである。
下流の成功の最も重要な要因は、シリコオラクルが所望の端点とよく相関しているかどうかである。
この目的のために、現在の手法では高いスループットでより安価なプロキシオラクルを使用し、高い忠実度で最も有望なサブセットを評価する。
高忠実度オラクルを直接最適化する能力は、生成設計を大幅に強化し、ヒット率を改善することが期待される。
しかし、現在のモデルはそのような見通しを考えるのに十分な効率性を持っておらず、サンプル効率の問題を実証している。
本研究では,Augmented Memoryアルゴリズムを活用し,生成分子設計におけるMambaアーキテクチャの最初の応用例を示す。
データ拡張によるリプレイがサンプル効率を向上し、Mambaがこのメカニズムをシナジスティックに活用する方法を解明する。
サターンは、薬物発見に関連するマルチパラメータ最適化タスクにおいて22のモデルより優れており、高忠実度オークルを直接最適化する可能性を考えるのに十分なサンプル効率を持つ可能性がある。
関連論文リスト
- Spatial Annealing Smoothing for Efficient Few-shot Neural Rendering [106.0057551634008]
我々は,Spatial Annealing smoothing regularized NeRF (SANeRF) という,正確で効率的な数発のニューラルレンダリング手法を導入する。
単に1行のコードを追加することで、SANeRFは現在の数ショットのNeRF法と比較して、より優れたレンダリング品質とはるかに高速な再構築速度を提供する。
論文 参考訳(メタデータ) (2024-06-12T02:48:52Z) - Retrosynthesis prediction enhanced by in-silico reaction data
augmentation [66.5643280109899]
RetroWISEは,実データから推定されるベースモデルを用いて,シリコン内反応の生成と増大を行うフレームワークである。
3つのベンチマークデータセットで、RetroWISEは最先端モデルに対して最高の全体的なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-01-31T07:40:37Z) - Beam Enumeration: Probabilistic Explainability For Sample Efficient
Self-conditioned Molecular Design [0.4769602527256662]
生成分子設計は概念実証から現実の応用へと移行してきた。
説明可能性とサンプル効率の主な課題は、生成設計を強化する機会である。
ビームは一般に言語に基づく分子生成モデルに適用できる。
論文 参考訳(メタデータ) (2023-09-25T08:43:13Z) - E^2VPT: An Effective and Efficient Approach for Visual Prompt Tuning [55.50908600818483]
新しいタスクのための微調整された大規模な事前学習型ビジョンモデルは、パラメーター集約化が進んでいる。
本稿では,大規模なトランスフォーマーモデル適応のための効果的かつ効率的なビジュアルプロンプトチューニング(E2VPT)手法を提案する。
提案手法は2つのベンチマークにおいて,最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2023-07-25T19:03:21Z) - Predicting Side Effect of Drug Molecules using Recurrent Neural Networks [2.089191490381739]
規制団体への提出前に副作用の特定に失敗すると、企業への追加調査に数百万ドルと数ヶ月かかる可能性がある。
従来のアプローチでは、サイドエフェクト予測のための複雑なモデル設計と過剰なパラメータカウントに依存していた。
本稿では,単純なニューラルネットワーク,特にリカレントニューラルネットワークの利用を可能にするアプローチを提案する。
論文 参考訳(メタデータ) (2023-05-17T16:56:19Z) - Augmented Memory: Capitalizing on Experience Replay to Accelerate De
Novo Molecular Design [0.0]
分子生成モデルは、最小限のオラクル評価の下で望ましい目的を満たすことを学ばなければならない。
本稿では,データ拡張と体験再生を組み合わせたAugmented Memoryという新しいアルゴリズムを提案する。
オラクルコールから得られたスコアを再利用してモデルを複数回更新できることを示す。
論文 参考訳(メタデータ) (2023-05-10T14:00:50Z) - IRGen: Generative Modeling for Image Retrieval [82.62022344988993]
本稿では,画像検索を生成モデルの一種として再フレーミングする新しい手法を提案する。
我々は、イメージを意味単位の簡潔なシーケンスに変換するという技術的課題に対処するため、IRGenと呼ばれるモデルを開発した。
本モデルは,広範に使用されている3つの画像検索ベンチマークと200万件のデータセットに対して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-03-17T17:07:36Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - Learning Where To Look -- Generative NAS is Surprisingly Efficient [11.83842808044211]
本稿では,より有望な潜在部分空間からサンプルを生成することを反復的に学習する,代理予測器と組み合わせた生成モデルを提案する。
このアプローチは、クエリ量を低く保ちながら、非常に効率的で効率的なアーキテクチャ検索をもたらす。
論文 参考訳(メタデータ) (2022-03-16T16:27:11Z) - Forward Operator Estimation in Generative Models with Kernel Transfer
Operators [37.999297683250575]
本定式化により,高効率な分布近似とサンプリングが可能となり,驚くほど優れた実験性能が得られることを示す。
また、このアルゴリズムは小さなサンプルサイズ設定(脳画像)でも良好に動作することを示す。
論文 参考訳(メタデータ) (2021-12-01T06:54:31Z) - AdaLead: A simple and robust adaptive greedy search algorithm for
sequence design [55.41644538483948]
我々は、容易で、拡張性があり、堅牢な進化的欲求アルゴリズム(AdaLead)を開発した。
AdaLeadは、様々な生物学的に動機づけられたシーケンスデザインの課題において、アートアプローチのより複雑な状態を克服する、驚くほど強力なベンチマークである。
論文 参考訳(メタデータ) (2020-10-05T16:40:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。