論文の概要: An efficient graph generative model for navigating ultra-large
combinatorial synthesis libraries
- arxiv url: http://arxiv.org/abs/2211.04468v1
- Date: Wed, 19 Oct 2022 15:43:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-14 00:00:58.404512
- Title: An efficient graph generative model for navigating ultra-large
combinatorial synthesis libraries
- Title(参考訳): 超大型組合せ合成ライブラリの効率的なグラフ生成モデル
- Authors: Aryan Pedawi, Pawel Gniewek, Chaoyi Chang, Brandon M. Anderson, Henry
van den Bedem
- Abstract要約: 仮想的でオンデマンドな化学ライブラリーは、化学空間の広大な合成可能な領域をアンロックすることで、早期の薬物発見を変革した。
近年、これらの図書館は数百万から数兆の化合物から急速に成長し、様々な治療標的に対する、発見されていない強力なヒットを隠蔽している。
本稿では,これらの課題を克服するために, Combinatorial Synthesis Library Variational Auto-Encoder (CSLVAE)を提案する。
- 参考スコア(独自算出の注目度): 1.5495593104596397
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Virtual, make-on-demand chemical libraries have transformed early-stage drug
discovery by unlocking vast, synthetically accessible regions of chemical
space. Recent years have witnessed rapid growth in these libraries from
millions to trillions of compounds, hiding undiscovered, potent hits for a
variety of therapeutic targets. However, they are quickly approaching a size
beyond that which permits explicit enumeration, presenting new challenges for
virtual screening. To overcome these challenges, we propose the Combinatorial
Synthesis Library Variational Auto-Encoder (CSLVAE). The proposed generative
model represents such libraries as a differentiable, hierarchically-organized
database. Given a compound from the library, the molecular encoder constructs a
query for retrieval, which is utilized by the molecular decoder to reconstruct
the compound by first decoding its chemical reaction and subsequently decoding
its reactants. Our design minimizes autoregression in the decoder, facilitating
the generation of large, valid molecular graphs. Our method performs fast and
parallel batch inference for ultra-large synthesis libraries, enabling a number
of important applications in early-stage drug discovery. Compounds proposed by
our method are guaranteed to be in the library, and thus synthetically and
cost-effectively accessible. Importantly, CSLVAE can encode out-of-library
compounds and search for in-library analogues. In experiments, we demonstrate
the capabilities of the proposed method in the navigation of massive
combinatorial synthesis libraries.
- Abstract(参考訳): 仮想的でオンデマンドな化学図書館は、化学空間の広大な、合成的にアクセス可能な領域を解き放ち、初期段階の薬物発見を変革した。
近年、これらの図書館は数百万から数兆の化合物から急速に成長し、様々な治療対象の強力なヒットを隠蔽している。
しかし、彼らはすぐに、明示的な列挙を可能にするサイズに近づき、仮想スクリーニングの新たな課題を提示している。
これらの課題を克服するために,コンビネーション合成ライブラリ変分自動エンコーダ(CSLVAE)を提案する。
提案された生成モデルは、そのようなライブラリを微分可能で階層的に構成されたデータベースとして表現する。
ライブラリから化合物が与えられると、分子エンコーダは検索のためのクエリを構築し、分子デコーダによって、まず化学反応をデコードし、次に反応物質をデコードすることで化合物を再構築する。
我々の設計はデコーダにおける自己回帰を最小化し、大きな有効な分子グラフの生成を容易にする。
本手法は,超大規模合成ライブラリに対して高速かつ並列にバッチ推論を行い,早期創薬において重要な応用が可能となる。
本手法で提案する化合物は図書館内に存在することが保証されており,合成的かつ費用対効果が高い。
重要なことに、CSLVAEは、外部の化合物をエンコードし、in-libraryアナログを検索することができる。
実験では,大規模組合せ合成ライブラリのナビゲーションにおける提案手法の有用性を実証する。
関連論文リスト
- Unlocking Potential Binders: Multimodal Pretraining DEL-Fusion for Denoising DNA-Encoded Libraries [51.72836644350993]
マルチモーダルプレトレーニング DEL-Fusion Model (MPDF)
我々は,異なる複合表現とそれらのテキスト記述の対比対象を適用した事前学習タスクを開発する。
本稿では, 原子, 分子, 分子レベルでの複合情報をアマルガメートする新しいDEL融合フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-07T17:32:21Z) - Bioptic -- A Target-Agnostic Potency-Based Small Molecules Search Engine [0.0]
我々は,標的に依存せず有効性に基づく分子探索モデルを開発した。
超大型の40B Enamine REALライブラリを100%リコールレートでスクリーニングした。
我々は、新しい分子の速度性能と検索品質の両面において、我々のモデルと最先端モデルのベンチマークを行った。
論文 参考訳(メタデータ) (2024-06-13T17:53:29Z) - RGFN: Synthesizable Molecular Generation Using GFlowNets [51.33672611338754]
本稿では,化学反応の空間内で直接動作するGFlowNetフレームワークの拡張であるReaction-GFlowNetを提案する。
RGFNは、生成した候補の同等の品質を維持しながら、アウト・オブ・ボックスの合成を可能にする。
提案手法の有効性を,事前訓練されたプロキシモデルやGPUアクセラレーションドッキングなど,さまざまなオラクルモデルに適用した。
論文 参考訳(メタデータ) (2024-06-01T13:11:11Z) - Towards DNA-Encoded Library Generation with GFlowNets [35.09890349911668]
DELを使用する上で重要な課題の1つは、ライブラリ設計である。
本稿では,タンパク質-タンパク質相互作用(PPI)のDEL偏りについて考察する。
我々は、変調タスク上で複数の機械学習アルゴリズムを評価し、提案したGFlowNetベースの生成手法の報酬として使用する。
論文 参考訳(メタデータ) (2024-04-15T19:01:20Z) - LILO: Learning Interpretable Libraries by Compressing and Documenting Code [71.55208585024198]
LILOは、反復的に合成、圧縮、文書化を行う、ニューロシンボリックなフレームワークである。
LILOは、LLM誘導プログラム合成と、Stitchから自動化された最近のアルゴリズムの進歩を組み合わせたものである。
LILOのシンセサイザーが学習した抽象化を解釈し、デプロイするのを手助けすることで、AutoDocがパフォーマンスを向上させることが分かりました。
論文 参考訳(メタデータ) (2023-10-30T17:55:02Z) - Compositional Deep Probabilistic Models of DNA Encoded Libraries [6.206196935093064]
分子表現をモノシンソン,ジシンソン,トリシンソン構造ブロックに分解するDELデータ(DEL-Compose)の合成確率モデルを提案する。
本モデルでは, 基準値と比較して高い性能を示し, 適切な薬局網を充実させ, 内在的解釈可能な構造を通じて貴重な知見を提供する。
論文 参考訳(メタデータ) (2023-10-20T19:04:28Z) - ChemVise: Maximizing Out-of-Distribution Chemical Detection with the
Novel Application of Zero-Shot Learning [60.02503434201552]
本研究は,簡単な学習セットから複雑な露光の学習近似を提案する。
合成センサ応答に対するこのアプローチは, 分布外の化学分析物の検出を驚くほど改善することを示した。
論文 参考訳(メタデータ) (2023-02-09T20:19:57Z) - CorpusBrain: Pre-train a Generative Retrieval Model for
Knowledge-Intensive Language Tasks [62.22920673080208]
単一ステップ生成モデルは、検索プロセスを劇的に単純化し、エンドツーエンドで最適化することができる。
我々は、事前学習された生成検索モデルをCorpsBrainと名付け、コーパスに関する全ての情報が、追加のインデックスを構築することなく、そのパラメータにエンコードされる。
論文 参考訳(メタデータ) (2022-08-16T10:22:49Z) - Learning To Navigate The Synthetically Accessible Chemical Space Using
Reinforcement Learning [75.95376096628135]
ド・ノボ薬物設計のための強化学習(RL)を利用した新しい前方合成フレームワークを提案する。
このセットアップでは、エージェントは巨大な合成可能な化学空間をナビゲートする。
本研究は,合成可能な化学空間を根本的に拡張する上で,エンド・ツー・エンド・トレーニングが重要なパラダイムであることを示す。
論文 参考訳(メタデータ) (2020-04-26T21:40:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。