論文の概要: An efficient graph generative model for navigating ultra-large
combinatorial synthesis libraries
- arxiv url: http://arxiv.org/abs/2211.04468v1
- Date: Wed, 19 Oct 2022 15:43:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-14 00:00:58.404512
- Title: An efficient graph generative model for navigating ultra-large
combinatorial synthesis libraries
- Title(参考訳): 超大型組合せ合成ライブラリの効率的なグラフ生成モデル
- Authors: Aryan Pedawi, Pawel Gniewek, Chaoyi Chang, Brandon M. Anderson, Henry
van den Bedem
- Abstract要約: 仮想的でオンデマンドな化学ライブラリーは、化学空間の広大な合成可能な領域をアンロックすることで、早期の薬物発見を変革した。
近年、これらの図書館は数百万から数兆の化合物から急速に成長し、様々な治療標的に対する、発見されていない強力なヒットを隠蔽している。
本稿では,これらの課題を克服するために, Combinatorial Synthesis Library Variational Auto-Encoder (CSLVAE)を提案する。
- 参考スコア(独自算出の注目度): 1.5495593104596397
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Virtual, make-on-demand chemical libraries have transformed early-stage drug
discovery by unlocking vast, synthetically accessible regions of chemical
space. Recent years have witnessed rapid growth in these libraries from
millions to trillions of compounds, hiding undiscovered, potent hits for a
variety of therapeutic targets. However, they are quickly approaching a size
beyond that which permits explicit enumeration, presenting new challenges for
virtual screening. To overcome these challenges, we propose the Combinatorial
Synthesis Library Variational Auto-Encoder (CSLVAE). The proposed generative
model represents such libraries as a differentiable, hierarchically-organized
database. Given a compound from the library, the molecular encoder constructs a
query for retrieval, which is utilized by the molecular decoder to reconstruct
the compound by first decoding its chemical reaction and subsequently decoding
its reactants. Our design minimizes autoregression in the decoder, facilitating
the generation of large, valid molecular graphs. Our method performs fast and
parallel batch inference for ultra-large synthesis libraries, enabling a number
of important applications in early-stage drug discovery. Compounds proposed by
our method are guaranteed to be in the library, and thus synthetically and
cost-effectively accessible. Importantly, CSLVAE can encode out-of-library
compounds and search for in-library analogues. In experiments, we demonstrate
the capabilities of the proposed method in the navigation of massive
combinatorial synthesis libraries.
- Abstract(参考訳): 仮想的でオンデマンドな化学図書館は、化学空間の広大な、合成的にアクセス可能な領域を解き放ち、初期段階の薬物発見を変革した。
近年、これらの図書館は数百万から数兆の化合物から急速に成長し、様々な治療対象の強力なヒットを隠蔽している。
しかし、彼らはすぐに、明示的な列挙を可能にするサイズに近づき、仮想スクリーニングの新たな課題を提示している。
これらの課題を克服するために,コンビネーション合成ライブラリ変分自動エンコーダ(CSLVAE)を提案する。
提案された生成モデルは、そのようなライブラリを微分可能で階層的に構成されたデータベースとして表現する。
ライブラリから化合物が与えられると、分子エンコーダは検索のためのクエリを構築し、分子デコーダによって、まず化学反応をデコードし、次に反応物質をデコードすることで化合物を再構築する。
我々の設計はデコーダにおける自己回帰を最小化し、大きな有効な分子グラフの生成を容易にする。
本手法は,超大規模合成ライブラリに対して高速かつ並列にバッチ推論を行い,早期創薬において重要な応用が可能となる。
本手法で提案する化合物は図書館内に存在することが保証されており,合成的かつ費用対効果が高い。
重要なことに、CSLVAEは、外部の化合物をエンコードし、in-libraryアナログを検索することができる。
実験では,大規模組合せ合成ライブラリのナビゲーションにおける提案手法の有用性を実証する。
関連論文リスト
- LILO: Learning Interpretable Libraries by Compressing and Documenting Code [72.90003911433905]
LILOは、反復的に合成、圧縮、文書化を行う、ニューロシンボリックなフレームワークである。
LILOは、LLM誘導プログラム合成と、Stitchから自動化された最近のアルゴリズムの進歩を組み合わせたものである。
LILOのシンセサイザーが学習した抽象化を解釈し、デプロイするのを手助けすることで、AutoDocがパフォーマンスを向上させることが分かりました。
論文 参考訳(メタデータ) (2023-10-30T17:55:02Z) - Compositional Deep Probabilistic Models of DNA Encoded Libraries [6.206196935093064]
分子表現をモノシンソン,ジシンソン,トリシンソン構造ブロックに分解するDELデータ(DEL-Compose)の合成確率モデルを提案する。
本モデルでは, 基準値と比較して高い性能を示し, 適切な薬局網を充実させ, 内在的解釈可能な構造を通じて貴重な知見を提供する。
論文 参考訳(メタデータ) (2023-10-20T19:04:28Z) - ChemVise: Maximizing Out-of-Distribution Chemical Detection with the
Novel Application of Zero-Shot Learning [60.02503434201552]
本研究は,簡単な学習セットから複雑な露光の学習近似を提案する。
合成センサ応答に対するこのアプローチは, 分布外の化学分析物の検出を驚くほど改善することを示した。
論文 参考訳(メタデータ) (2023-02-09T20:19:57Z) - Dataset Condensation with Latent Space Knowledge Factorization and
Sharing [73.31614936678571]
与えられたデータセットの規則性を利用してデータセットの凝縮問題を解決する新しい手法を提案する。
データセットを元の入力空間に直接凝縮するのではなく、学習可能な一連のコードでデータセットの生成プロセスを仮定する。
提案手法は,様々なベンチマークデータセットに対して,有意なマージンで新しい最先端記録を達成できることを実験的に示す。
論文 参考訳(メタデータ) (2022-08-21T18:14:08Z) - CorpusBrain: Pre-train a Generative Retrieval Model for
Knowledge-Intensive Language Tasks [62.22920673080208]
単一ステップ生成モデルは、検索プロセスを劇的に単純化し、エンドツーエンドで最適化することができる。
我々は、事前学習された生成検索モデルをCorpsBrainと名付け、コーパスに関する全ての情報が、追加のインデックスを構築することなく、そのパラメータにエンコードされる。
論文 参考訳(メタデータ) (2022-08-16T10:22:49Z) - ChemicalX: A Deep Learning Library for Drug Pair Scoring [9.560239177143764]
ChemicalXはPyTorchベースのディープラーニングライブラリで、薬物ペアスコアリングタスクを解決する。
ChemicalXは、大規模な薬物ペアデータセット上で機械学習モデルをトレーニングし、スコア付けするために使用できることを示す。
論文 参考訳(メタデータ) (2022-02-10T18:49:01Z) - ChemoVerse: Manifold traversal of latent spaces for novel molecule
discovery [0.7742297876120561]
所望の化学的性質を持つ分子構造を同定することが不可欠である。
ニューラルネットワークと機械学習を用いた生成モデルの最近の進歩は、薬物のような化合物の仮想ライブラリの設計に広く利用されている。
論文 参考訳(メタデータ) (2020-09-29T12:11:40Z) - Deep Inverse Reinforcement Learning for Structural Evolution of Small
Molecules [0.0]
強化学習は主に 新たな化合物を生成するために 文献で活用されています
学習目的を簡潔に表わす報酬関数を設計する必要性は、ある種の複雑な領域においてばかばかしいことを証明できる。
本稿では,エントロピー逆強化学習パラダイムに基づく複合生成と伝達可能な報酬関数の学習のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-24T17:21:59Z) - A Transformer-based Approach for Source Code Summarization [86.08359401867577]
コードトークン間のペア関係をモデル化することにより,要約のためのコード表現を学習する。
アプローチは単純であるにもかかわらず、最先端技術よりもかなりの差があることが示される。
論文 参考訳(メタデータ) (2020-05-01T23:29:36Z) - Learning To Navigate The Synthetically Accessible Chemical Space Using
Reinforcement Learning [75.95376096628135]
ド・ノボ薬物設計のための強化学習(RL)を利用した新しい前方合成フレームワークを提案する。
このセットアップでは、エージェントは巨大な合成可能な化学空間をナビゲートする。
本研究は,合成可能な化学空間を根本的に拡張する上で,エンド・ツー・エンド・トレーニングが重要なパラダイムであることを示す。
論文 参考訳(メタデータ) (2020-04-26T21:40:03Z) - Machine learning on DNA-encoded libraries: A new paradigm for
hit-finding [4.473676566828977]
DEL選択データに機械学習を適用した新しい手法を示す。
DEL選択データのみを使用してモデルをトレーニングし、自動または自動化可能なフィルタを適用します。
アプローチは有効であり、全体としては30本のテキストミューMで sim30% のヒット率と各ターゲットに対する強力な化合物(IC50 10 nM)の発見である。
論文 参考訳(メタデータ) (2020-01-31T19:31:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。