Fugu-MT 論文翻訳(概要): An efficient graph generative model for navigating ultra-large combinatorial synthesis libraries

論文の概要: An efficient graph generative model for navigating ultra-large combinatorial synthesis libraries

arxiv url: http://arxiv.org/abs/2211.04468v1
Date: Wed, 19 Oct 2022 15:43:13 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-14 00:00:58.404512
Title: An efficient graph generative model for navigating ultra-large combinatorial synthesis libraries
Title（参考訳）: 超大型組合せ合成ライブラリの効率的なグラフ生成モデル
Authors: Aryan Pedawi, Pawel Gniewek, Chaoyi Chang, Brandon M. Anderson, Henry van den Bedem
Abstract要約: 仮想的でオンデマンドな化学ライブラリーは、化学空間の広大な合成可能な領域をアンロックすることで、早期の薬物発見を変革した。近年、これらの図書館は数百万から数兆の化合物から急速に成長し、様々な治療標的に対する、発見されていない強力なヒットを隠蔽している。本稿では,これらの課題を克服するために, Combinatorial Synthesis Library Variational Auto-Encoder (CSLVAE)を提案する。
参考スコア（独自算出の注目度）: 1.5495593104596397
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Virtual, make-on-demand chemical libraries have transformed early-stage drug discovery by unlocking vast, synthetically accessible regions of chemical space. Recent years have witnessed rapid growth in these libraries from millions to trillions of compounds, hiding undiscovered, potent hits for a variety of therapeutic targets. However, they are quickly approaching a size beyond that which permits explicit enumeration, presenting new challenges for virtual screening. To overcome these challenges, we propose the Combinatorial Synthesis Library Variational Auto-Encoder (CSLVAE). The proposed generative model represents such libraries as a differentiable, hierarchically-organized database. Given a compound from the library, the molecular encoder constructs a query for retrieval, which is utilized by the molecular decoder to reconstruct the compound by first decoding its chemical reaction and subsequently decoding its reactants. Our design minimizes autoregression in the decoder, facilitating the generation of large, valid molecular graphs. Our method performs fast and parallel batch inference for ultra-large synthesis libraries, enabling a number of important applications in early-stage drug discovery. Compounds proposed by our method are guaranteed to be in the library, and thus synthetically and cost-effectively accessible. Importantly, CSLVAE can encode out-of-library compounds and search for in-library analogues. In experiments, we demonstrate the capabilities of the proposed method in the navigation of massive combinatorial synthesis libraries.
Abstract（参考訳）: 仮想的でオンデマンドな化学図書館は、化学空間の広大な、合成的にアクセス可能な領域を解き放ち、初期段階の薬物発見を変革した。近年、これらの図書館は数百万から数兆の化合物から急速に成長し、様々な治療対象の強力なヒットを隠蔽している。しかし、彼らはすぐに、明示的な列挙を可能にするサイズに近づき、仮想スクリーニングの新たな課題を提示している。これらの課題を克服するために,コンビネーション合成ライブラリ変分自動エンコーダ(CSLVAE)を提案する。提案された生成モデルは、そのようなライブラリを微分可能で階層的に構成されたデータベースとして表現する。ライブラリから化合物が与えられると、分子エンコーダは検索のためのクエリを構築し、分子デコーダによって、まず化学反応をデコードし、次に反応物質をデコードすることで化合物を再構築する。我々の設計はデコーダにおける自己回帰を最小化し、大きな有効な分子グラフの生成を容易にする。本手法は,超大規模合成ライブラリに対して高速かつ並列にバッチ推論を行い,早期創薬において重要な応用が可能となる。本手法で提案する化合物は図書館内に存在することが保証されており,合成的かつ費用対効果が高い。重要なことに、CSLVAEは、外部の化合物をエンコードし、in-libraryアナログを検索することができる。実験では,大規模組合せ合成ライブラリのナビゲーションにおける提案手法の有用性を実証する。

関連論文リスト

ChemActor: Enhancing Automated Extraction of Chemical Synthesis Actions with LLM-Generated Data [53.78763789036172]
ケミカルエグゼキュータとして完全微調整された大規模言語モデル(LLM)であるChemActorを紹介し,非構造化実験手順と構造化動作シーケンスを変換する。このフレームワークは、分散分散に基づくデータ選択モジュールと汎用LLMを統合し、単一の分子入力からマシン実行可能なアクションを生成する。反応記述(R2D)と記述記述処理(D2A)のタスクの実験により、ChemActorは最先端のパフォーマンスを達成し、ベースラインモデルよりも10%高い性能を示した。
論文参考訳（メタデータ） (2025-06-30T05:11:19Z)
EpiCoder: Encompassing Diversity and Complexity in Code Generation [49.170195362149386]
抽象構文木(AST)にヒントを得た新しい特徴木ベース合成フレームワークを提案する。コードの構文構造をキャプチャするASTとは異なり、私たちのフレームワークはコード要素間のセマンティックな関係をモデル化します。広く使われているベースモデルを微調整してEpiCoderシリーズを作成し、関数レベルとファイルレベルの両方で最先端のパフォーマンスを実現しました。
論文参考訳（メタデータ） (2025-01-08T18:58:15Z)
Automated Materials Discovery Platform Realized: Scanning Probe Microscopy of Combinatorial Libraries [14.028387934700222]
組合せライブラリは、二分節と三分節をまたいだ物理的性質の進化を探求するための強力なアプローチである。 SPM(Scanning Probe Microscopies)は、定量的、機能的に関連する複合ライブラリーの読み出しに重要な可能性を秘めている。
論文参考訳（メタデータ） (2024-12-24T00:39:51Z)
Unlocking Potential Binders: Multimodal Pretraining DEL-Fusion for Denoising DNA-Encoded Libraries [51.72836644350993]
マルチモーダルプレトレーニング DEL-Fusion Model (MPDF) 我々は,異なる複合表現とそれらのテキスト記述の対比対象を適用した事前学習タスクを開発する。本稿では, 原子, 分子, 分子レベルでの複合情報をアマルガメートする新しいDEL融合フレームワークを提案する。
論文参考訳（メタデータ） (2024-09-07T17:32:21Z)
Bioptic -- A Target-Agnostic Potency-Based Small Molecules Search Engine [0.0]
我々は,標的に依存せず有効性に基づく分子探索モデルを開発した。超大型の40B Enamine REALライブラリを100%リコールレートでスクリーニングした。我々は、新しい分子の速度性能と検索品質の両面において、我々のモデルと最先端モデルのベンチマークを行った。
論文参考訳（メタデータ） (2024-06-13T17:53:29Z)
RGFN: Synthesizable Molecular Generation Using GFlowNets [51.33672611338754]
本稿では,化学反応の空間内で直接動作するGFlowNetフレームワークの拡張であるReaction-GFlowNetを提案する。 RGFNは、生成した候補の同等の品質を維持しながら、アウト・オブ・ボックスの合成を可能にする。提案手法の有効性を,事前訓練されたプロキシモデルやGPUアクセラレーションドッキングなど,さまざまなオラクルモデルに適用した。
論文参考訳（メタデータ） (2024-06-01T13:11:11Z)
Towards DNA-Encoded Library Generation with GFlowNets [35.09890349911668]
DELを使用する上で重要な課題の1つは、ライブラリ設計である。本稿では,タンパク質-タンパク質相互作用(PPI)のDEL偏りについて考察する。我々は、変調タスク上で複数の機械学習アルゴリズムを評価し、提案したGFlowNetベースの生成手法の報酬として使用する。
論文参考訳（メタデータ） (2024-04-15T19:01:20Z)
LILO: Learning Interpretable Libraries by Compressing and Documenting Code [71.55208585024198]
LILOは、反復的に合成、圧縮、文書化を行う、ニューロシンボリックなフレームワークである。 LILOは、LLM誘導プログラム合成と、Stitchから自動化された最近のアルゴリズムの進歩を組み合わせたものである。 LILOのシンセサイザーが学習した抽象化を解釈し、デプロイするのを手助けすることで、AutoDocがパフォーマンスを向上させることが分かりました。
論文参考訳（メタデータ） (2023-10-30T17:55:02Z)
Compositional Deep Probabilistic Models of DNA Encoded Libraries [6.206196935093064]
分子表現をモノシンソン,ジシンソン,トリシンソン構造ブロックに分解するDELデータ(DEL-Compose)の合成確率モデルを提案する。本モデルでは, 基準値と比較して高い性能を示し, 適切な薬局網を充実させ, 内在的解釈可能な構造を通じて貴重な知見を提供する。
論文参考訳（メタデータ） (2023-10-20T19:04:28Z)
ChemVise: Maximizing Out-of-Distribution Chemical Detection with the Novel Application of Zero-Shot Learning [60.02503434201552]
本研究は,簡単な学習セットから複雑な露光の学習近似を提案する。合成センサ応答に対するこのアプローチは, 分布外の化学分析物の検出を驚くほど改善することを示した。
論文参考訳（メタデータ） (2023-02-09T20:19:57Z)
CorpusBrain: Pre-train a Generative Retrieval Model for Knowledge-Intensive Language Tasks [62.22920673080208]
単一ステップ生成モデルは、検索プロセスを劇的に単純化し、エンドツーエンドで最適化することができる。我々は、事前学習された生成検索モデルをCorpsBrainと名付け、コーパスに関する全ての情報が、追加のインデックスを構築することなく、そのパラメータにエンコードされる。
論文参考訳（メタデータ） (2022-08-16T10:22:49Z)
Learning To Navigate The Synthetically Accessible Chemical Space Using Reinforcement Learning [75.95376096628135]
ド・ノボ薬物設計のための強化学習(RL)を利用した新しい前方合成フレームワークを提案する。このセットアップでは、エージェントは巨大な合成可能な化学空間をナビゲートする。本研究は,合成可能な化学空間を根本的に拡張する上で,エンド・ツー・エンド・トレーニングが重要なパラダイムであることを示す。
論文参考訳（メタデータ） (2020-04-26T21:40:03Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。