論文の概要: Partial Product Aware Machine Learning on DNA-Encoded Libraries
- arxiv url: http://arxiv.org/abs/2205.08020v1
- Date: Mon, 16 May 2022 23:18:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-18 14:16:55.916372
- Title: Partial Product Aware Machine Learning on DNA-Encoded Libraries
- Title(参考訳): DNAエンコードライブラリによる部分製品認識機械学習
- Authors: Polina Binder, Meghan Lawler, LaShadric Grady, Neil Carlson, Sumudu
Leelananda, Svetlana Belyanskaya, Joe Franklin, Nicolas Tilmans, Henri
Palacci
- Abstract要約: DELデータに基づく機械学習モデルの訓練は、元のDELと異なる関心の分子を予測するのに有効であることが示されている。
反応収率データを利用して、与えられたDNAタグに対応する分子の集合を列挙する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: DNA encoded libraries (DELs) are used for rapid large-scale screening of
small molecules against a protein target. These combinatorial libraries are
built through several cycles of chemistry and DNA ligation, producing large
sets of DNA-tagged molecules. Training machine learning models on DEL data has
been shown to be effective at predicting molecules of interest dissimilar from
those in the original DEL. Machine learning chemical property prediction
approaches rely on the assumption that the property of interest is linked to a
single chemical structure. In the context of DNA-encoded libraries, this is
equivalent to assuming that every chemical reaction fully yields the desired
product. However, in practice, multi-step chemical synthesis sometimes
generates partial molecules. Each unique DNA tag in a DEL therefore corresponds
to a set of possible molecules. Here, we leverage reaction yield data to
enumerate the set of possible molecules corresponding to a given DNA tag. This
paper demonstrates that training a custom GNN on this richer dataset improves
accuracy and generalization performance.
- Abstract(参考訳): DNAエンコードライブラリー(DEL)は、タンパク質標的に対する小さな分子の高速な大規模スクリーニングに用いられる。
これらの組み合わせライブラリーは、化学とDNAリゲーションのサイクルを通じて構築され、大量のDNAタグ付き分子を生成する。
DELデータに基づく機械学習モデルの訓練は、元のDELと異なる関心の分子を予測するのに有効であることが示されている。
機械学習の化学特性予測手法は、興味のある性質が単一の化学構造と関連しているという仮定に依存する。
DNAエンコードされたライブラリーの文脈では、これは全ての化学反応が望まれる生成物を完全に生成するという仮定と等価である。
しかし実際には、多段階の化学合成は時に部分的な分子を生成する。
従って、DELのそれぞれのユニークなDNAタグは、可能な分子の集合に対応する。
ここでは, 反応収率データを利用して, 与えられたDNAタグに対応する分子の集合を列挙する。
本稿では,よりリッチなデータセットを用いたカスタムGNNのトレーニングにより,精度と一般化性能が向上することを示す。
関連論文リスト
- KinDEL: DNA-Encoded Library Dataset for Kinase Inhibitors [2.0179908661487986]
KinDELは2つのキナーゼ上のDELデータセットとして初めて公開された。
我々は、ヒット識別のための予測モデルを開発するために、異なる機械学習手法をベンチマークする。
我々は、分子の小さなサブセット上でモデルを検証するために、オンとオフの両方で生物物理学的なアッセイデータを提供する。
論文 参考訳(メタデータ) (2024-10-11T16:03:58Z) - Compositional Deep Probabilistic Models of DNA Encoded Libraries [6.206196935093064]
分子表現をモノシンソン,ジシンソン,トリシンソン構造ブロックに分解するDELデータ(DEL-Compose)の合成確率モデルを提案する。
本モデルでは, 基準値と比較して高い性能を示し, 適切な薬局網を充実させ, 内在的解釈可能な構造を通じて貴重な知見を提供する。
論文 参考訳(メタデータ) (2023-10-20T19:04:28Z) - Bi-level Contrastive Learning for Knowledge-Enhanced Molecule
Representations [55.42602325017405]
本稿では,分子の2レベル構造を考慮した新しいGODE法を提案する。
異なるグラフ構造上で2つのグラフニューラルネットワーク(GNN)を事前訓練し、対照的な学習と組み合わせることで、GODEは分子構造を対応する知識グラフサブ構造と融合させる。
11の化学特性タスクを微調整した場合、我々のモデルは既存のベンチマークよりも優れており、分類タスクの平均ROC-AUCアップリフトは13.8%、回帰タスクの平均RMSE/MAEエンハンスメントは35.1%である。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - Graph-based Molecular Representation Learning [59.06193431883431]
分子表現学習(MRL)は、機械学習と化学科学を結びつけるための重要なステップである。
近年、MRLは、特に深層分子グラフ学習に基づく手法において、かなりの進歩を遂げている。
論文 参考訳(メタデータ) (2022-07-08T17:43:20Z) - Scalable Fragment-Based 3D Molecular Design with Reinforcement Learning [68.8204255655161]
分子構築に階層的エージェントを用いるスケーラブルな3D設計のための新しいフレームワークを提案する。
様々な実験において、エネルギーのみを考慮に入れたエージェントが、100以上の原子を持つ分子を効率よく生成できることが示されている。
論文 参考訳(メタデータ) (2022-02-01T18:54:24Z) - Chemical-Reaction-Aware Molecule Representation Learning [88.79052749877334]
本稿では,化学反応を用いて分子表現の学習を支援することを提案する。
本手法は,1) 埋め込み空間を適切に整理し, 2) 分子埋め込みの一般化能力を向上させるために有効であることが証明された。
実験結果から,本手法は様々なダウンストリームタスクにおける最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2021-09-21T00:08:43Z) - MolCLR: Molecular Contrastive Learning of Representations via Graph
Neural Networks [11.994553575596228]
MolCLRは、大規模なラベルなしの分子データセットのための自己監視学習フレームワークです。
原子マスキング、結合除去、サブグラフ除去の3つの新しい分子グラフ増強法を提案する。
提案手法は,多くの挑戦的データセットに対して最先端の性能を実現する。
論文 参考訳(メタデータ) (2021-02-19T17:35:18Z) - Barking up the right tree: an approach to search over molecule synthesis
DAGs [28.13323960125482]
現在の分子の深層生成モデルは合成可能性を無視している。
我々は,現実世界のプロセスをよりよく表現する深い生成モデルを提案する。
我々のアプローチは化学空間をうまくモデル化でき、幅広い多様な分子を生成できることを示します。
論文 参考訳(メタデータ) (2020-12-21T17:35:06Z) - RetroGNN: Approximating Retrosynthesis by Graph Neural Networks for De
Novo Drug Design [75.14290780116002]
我々は、再合成計画ソフトウェアの出力を近似するために、ディープグラフニューラルネットワークを訓練する。
提案手法では, 薬剤的特性は良好であり, 合成が容易であるにもかかわらず, 抗生物質である可能性が示唆された分子について検討した。
論文 参考訳(メタデータ) (2020-11-25T22:04:16Z) - Machine learning on DNA-encoded libraries: A new paradigm for
hit-finding [4.473676566828977]
DEL選択データに機械学習を適用した新しい手法を示す。
DEL選択データのみを使用してモデルをトレーニングし、自動または自動化可能なフィルタを適用します。
アプローチは有効であり、全体としては30本のテキストミューMで sim30% のヒット率と各ターゲットに対する強力な化合物(IC50 10 nM)の発見である。
論文 参考訳(メタデータ) (2020-01-31T19:31:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。