論文の概要: Compositional Deep Probabilistic Models of DNA Encoded Libraries
- arxiv url: http://arxiv.org/abs/2310.13769v2
- Date: Tue, 13 Feb 2024 18:15:09 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-14 19:20:53.593355
- Title: Compositional Deep Probabilistic Models of DNA Encoded Libraries
- Title(参考訳): DNAエンコードライブラリーの構成的深層確率モデル
- Authors: Benson Chen, Mohammad M. Sultan, Theofanis Karaletsos
- Abstract要約: 分子表現をモノシンソン,ジシンソン,トリシンソン構造ブロックに分解するDELデータ(DEL-Compose)の合成確率モデルを提案する。
本モデルでは, 基準値と比較して高い性能を示し, 適切な薬局網を充実させ, 内在的解釈可能な構造を通じて貴重な知見を提供する。
- 参考スコア(独自算出の注目度): 6.206196935093064
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: DNA-Encoded Library (DEL) has proven to be a powerful tool that utilizes
combinatorially constructed small molecules to facilitate highly-efficient
screening assays. These selection experiments, involving multiple stages of
washing, elution, and identification of potent binders via unique DNA barcodes,
often generate complex data. This complexity can potentially mask the
underlying signals, necessitating the application of computational tools such
as machine learning to uncover valuable insights. We introduce a compositional
deep probabilistic model of DEL data, DEL-Compose, which decomposes molecular
representations into their mono-synthon, di-synthon, and tri-synthon building
blocks and capitalizes on the inherent hierarchical structure of these
molecules by modeling latent reactions between embedded synthons. Additionally,
we investigate methods to improve the observation models for DEL count data
such as integrating covariate factors to more effectively account for data
noise. Across two popular public benchmark datasets (CA-IX and HRP), our model
demonstrates strong performance compared to count baselines, enriches the
correct pharmacophores, and offers valuable insights via its intrinsic
interpretable structure, thereby providing a robust tool for the analysis of
DEL data.
- Abstract(参考訳): DNAエンコードライブラリー(DEL)は、組み合わされた小さな分子を利用して高効率なスクリーニングを行う強力なツールであることが証明されている。
これらの選択実験は、複数の段階の洗浄、溶出、特異なDNAバーコードによる強力なバインダーの同定を含むが、しばしば複雑なデータを生成する。
この複雑さは、基礎となる信号を隠蔽し、貴重な洞察を明らかにするために機械学習のような計算ツールを適用する必要がある可能性がある。
分子表現をモノシンソン, ジシンソン, トリシンソン構造ブロックに分解し, 組込みシンソン間の潜在反応をモデル化することにより, これらの分子の固有の階層構造を付加するDELデータ合成モデルDEL-Composeを導入する。
さらに,データノイズをより効果的に考慮するための共変量要素の統合など,delカウントデータの観測モデルを改善する手法について検討する。
一般的な2つのベンチマークデータセット (CA-IX と HRP) にわたって,本モデルでは,基準値と比較して高い性能を示し,正しい薬局網を充実させ,本質的な解釈可能な構造を通じて貴重な洞察を提供し,DELデータ解析のための堅牢なツールを提供する。
関連論文リスト
- KinDEL: DNA-Encoded Library Dataset for Kinase Inhibitors [2.0179908661487986]
KinDELは2つのキナーゼ上のDELデータセットとして初めて公開された。
我々は、ヒット識別のための予測モデルを開発するために、異なる機械学習手法をベンチマークする。
我々は、分子の小さなサブセット上でモデルを検証するために、オンとオフの両方で生物物理学的なアッセイデータを提供する。
論文 参考訳(メタデータ) (2024-10-11T16:03:58Z) - Unlocking Potential Binders: Multimodal Pretraining DEL-Fusion for Denoising DNA-Encoded Libraries [51.72836644350993]
マルチモーダルプレトレーニング DEL-Fusion Model (MPDF)
我々は,異なる複合表現とそれらのテキスト記述の対比対象を適用した事前学習タスクを開発する。
本稿では, 原子, 分子, 分子レベルでの複合情報をアマルガメートする新しいDEL融合フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-07T17:32:21Z) - Genetic Instruct: Scaling up Synthetic Generation of Coding Instructions for Large Language Models [54.51932175059004]
本稿では,大規模言語モデルのコード生成能力を高めるために,合成命令を生成するスケーラブルな手法を提案する。
提案したアルゴリズムは進化過程を模倣し、自己インストラクションを利用して限られた数の種子から多数の合成サンプルを生成する。
論文 参考訳(メタデータ) (2024-07-29T20:42:59Z) - Let's Synthesize Step by Step: Iterative Dataset Synthesis with Large
Language Models by Extrapolating Errors from Small Models [69.76066070227452]
※データ合成*はラベル付きデータの少ない小さなモデルをトレーニングするための有望な方法です。
本稿では,この分散ギャップを縮めるデータ合成フレームワークであるStep* (**S3**) による合成ステップを提案する。
提案手法は,合成データセットと実データとのギャップを小さくすることで,小型モデルの性能を向上させる。
論文 参考訳(メタデータ) (2023-10-20T17:14:25Z) - A robust synthetic data generation framework for machine learning in
High-Resolution Transmission Electron Microscopy (HRTEM) [1.0923877073891446]
Construction Zoneは、複雑なナノスケール原子構造を高速に生成するためのPythonパッケージである。
ニューラルネットワークをトレーニングするための大規模なシミュレーションデータベースを作成するためのエンドツーエンドワークフローを開発する。
この結果から, ナノ粒子のHRTEM画像に対して, 最先端のセグメンテーション性能を実現することができた。
論文 参考訳(メタデータ) (2023-09-12T10:44:15Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - DEL-Dock: Molecular Docking-Enabled Modeling of DNA-Encoded Libraries [1.290382979353427]
我々は、リガンドベースの記述子とドッキングされたタンパク質-リガンド複合体の3次元空間情報を組み合わせた新しいパラダイムDEL-Dockを導入する。
本モデルでは,分子富化スコアを予測するために,DELカウントデータを効果的にデノベートできることを示す。
論文 参考訳(メタデータ) (2022-11-30T22:00:24Z) - BeCAPTCHA-Type: Biometric Keystroke Data Generation for Improved Bot
Detection [63.447493500066045]
本研究では,キーストローク生体データ合成のためのデータ駆動学習モデルを提案する。
提案手法は,ユニバーサルモデルとユーザ依存モデルに基づく2つの統計的手法と比較する。
実験フレームワークでは16万件の被験者から1億3600万件のキーストロークイベントのデータセットについて検討している。
論文 参考訳(メタデータ) (2022-07-27T09:26:15Z) - Machine learning on DNA-encoded library count data using an
uncertainty-aware probabilistic loss function [1.5559232742666467]
本稿では, 個々の分子のDEL富化を, 独自の負の対数類似損失関数を用いて学習するための回帰的アプローチを示す。
このアプローチは、CAIXに対してスクリーニングされた108k化合物のデータセットと、sEHとSIRT2に対してスクリーニングされた5.7M化合物のデータセットについて説明する。
論文 参考訳(メタデータ) (2021-08-27T19:37:06Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。