論文の概要: DEL-Dock: Molecular Docking-Enabled Modeling of DNA-Encoded Libraries
- arxiv url: http://arxiv.org/abs/2212.00136v1
- Date: Wed, 30 Nov 2022 22:00:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-02 17:24:49.648868
- Title: DEL-Dock: Molecular Docking-Enabled Modeling of DNA-Encoded Libraries
- Title(参考訳): DEL-Dock:DNAエンコードライブラリーの分子ドッキング-許容モデリング
- Authors: Kirill Shmilovich, Benson Chen, Theofanis Karaletos, Mohammad M.
Sultan
- Abstract要約: 我々は、リガンドベースの記述子とドッキングされたタンパク質-リガンド複合体の3次元空間情報を組み合わせた新しいパラダイムDEL-Dockを導入する。
本モデルでは,分子富化スコアを予測するために,DELカウントデータを効果的にデノベートできることを示す。
- 参考スコア(独自算出の注目度): 1.290382979353427
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: DNA-Encoded Library (DEL) technology has enabled significant advances in hit
identification by enabling efficient testing of combinatorially-generated
molecular libraries. DEL screens measure protein binding affinity though
sequencing reads of molecules tagged with unique DNA-barcodes that survive a
series of selection experiments. Computational models have been deployed to
learn the latent binding affinities that are correlated to the sequenced count
data; however, this correlation is often obfuscated by various sources of noise
introduced in its complicated data-generation process. In order to denoise DEL
count data and screen for molecules with good binding affinity, computational
models require the correct assumptions in their modeling structure to capture
the correct signals underlying the data. Recent advances in DEL models have
focused on probabilistic formulations of count data, but existing approaches
have thus far been limited to only utilizing 2-D molecule-level
representations. We introduce a new paradigm, DEL-Dock, that combines
ligand-based descriptors with 3-D spatial information from docked
protein-ligand complexes. 3-D spatial information allows our model to learn
over the actual binding modality rather than using only structured-based
information of the ligand. We show that our model is capable of effectively
denoising DEL count data to predict molecule enrichment scores that are better
correlated with experimental binding affinity measurements compared to prior
works. Moreover, by learning over a collection of docked poses we demonstrate
that our model, trained only on DEL data, implicitly learns to perform good
docking pose selection without requiring external supervision from
expensive-to-source protein crystal structures.
- Abstract(参考訳): dnaエンコードライブラリ(del)技術は,コンビネータが生成する分子ライブラリの効率的なテストを可能にすることにより,ヒット識別の大幅な進歩を実現している。
DELスクリーンはタンパク質の結合親和性を測定するが、特定のDNAバーコードでタグ付けされた分子をシークエンシングする。
逐次カウントデータと相関する潜伏結合親和性を学ぶために計算モデルが展開されているが、この相関は複雑なデータ生成プロセスで導入された様々なノイズ源によって隠蔽されることが多い。
優れた結合親和性を持つ分子のDELカウントデータとスクリーンを識別するために、計算モデルは、データの背後にある正しい信号を取得するために、モデリング構造における正しい仮定を必要とする。
DELモデルの最近の進歩は、カウントデータの確率的定式化に焦点が当てられているが、既存のアプローチは2次元分子レベルの表現のみを利用することに限られている。
我々は、リガンドベースの記述子とドッキングされたタンパク質-リガンド複合体の3次元空間情報を組み合わせた新しいパラダイムDEL-Dockを導入する。
3次元空間情報により、リガンドの構造化情報のみを用いることよりも、実際の結合モードを学習することができる。
本モデルでは,DELカウントデータを効果的にデノベートして,実験結合親和性測定と従来よりも相関のよい分子富化スコアを予測できることが示されている。
さらにドッキングされたポーズの集合を学習することで、我々のモデルはDELデータのみに基づいて訓練され、高価なタンパク質結晶構造からの外部の監督を必要とせず、暗黙的にドッキングポーズの選択を行う。
関連論文リスト
- Data Augmentation Scheme for Raman Spectra with Highly Correlated
Annotations [0.23090185577016453]
統計的に独立なラベルを持つデータセットから追加のデータポイントを生成するために、スペクトルの付加的な性質を利用する。
これらのデータポイント上でCNNをトレーニングすることで、アノテーションがモデルトレーニングに使用されたデータセットと同じ相関関係を持たないデータセットのパフォーマンスが向上することを示す。
論文 参考訳(メタデータ) (2024-02-01T18:46:28Z) - Integrating Chemical Language and Molecular Graph in Multimodal Fused
Deep Learning for Drug Property Prediction [9.948710779498487]
分子表現の異なる多モード深層学習モデルを構築した。
モノモーダルモデルと比較すると,マルチモーダルフューズドディープラーニング(MMFDL)モデルは単一モデルよりも精度,信頼性,耐雑音性に優れている。
論文 参考訳(メタデータ) (2023-12-29T07:19:42Z) - Compositional Deep Probabilistic Models of DNA Encoded Libraries [6.206196935093064]
分子表現をモノシンソン,ジシンソン,トリシンソン構造ブロックに分解するDELデータ(DEL-Compose)の合成確率モデルを提案する。
本モデルでは, 基準値と比較して高い性能を示し, 適切な薬局網を充実させ, 内在的解釈可能な構造を通じて貴重な知見を提供する。
論文 参考訳(メタデータ) (2023-10-20T19:04:28Z) - Disentanglement via Latent Quantization [60.37109712033694]
本研究では,組織化された潜在空間からの符号化と復号化に向けた帰納的バイアスを構築する。
本稿では,基本データレコーダ (vanilla autoencoder) と潜時再構成 (InfoGAN) 生成モデルの両方に追加することで,このアプローチの広範な適用性を実証する。
論文 参考訳(メタデータ) (2023-05-28T06:30:29Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - From Static to Dynamic Structures: Improving Binding Affinity Prediction
with a Graph-Based Deep Learning Model [33.92165575735532]
タンパク質-リガンド結合親和性の正確な予測は、構造に基づく薬物設計において重要な課題である。
そこで我々は,3,218種類のタンパク質-リガンド複合体を含むMDデータセットをキュレートし,グラフに基づくディープラーニングモデルDynaformerを開発した。
ダイナフォーマーはMD軌道からタンパク質-リガンド相互作用の幾何学的特徴を学習することにより、結合親和性を正確に予測することができた。
論文 参考訳(メタデータ) (2022-08-19T14:55:12Z) - Mixed Effects Neural ODE: A Variational Approximation for Analyzing the
Dynamics of Panel Data [50.23363975709122]
パネルデータ解析に(固定・ランダムな)混合効果を取り入れたME-NODEという確率モデルを提案する。
我々は、Wong-Zakai定理によって提供されるSDEの滑らかな近似を用いて、我々のモデルを導出できることを示す。
次に、ME-NODEのためのエビデンスに基づく下界を導出し、(効率的な)トレーニングアルゴリズムを開発する。
論文 参考訳(メタデータ) (2022-02-18T22:41:51Z) - Machine learning on DNA-encoded library count data using an
uncertainty-aware probabilistic loss function [1.5559232742666467]
本稿では, 個々の分子のDEL富化を, 独自の負の対数類似損失関数を用いて学習するための回帰的アプローチを示す。
このアプローチは、CAIXに対してスクリーニングされた108k化合物のデータセットと、sEHとSIRT2に対してスクリーニングされた5.7M化合物のデータセットについて説明する。
論文 参考訳(メタデータ) (2021-08-27T19:37:06Z) - Closed-form Continuous-Depth Models [99.40335716948101]
連続深度ニューラルモデルは高度な数値微分方程式解法に依存している。
我々は,CfCネットワークと呼ばれる,記述が簡単で,少なくとも1桁高速な新しいモデル群を提示する。
論文 参考訳(メタデータ) (2021-06-25T22:08:51Z) - Modeling Shared Responses in Neuroimaging Studies through MultiView ICA [94.31804763196116]
被験者の大規模なコホートを含むグループ研究は、脳機能組織に関する一般的な結論を引き出す上で重要である。
グループ研究のための新しい多視点独立成分分析モデルを提案し、各被験者のデータを共有独立音源と雑音の線形結合としてモデル化する。
まず、fMRIデータを用いて、被験者間の共通音源の同定における感度の向上を示す。
論文 参考訳(メタデータ) (2020-06-11T17:29:53Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。