論文の概要: DEL-Dock: Molecular Docking-Enabled Modeling of DNA-Encoded Libraries
- arxiv url: http://arxiv.org/abs/2212.00136v1
- Date: Wed, 30 Nov 2022 22:00:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-02 17:24:49.648868
- Title: DEL-Dock: Molecular Docking-Enabled Modeling of DNA-Encoded Libraries
- Title(参考訳): DEL-Dock:DNAエンコードライブラリーの分子ドッキング-許容モデリング
- Authors: Kirill Shmilovich, Benson Chen, Theofanis Karaletos, Mohammad M.
Sultan
- Abstract要約: 我々は、リガンドベースの記述子とドッキングされたタンパク質-リガンド複合体の3次元空間情報を組み合わせた新しいパラダイムDEL-Dockを導入する。
本モデルでは,分子富化スコアを予測するために,DELカウントデータを効果的にデノベートできることを示す。
- 参考スコア(独自算出の注目度): 1.290382979353427
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: DNA-Encoded Library (DEL) technology has enabled significant advances in hit
identification by enabling efficient testing of combinatorially-generated
molecular libraries. DEL screens measure protein binding affinity though
sequencing reads of molecules tagged with unique DNA-barcodes that survive a
series of selection experiments. Computational models have been deployed to
learn the latent binding affinities that are correlated to the sequenced count
data; however, this correlation is often obfuscated by various sources of noise
introduced in its complicated data-generation process. In order to denoise DEL
count data and screen for molecules with good binding affinity, computational
models require the correct assumptions in their modeling structure to capture
the correct signals underlying the data. Recent advances in DEL models have
focused on probabilistic formulations of count data, but existing approaches
have thus far been limited to only utilizing 2-D molecule-level
representations. We introduce a new paradigm, DEL-Dock, that combines
ligand-based descriptors with 3-D spatial information from docked
protein-ligand complexes. 3-D spatial information allows our model to learn
over the actual binding modality rather than using only structured-based
information of the ligand. We show that our model is capable of effectively
denoising DEL count data to predict molecule enrichment scores that are better
correlated with experimental binding affinity measurements compared to prior
works. Moreover, by learning over a collection of docked poses we demonstrate
that our model, trained only on DEL data, implicitly learns to perform good
docking pose selection without requiring external supervision from
expensive-to-source protein crystal structures.
- Abstract(参考訳): dnaエンコードライブラリ(del)技術は,コンビネータが生成する分子ライブラリの効率的なテストを可能にすることにより,ヒット識別の大幅な進歩を実現している。
DELスクリーンはタンパク質の結合親和性を測定するが、特定のDNAバーコードでタグ付けされた分子をシークエンシングする。
逐次カウントデータと相関する潜伏結合親和性を学ぶために計算モデルが展開されているが、この相関は複雑なデータ生成プロセスで導入された様々なノイズ源によって隠蔽されることが多い。
優れた結合親和性を持つ分子のDELカウントデータとスクリーンを識別するために、計算モデルは、データの背後にある正しい信号を取得するために、モデリング構造における正しい仮定を必要とする。
DELモデルの最近の進歩は、カウントデータの確率的定式化に焦点が当てられているが、既存のアプローチは2次元分子レベルの表現のみを利用することに限られている。
我々は、リガンドベースの記述子とドッキングされたタンパク質-リガンド複合体の3次元空間情報を組み合わせた新しいパラダイムDEL-Dockを導入する。
3次元空間情報により、リガンドの構造化情報のみを用いることよりも、実際の結合モードを学習することができる。
本モデルでは,DELカウントデータを効果的にデノベートして,実験結合親和性測定と従来よりも相関のよい分子富化スコアを予測できることが示されている。
さらにドッキングされたポーズの集合を学習することで、我々のモデルはDELデータのみに基づいて訓練され、高価なタンパク質結晶構造からの外部の監督を必要とせず、暗黙的にドッキングポーズの選択を行う。
関連論文リスト
- BAPULM: Binding Affinity Prediction using Language Models [7.136205674624813]
本稿では,ProtT5-XL-U50およびMollFormerを介してタンパク質の化学潜伏表現を利用する,革新的な配列ベースフレームワークであるBAPULMを紹介する。
提案手法は,ベンチマーク1k2101, Test2016_290, CSAR-HiQ_36でそれぞれ0.925 $pm$0.043, 0.914 $pm$0.004, 0.8132 $pm$0.0001のシーケンシャルスコアリングパワー(R)値を達成した。
論文 参考訳(メタデータ) (2024-11-06T04:35:30Z) - KinDEL: DNA-Encoded Library Dataset for Kinase Inhibitors [2.0179908661487986]
KinDELは2つのキナーゼ上のDELデータセットとして初めて公開された。
我々は、ヒット識別のための予測モデルを開発するために、異なる機械学習手法をベンチマークする。
我々は、分子の小さなサブセット上でモデルを検証するために、オンとオフの両方で生物物理学的なアッセイデータを提供する。
論文 参考訳(メタデータ) (2024-10-11T16:03:58Z) - Unlocking Potential Binders: Multimodal Pretraining DEL-Fusion for Denoising DNA-Encoded Libraries [51.72836644350993]
マルチモーダルプレトレーニング DEL-Fusion Model (MPDF)
我々は,異なる複合表現とそれらのテキスト記述の対比対象を適用した事前学習タスクを開発する。
本稿では, 原子, 分子, 分子レベルでの複合情報をアマルガメートする新しいDEL融合フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-07T17:32:21Z) - Extracting Training Data from Unconditional Diffusion Models [76.85077961718875]
拡散確率モデル(DPM)は、生成人工知能(AI)の主流モデルとして採用されている。
本研究の目的は,1) 理論解析のための記憶量,2) 情報ラベルとランダムラベルを用いた条件記憶量,3) 記憶量測定のための2つのより良い評価指標を用いて,DPMにおける記憶量の理論的理解を確立することである。
提案手法は,理論解析に基づいて,SIDE (textbfSurrogate condItional Data extract) と呼ばれる新しいデータ抽出手法を提案する。
論文 参考訳(メタデータ) (2024-06-18T16:20:12Z) - Optimizing OOD Detection in Molecular Graphs: A Novel Approach with Diffusion Models [71.39421638547164]
本稿では,入力分子と再構成グラフの類似性を比較する補助拡散モデルに基づくフレームワークを用いてOOD分子を検出することを提案する。
IDトレーニングサンプルの再構成に向けた生成バイアスのため、OOD分子の類似度スコアは検出を容易にするためにはるかに低い。
本研究は,PGR-MOOD(PGR-MOOD)とよばれる分子OOD検出のためのプロトタイプグラフ再構成のアプローチを開拓し,3つのイノベーションを生かした。
論文 参考訳(メタデータ) (2024-04-24T03:25:53Z) - Integrating Chemical Language and Molecular Graph in Multimodal Fused Deep Learning for Drug Property Prediction [9.388979080270103]
分子表現の異なる多モード深層学習モデルを構築した。
モノモーダルモデルと比較すると,マルチモーダルフューズドディープラーニング(MMFDL)モデルは単一モデルよりも精度,信頼性,耐雑音性に優れている。
論文 参考訳(メタデータ) (2023-12-29T07:19:42Z) - Compositional Deep Probabilistic Models of DNA Encoded Libraries [6.206196935093064]
分子表現をモノシンソン,ジシンソン,トリシンソン構造ブロックに分解するDELデータ(DEL-Compose)の合成確率モデルを提案する。
本モデルでは, 基準値と比較して高い性能を示し, 適切な薬局網を充実させ, 内在的解釈可能な構造を通じて貴重な知見を提供する。
論文 参考訳(メタデータ) (2023-10-20T19:04:28Z) - Disentanglement via Latent Quantization [60.37109712033694]
本研究では,組織化された潜在空間からの符号化と復号化に向けた帰納的バイアスを構築する。
本稿では,基本データレコーダ (vanilla autoencoder) と潜時再構成 (InfoGAN) 生成モデルの両方に追加することで,このアプローチの広範な適用性を実証する。
論文 参考訳(メタデータ) (2023-05-28T06:30:29Z) - Machine learning on DNA-encoded library count data using an
uncertainty-aware probabilistic loss function [1.5559232742666467]
本稿では, 個々の分子のDEL富化を, 独自の負の対数類似損失関数を用いて学習するための回帰的アプローチを示す。
このアプローチは、CAIXに対してスクリーニングされた108k化合物のデータセットと、sEHとSIRT2に対してスクリーニングされた5.7M化合物のデータセットについて説明する。
論文 参考訳(メタデータ) (2021-08-27T19:37:06Z) - Modeling Shared Responses in Neuroimaging Studies through MultiView ICA [94.31804763196116]
被験者の大規模なコホートを含むグループ研究は、脳機能組織に関する一般的な結論を引き出す上で重要である。
グループ研究のための新しい多視点独立成分分析モデルを提案し、各被験者のデータを共有独立音源と雑音の線形結合としてモデル化する。
まず、fMRIデータを用いて、被験者間の共通音源の同定における感度の向上を示す。
論文 参考訳(メタデータ) (2020-06-11T17:29:53Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。