論文の概要: KinDEL: DNA-Encoded Library Dataset for Kinase Inhibitors
- arxiv url: http://arxiv.org/abs/2410.08938v1
- Date: Fri, 11 Oct 2024 16:03:58 GMT
- ステータス: 処理完了
- システム内更新日: 2024-10-30 21:06:06.585819
- Title: KinDEL: DNA-Encoded Library Dataset for Kinase Inhibitors
- Title(参考訳): KinDEL:KinaseインヒビターのためのDNAエンコードライブラリデータセット
- Authors: Benson Chen, Tomasz Danel, Patrick J. McEnaney, Nikhil Jain, Kirill Novikov, Spurti Umesh Akki, Joshua L. Turnbull, Virja Atul Pandya, Boris P. Belotserkovskii, Jared Bryce Weaver, Ankita Biswas, Dat Nguyen, Gabriel H. S. Dreiman, Mohammad Sultan, Nathaniel Stanley, Daniel M Whalen, Divya Kanichar, Christoph Klein, Emily Fox, R. Edward Watts,
- Abstract要約: KinDELは2つのキナーゼ上のDELデータセットとして初めて公開された。
我々は、ヒット識別のための予測モデルを開発するために、異なる機械学習手法をベンチマークする。
我々は、分子の小さなサブセット上でモデルを検証するために、オンとオフの両方で生物物理学的なアッセイデータを提供する。
- 参考スコア(独自算出の注目度): 2.0179908661487986
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: DNA-Encoded Libraries (DEL) are combinatorial small molecule libraries that offer an efficient way to characterize diverse chemical spaces. Selection experiments using DELs are pivotal to drug discovery efforts, enabling high-throughput screens for hit finding. However, limited availability of public DEL datasets hinders the advancement of computational techniques designed to process such data. To bridge this gap, we present KinDEL, one of the first large, publicly available DEL datasets on two kinases: Mitogen-Activated Protein Kinase 14 (MAPK14) and Discoidin Domain Receptor Tyrosine Kinase 1 (DDR1). Interest in this data modality is growing due to its ability to generate extensive supervised chemical data that densely samples around select molecular structures. Demonstrating one such application of the data, we benchmark different machine learning techniques to develop predictive models for hit identification; in particular, we highlight recent structure-based probabilistic approaches. Finally, we provide biophysical assay data, both on- and off-DNA, to validate our models on a smaller subset of molecules. Data and code for our benchmarks can be found at: https://github.com/insitro/kindel.
- Abstract(参考訳): DNAエンコードライブラリ(英: DNA-Encoded Libraries、DEL)は、様々な化学空間を効率よく特徴付けるための小さな分子ライブラリーである。
DELを用いた選択実験は、薬物発見の取り組みにおいて重要なものであり、ヒット発見のための高スループットスクリーンを可能にする。
しかし、パブリックなDELデータセットの可用性は限られており、そのようなデータを処理するように設計された計算技術の進歩を妨げる。
このギャップを埋めるために、KinDELは、Mitogen-Activated Protein Kinase 14 (MAPK14) とDisdisoidin Domain Receptor Tyrosine Kinase 1 (DDR1) の2つのキナーゼ上で、初めて公開されたDELデータセットの1つである。
このデータモダリティへの関心は、特定の分子構造の周りに密集してサンプリングする、広範囲に監督された化学データを生成する能力によって増大している。
このようなデータの1つの応用を実証し、異なる機械学習手法をベンチマークし、ヒット同定のための予測モデルを開発する。
最後に、生物物理学的なアッセイデータ(オン・アンド・オフ・DNA)を提供し、より小さな分子のサブセットでモデルを検証する。
ベンチマークのデータとコードは、https://github.com/insitro/kindel.comで参照できます。
関連論文リスト
- Unlocking Potential Binders: Multimodal Pretraining DEL-Fusion for Denoising DNA-Encoded Libraries [51.72836644350993]
マルチモーダルプレトレーニング DEL-Fusion Model (MPDF)
我々は,異なる複合表現とそれらのテキスト記述の対比対象を適用した事前学習タスクを開発する。
本稿では, 原子, 分子, 分子レベルでの複合情報をアマルガメートする新しいDEL融合フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-07T17:32:21Z) - Extracting Training Data from Unconditional Diffusion Models [76.85077961718875]
拡散確率モデル(DPM)は、生成人工知能(AI)の主流モデルとして採用されている。
本研究の目的は,1) 理論解析のための記憶量,2) 情報ラベルとランダムラベルを用いた条件記憶量,3) 記憶量測定のための2つのより良い評価指標を用いて,DPMにおける記憶量の理論的理解を確立することである。
提案手法は,理論解析に基づいて,SIDE (textbfSurrogate condItional Data extract) と呼ばれる新しいデータ抽出手法を提案する。
論文 参考訳(メタデータ) (2024-06-18T16:20:12Z) - Synthetic Data from Diffusion Models Improve Drug Discovery Prediction [1.3686993145787065]
データあいまいさは、重要な研究課題に答えようとする研究者にとって、データのキュレーションを難しくする。
本稿では,リガンドおよび薬物動態データをエンドツーエンドに生成できる新しい拡散GNNモデルSyngandを提案する。
我々は,AqSolDB,LD50,hERGを中心とした下流回帰タスクにおいて,Syngand生成した合成目標データの有効性について,最初の有望な結果を示した。
論文 参考訳(メタデータ) (2024-05-06T19:09:37Z) - Compositional Deep Probabilistic Models of DNA Encoded Libraries [6.206196935093064]
分子表現をモノシンソン,ジシンソン,トリシンソン構造ブロックに分解するDELデータ(DEL-Compose)の合成確率モデルを提案する。
本モデルでは, 基準値と比較して高い性能を示し, 適切な薬局網を充実させ, 内在的解釈可能な構造を通じて貴重な知見を提供する。
論文 参考訳(メタデータ) (2023-10-20T19:04:28Z) - From Artificially Real to Real: Leveraging Pseudo Data from Large
Language Models for Low-Resource Molecule Discovery [35.5507452011217]
分子発見のためのクロスモーダル技術は、しばしばデータ不足の問題に遭遇し、その性能と応用を妨げる。
我々は,高品質な擬似データを構築するための検索ベースのプロンプト戦略を導入し,この擬似データを効果的に活用するための最適手法を探る。
実験により、ドメイン適応のための擬似データの使用は、既存のすべてのメソッドより優れており、モデルスケールが小さく、データサイズが小さく、トレーニングコストも低いことが示されている。
論文 参考訳(メタデータ) (2023-09-11T02:35:36Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - DEL-Dock: Molecular Docking-Enabled Modeling of DNA-Encoded Libraries [1.290382979353427]
我々は、リガンドベースの記述子とドッキングされたタンパク質-リガンド複合体の3次元空間情報を組み合わせた新しいパラダイムDEL-Dockを導入する。
本モデルでは,分子富化スコアを予測するために,DELカウントデータを効果的にデノベートできることを示す。
論文 参考訳(メタデータ) (2022-11-30T22:00:24Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - MIMOSA: Multi-constraint Molecule Sampling for Molecule Optimization [51.00815310242277]
生成モデルと強化学習アプローチは、最初の成功をおさめたが、複数の薬物特性を同時に最適化する上で、依然として困難に直面している。
本稿では,MultI-Constraint MOlecule SAmpling (MIMOSA)アプローチ,初期推定として入力分子を用いるサンプリングフレームワーク,ターゲット分布からのサンプル分子を提案する。
論文 参考訳(メタデータ) (2020-10-05T20:18:42Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z) - Machine learning on DNA-encoded libraries: A new paradigm for
hit-finding [4.473676566828977]
DEL選択データに機械学習を適用した新しい手法を示す。
DEL選択データのみを使用してモデルをトレーニングし、自動または自動化可能なフィルタを適用します。
アプローチは有効であり、全体としては30本のテキストミューMで sim30% のヒット率と各ターゲットに対する強力な化合物(IC50 10 nM)の発見である。
論文 参考訳(メタデータ) (2020-01-31T19:31:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。