Fugu-MT 論文翻訳(概要): KinDEL: DNA-Encoded Library Dataset for Kinase Inhibitors

論文の概要: KinDEL: DNA-Encoded Library Dataset for Kinase Inhibitors

arxiv url: http://arxiv.org/abs/2410.08938v1
Date: Fri, 11 Oct 2024 16:03:58 GMT
ステータス: 翻訳完了
システム内更新日: 2024-10-30 21:06:06.585819
Title: KinDEL: DNA-Encoded Library Dataset for Kinase Inhibitors
Title（参考訳）: KinDEL:KinaseインヒビターのためのDNAエンコードライブラリデータセット
Authors: Benson Chen, Tomasz Danel, Patrick J. McEnaney, Nikhil Jain, Kirill Novikov, Spurti Umesh Akki, Joshua L. Turnbull, Virja Atul Pandya, Boris P. Belotserkovskii, Jared Bryce Weaver, Ankita Biswas, Dat Nguyen, Gabriel H. S. Dreiman, Mohammad Sultan, Nathaniel Stanley, Daniel M Whalen, Divya Kanichar, Christoph Klein, Emily Fox, R. Edward Watts,
Abstract要約: KinDELは2つのキナーゼ上のDELデータセットとして初めて公開された。我々は、ヒット識別のための予測モデルを開発するために、異なる機械学習手法をベンチマークする。我々は、分子の小さなサブセット上でモデルを検証するために、オンとオフの両方で生物物理学的なアッセイデータを提供する。
参考スコア（独自算出の注目度）: 2.0179908661487986
License: http://creativecommons.org/licenses/by/4.0/
Abstract: DNA-Encoded Libraries (DEL) are combinatorial small molecule libraries that offer an efficient way to characterize diverse chemical spaces. Selection experiments using DELs are pivotal to drug discovery efforts, enabling high-throughput screens for hit finding. However, limited availability of public DEL datasets hinders the advancement of computational techniques designed to process such data. To bridge this gap, we present KinDEL, one of the first large, publicly available DEL datasets on two kinases: Mitogen-Activated Protein Kinase 14 (MAPK14) and Discoidin Domain Receptor Tyrosine Kinase 1 (DDR1). Interest in this data modality is growing due to its ability to generate extensive supervised chemical data that densely samples around select molecular structures. Demonstrating one such application of the data, we benchmark different machine learning techniques to develop predictive models for hit identification; in particular, we highlight recent structure-based probabilistic approaches. Finally, we provide biophysical assay data, both on- and off-DNA, to validate our models on a smaller subset of molecules. Data and code for our benchmarks can be found at: https://github.com/insitro/kindel.
Abstract（参考訳）: DNAエンコードライブラリ(英: DNA-Encoded Libraries、DEL)は、様々な化学空間を効率よく特徴付けるための小さな分子ライブラリーである。 DELを用いた選択実験は、薬物発見の取り組みにおいて重要なものであり、ヒット発見のための高スループットスクリーンを可能にする。しかし、パブリックなDELデータセットの可用性は限られており、そのようなデータを処理するように設計された計算技術の進歩を妨げる。このギャップを埋めるために、KinDELは、Mitogen-Activated Protein Kinase 14 (MAPK14) とDisdisoidin Domain Receptor Tyrosine Kinase 1 (DDR1) の2つのキナーゼ上で、初めて公開されたDELデータセットの1つである。このデータモダリティへの関心は、特定の分子構造の周りに密集してサンプリングする、広範囲に監督された化学データを生成する能力によって増大している。このようなデータの1つの応用を実証し、異なる機械学習手法をベンチマークし、ヒット同定のための予測モデルを開発する。最後に、生物物理学的なアッセイデータ(オン・アンド・オフ・DNA)を提供し、より小さな分子のサブセットでモデルを検証する。ベンチマークのデータとコードは、https://github.com/insitro/kindel.comで参照できます。

関連論文リスト

Private Training & Data Generation by Clustering Embeddings [74.00687214400021]
差分プライバシー(DP)は、個々のデータを保護するための堅牢なフレームワークを提供する。本稿では,DP合成画像埋め込み生成のための新しい原理的手法を提案する。経験的に、合成的に生成された埋め込みに基づいて訓練された単純な2層ニューラルネットワークは、最先端(SOTA)分類の精度を達成する。
論文参考訳（メタデータ） (2025-06-20T00:17:14Z)
DeepSeq: High-Throughput Single-Cell RNA Sequencing Data Labeling via Web Search-Augmented Agentic Generative AI Foundation Models [0.0]
生成AI基盤モデルは、構造化された生物学的データを処理するための変換ポテンシャルを提供する。本稿では,実時間Web検索を用いたエージェント基礎モデルを用いて実験データのラベル付けを自動化し,最大82.5%の精度を実現することを提案する。
論文参考訳（メタデータ） (2025-06-14T23:30:22Z)
DiffMS: Diffusion Generation of Molecules Conditioned on Mass Spectra [60.39311767532607]
DiffMSは式制限エンコーダ-デコーダ生成ネットワークである。我々は、潜伏埋め込みと分子構造を橋渡しする頑健なデコーダを開発する。実験の結果、DiffMS は $textitde novo$ 分子生成で既存のモデルより優れていることが示された。
論文参考訳（メタデータ） (2025-02-13T18:29:48Z)
GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。 DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文参考訳（メタデータ） (2025-02-11T05:39:49Z)
SemAI: Semantic Artificial Intelligence-enhanced DNA storage for Internet-of-Things [9.858497777817522]
本稿では,Semantic Artificial Intelligence-enhanced DNA Storage(SemAI-DNA)パラダイムを紹介する。数値的な結果から,SemAI-DNAの有効性が示され,従来の深層学習アプローチよりも2.61dBピーク信号-雑音比(PSNR)が向上し,構造類似度指数(SSIM)が0.13改善した。
論文参考訳（メタデータ） (2024-09-18T12:21:58Z)
Unlocking Potential Binders: Multimodal Pretraining DEL-Fusion for Denoising DNA-Encoded Libraries [51.72836644350993]
マルチモーダルプレトレーニング DEL-Fusion Model (MPDF) 我々は,異なる複合表現とそれらのテキスト記述の対比対象を適用した事前学習タスクを開発する。本稿では, 原子, 分子, 分子レベルでの複合情報をアマルガメートする新しいDEL融合フレームワークを提案する。
論文参考訳（メタデータ） (2024-09-07T17:32:21Z)
Extracting Training Data from Unconditional Diffusion Models [76.85077961718875]
拡散確率モデル(DPM)は、生成人工知能(AI)の主流モデルとして採用されている。本研究の目的は,1) 理論解析のための記憶量,2) 情報ラベルとランダムラベルを用いた条件記憶量,3) 記憶量測定のための2つのより良い評価指標を用いて,DPMにおける記憶量の理論的理解を確立することである。提案手法は,理論解析に基づいて,SIDE (textbfSurrogate condItional Data extract) と呼ばれる新しいデータ抽出手法を提案する。
論文参考訳（メタデータ） (2024-06-18T16:20:12Z)
Synthetic Data from Diffusion Models Improve Drug Discovery Prediction [1.3686993145787065]
データあいまいさは、重要な研究課題に答えようとする研究者にとって、データのキュレーションを難しくする。本稿では,リガンドおよび薬物動態データをエンドツーエンドに生成できる新しい拡散GNNモデルSyngandを提案する。我々は,AqSolDB,LD50,hERGを中心とした下流回帰タスクにおいて,Syngand生成した合成目標データの有効性について,最初の有望な結果を示した。
論文参考訳（メタデータ） (2024-05-06T19:09:37Z)
Compositional Deep Probabilistic Models of DNA Encoded Libraries [6.206196935093064]
分子表現をモノシンソン,ジシンソン,トリシンソン構造ブロックに分解するDELデータ(DEL-Compose)の合成確率モデルを提案する。本モデルでは, 基準値と比較して高い性能を示し, 適切な薬局網を充実させ, 内在的解釈可能な構造を通じて貴重な知見を提供する。
論文参考訳（メタデータ） (2023-10-20T19:04:28Z)
From Artificially Real to Real: Leveraging Pseudo Data from Large Language Models for Low-Resource Molecule Discovery [35.5507452011217]
分子発見のためのクロスモーダル技術は、しばしばデータ不足の問題に遭遇し、その性能と応用を妨げる。我々は,高品質な擬似データを構築するための検索ベースのプロンプト戦略を導入し,この擬似データを効果的に活用するための最適手法を探る。実験により、ドメイン適応のための擬似データの使用は、既存のすべてのメソッドより優れており、モデルスケールが小さく、データサイズが小さく、トレーニングコストも低いことが示されている。
論文参考訳（メタデータ） (2023-09-11T02:35:36Z)
Drug Synergistic Combinations Predictions via Large-Scale Pre-Training and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文参考訳（メタデータ） (2023-01-14T15:07:43Z)
DEL-Dock: Molecular Docking-Enabled Modeling of DNA-Encoded Libraries [1.290382979353427]
我々は、リガンドベースの記述子とドッキングされたタンパク質-リガンド複合体の3次元空間情報を組み合わせた新しいパラダイムDEL-Dockを導入する。本モデルでは,分子富化スコアを予測するために,DELカウントデータを効果的にデノベートできることを示す。
論文参考訳（メタデータ） (2022-11-30T22:00:24Z)
Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文参考訳（メタデータ） (2022-08-23T17:01:16Z)
Deep metric learning improves lab of origin prediction of genetically engineered plasmids [63.05016513788047]
遺伝工学の属性(GEA)は、配列-ラブの関連を作る能力である。本稿では,計量学習に基づいて,最も可能性の高い実験室をランク付けする手法を提案する。我々は、特定の実験室のプラスミド配列のキーシグネチャを抽出することができ、モデル出力の解釈可能な検査を可能にする。
論文参考訳（メタデータ） (2021-11-24T16:29:03Z)
Efficient approximation of DNA hybridisation using deep learning [0.0]
本研究は,DNAハイブリダイゼーションの予測に応用された機械学習手法の総合的研究である。機械学習アルゴリズムの広い範囲の使用を可能にする2.5百万以上のデータポイントの合成ハイブリッド化データセットを紹介します。
論文参考訳（メタデータ） (2021-02-19T19:23:49Z)
MIMOSA: Multi-constraint Molecule Sampling for Molecule Optimization [51.00815310242277]
生成モデルと強化学習アプローチは、最初の成功をおさめたが、複数の薬物特性を同時に最適化する上で、依然として困難に直面している。本稿では,MultI-Constraint MOlecule SAmpling (MIMOSA)アプローチ,初期推定として入力分子を用いるサンプリングフレームワーク,ターゲット分布からのサンプル分子を提案する。
論文参考訳（メタデータ） (2020-10-05T20:18:42Z)
A Systematic Approach to Featurization for Cancer Drug Sensitivity Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。 RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文参考訳（メタデータ） (2020-04-30T20:42:17Z)
Machine learning on DNA-encoded libraries: A new paradigm for hit-finding [4.473676566828977]
DEL選択データに機械学習を適用した新しい手法を示す。 DEL選択データのみを使用してモデルをトレーニングし、自動または自動化可能なフィルタを適用します。アプローチは有効であり、全体としては30本のテキストミューMで sim30% のヒット率と各ターゲットに対する強力な化合物(IC50 10 nM)の発見である。
論文参考訳（メタデータ） (2020-01-31T19:31:23Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。