論文の概要: Unlocking Potential Binders: Multimodal Pretraining DEL-Fusion for Denoising DNA-Encoded Libraries
- arxiv url: http://arxiv.org/abs/2409.05916v1
- Date: Sat, 7 Sep 2024 17:32:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-11 22:10:02.841620
- Title: Unlocking Potential Binders: Multimodal Pretraining DEL-Fusion for Denoising DNA-Encoded Libraries
- Title(参考訳): アンロック電位バインダー:DNAエンコードライブラリーのマルチモーダルプレトレーニングDELフュージョン
- Authors: Chunbin Gu, Mutian He, Hanqun Cao, Guangyong Chen, Chang-yu Hsieh, Pheng Ann Heng,
- Abstract要約: マルチモーダルプレトレーニング DEL-Fusion Model (MPDF)
我々は,異なる複合表現とそれらのテキスト記述の対比対象を適用した事前学習タスクを開発する。
本稿では, 原子, 分子, 分子レベルでの複合情報をアマルガメートする新しいDEL融合フレームワークを提案する。
- 参考スコア(独自算出の注目度): 51.72836644350993
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the realm of drug discovery, DNA-encoded library (DEL) screening technology has emerged as an efficient method for identifying high-affinity compounds. However, DEL screening faces a significant challenge: noise arising from nonspecific interactions within complex biological systems. Neural networks trained on DEL libraries have been employed to extract compound features, aiming to denoise the data and uncover potential binders to the desired therapeutic target. Nevertheless, the inherent structure of DEL, constrained by the limited diversity of building blocks, impacts the performance of compound encoders. Moreover, existing methods only capture compound features at a single level, further limiting the effectiveness of the denoising strategy. To mitigate these issues, we propose a Multimodal Pretraining DEL-Fusion model (MPDF) that enhances encoder capabilities through pretraining and integrates compound features across various scales. We develop pretraining tasks applying contrastive objectives between different compound representations and their text descriptions, enhancing the compound encoders' ability to acquire generic features. Furthermore, we propose a novel DEL-fusion framework that amalgamates compound information at the atomic, submolecular, and molecular levels, as captured by various compound encoders. The synergy of these innovations equips MPDF with enriched, multi-scale features, enabling comprehensive downstream denoising. Evaluated on three DEL datasets, MPDF demonstrates superior performance in data processing and analysis for validation tasks. Notably, MPDF offers novel insights into identifying high-affinity molecules, paving the way for improved DEL utility in drug discovery.
- Abstract(参考訳): 薬物発見の領域では、DNAエンコードライブラリー(DEL)スクリーニング技術が高親和性化合物を同定するための効率的な方法として登場した。
しかし、DELスクリーニングは、複雑な生物学的システム内の非特異的相互作用から生じるノイズという大きな課題に直面している。
DELライブラリーでトレーニングされたニューラルネットワークは、複合的な特徴を抽出するために使われ、データをノイズ化し、望まれる治療対象に対する潜在的なバインダーを明らかにすることを目的としている。
それでも、ブロックの多様性に制約されたDELの固有の構造は、複合エンコーダの性能に影響を及ぼす。
さらに,既存手法は複合的特徴を単一レベルでのみ捕捉し,デノナイジング戦略の有効性を制限している。
これらの問題を緩和するために,多モード事前学習型DEL-Fusionモデル (MPDF) を提案する。
本研究では,異なる複合表現とそれらのテキスト記述の対比対象を適用した事前学習タスクを開発し,複合エンコーダの汎用的特徴獲得能力を向上させる。
さらに, 種々の化合物エンコーダによって捕捉される原子, 分子, 分子レベルでの複合情報をアマルガメートする新しいDEL融合フレームワークを提案する。
これらのイノベーションの相乗効果は、リッチでマルチスケールな機能を備えたMDPを装備し、包括的な下流のデノーミングを可能にしている。
3つのDELデータセットに基づいて評価し、MDPは検証タスクのデータ処理および分析において優れた性能を示す。
特に、MDPは高親和性分子の同定に関する新しい知見を提供し、薬物発見におけるDELの有用性を改善する道を開く。
関連論文リスト
- DiffMS: Diffusion Generation of Molecules Conditioned on Mass Spectra [60.39311767532607]
DiffMSは式制限エンコーダ-デコーダ生成ネットワークである。
我々は、潜伏埋め込みと分子構造を橋渡しする頑健なデコーダを開発する。
実験の結果、DiffMS は $textitde novo$ 分子生成で既存のモデルより優れていることが示された。
論文 参考訳(メタデータ) (2025-02-13T18:29:48Z) - ITCFN: Incomplete Triple-Modal Co-Attention Fusion Network for Mild Cognitive Impairment Conversion Prediction [12.893857146169045]
アルツハイマー病(英語: Alzheimer's disease、AD)は、高齢者の神経変性疾患である。
軽度認知障害(MCI)の早期予測と時間的介入は、ADに進むリスクを減少させる可能性がある。
論文 参考訳(メタデータ) (2025-01-20T05:12:31Z) - MRGen: Diffusion-based Controllable Data Engine for MRI Segmentation towards Unannotated Modalities [59.61465292965639]
本稿では,医療応用における生成モデルを活用するための新しいパラダイムについて検討する。
本稿では,テキストプロンプトとマスクに条件付き生成を可能にするMRGenという拡散型データエンジンを提案する。
論文 参考訳(メタデータ) (2024-12-04T16:34:22Z) - Binary Code Similarity Detection via Graph Contrastive Learning on Intermediate Representations [52.34030226129628]
バイナリコード類似度検出(BCSD)は、脆弱性検出、マルウェア分析、コードの再利用識別など、多くの分野で重要な役割を果たしている。
本稿では,LLVM-IRと高レベルのセマンティック抽象化を利用して,コンパイル差を緩和するIRBinDiffを提案する。
IRBinDiffは1対1の比較と1対多の検索シナリオにおいて,他の主要なBCSD手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-10-24T09:09:20Z) - DEL-Ranking: Ranking-Correction Denoising Framework for Elucidating Molecular Affinities in DNA-Encoded Libraries [43.47251247740565]
DNAエンコードライブラリ(DEL)スクリーニングは、読み取りカウントによるタンパク質-リガンド相互作用の検出に革命をもたらした。
読み取りカウントのノイズは 特定の相互作用から生じる この探索プロセスを誤解させる可能性がある
DEL-Rankingは,これらの課題に対処する分布補正手法である。
論文 参考訳(メタデータ) (2024-10-19T02:32:09Z) - Memory-efficient High-resolution OCT Volume Synthesis with Cascaded Amortized Latent Diffusion Models [48.87160158792048]
本稿では,高分解能CTボリュームをメモリ効率よく合成できるCA-LDM(Cascaded amortized Latent diffusion model)を提案する。
公開高解像度OCTデータセットを用いた実験により、我々の合成データは、既存の手法の能力を超越した、現実的な高解像度かつグローバルな特徴を持つことが示された。
論文 参考訳(メタデータ) (2024-05-26T10:58:22Z) - FORESEE: Multimodal and Multi-view Representation Learning for Robust Prediction of Cancer Survival [3.4686401890974197]
マルチモーダル情報のマイニングにより患者生存を確実に予測する新しいエンドツーエンドフレームワークFOESEEを提案する。
クロスフュージョントランスフォーマーは、細胞レベル、組織レベル、腫瘍の不均一度レベルの特徴を効果的に利用し、予後を相関させる。
ハイブリットアテンションエンコーダ(HAE)は、コンテキストアテンションモジュールを用いて、コンテキスト関係の特徴を取得する。
また、モダリティ内の損失情報を再構成する非対称マスク型3重マスク型オートエンコーダを提案する。
論文 参考訳(メタデータ) (2024-05-13T12:39:08Z) - Compositional Deep Probabilistic Models of DNA Encoded Libraries [6.206196935093064]
分子表現をモノシンソン,ジシンソン,トリシンソン構造ブロックに分解するDELデータ(DEL-Compose)の合成確率モデルを提案する。
本モデルでは, 基準値と比較して高い性能を示し, 適切な薬局網を充実させ, 内在的解釈可能な構造を通じて貴重な知見を提供する。
論文 参考訳(メタデータ) (2023-10-20T19:04:28Z) - ToDD: Topological Compound Fingerprinting in Computer-Aided Drug
Discovery [8.620443111346523]
コンピュータ支援薬物発見(CADD)において、仮想スクリーニングは、化合物の大きなライブラリーにおいて分子標的に結合する可能性が最も高い薬物候補を特定するために用いられる。
この問題に対処するため,多次元ベクトルとして化合物のトポロジ的指紋を生成する多パラメータ持続性(MP)ホモロジーを用いた新しい手法を開発した。
プレトレーニングトトリプルトネットワークのマージン損失の微調整は, 組込み空間における化合物の相違や, 有効な薬物候補になる可能性のランク付けにおいて, 高い競争力を発揮することを示す。
論文 参考訳(メタデータ) (2022-11-07T19:00:05Z) - Neural networks for Anatomical Therapeutic Chemical (ATC) [83.73971067918333]
両方向の長期記憶ネットワーク(BiLSTM)から抽出された集合を含む、特徴の異なるセットで訓練された複数の複数ラベル分類器を組み合わせることを提案する。
実験はこのアプローチのパワーを実証し、文献で報告された最良の手法よりも優れていることを示した。
論文 参考訳(メタデータ) (2021-01-22T19:49:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。