論文の概要: ToDD: Topological Compound Fingerprinting in Computer-Aided Drug
Discovery
- arxiv url: http://arxiv.org/abs/2211.03808v1
- Date: Mon, 7 Nov 2022 19:00:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-09 15:45:14.472893
- Title: ToDD: Topological Compound Fingerprinting in Computer-Aided Drug
Discovery
- Title(参考訳): ToDD:コンピュータ支援ドラッグ発見におけるトポロジカル化合物フィンガープリント
- Authors: Andac Demir, Baris Coskunuzer, Ignacio Segovia-Dominguez, Yuzhou Chen,
Yulia Gel, Bulent Kiziltan
- Abstract要約: コンピュータ支援薬物発見(CADD)において、仮想スクリーニングは、化合物の大きなライブラリーにおいて分子標的に結合する可能性が最も高い薬物候補を特定するために用いられる。
この問題に対処するため,多次元ベクトルとして化合物のトポロジ的指紋を生成する多パラメータ持続性(MP)ホモロジーを用いた新しい手法を開発した。
プレトレーニングトトリプルトネットワークのマージン損失の微調整は, 組込み空間における化合物の相違や, 有効な薬物候補になる可能性のランク付けにおいて, 高い競争力を発揮することを示す。
- 参考スコア(独自算出の注目度): 8.620443111346523
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In computer-aided drug discovery (CADD), virtual screening (VS) is used for
identifying the drug candidates that are most likely to bind to a molecular
target in a large library of compounds. Most VS methods to date have focused on
using canonical compound representations (e.g., SMILES strings, Morgan
fingerprints) or generating alternative fingerprints of the compounds by
training progressively more complex variational autoencoders (VAEs) and graph
neural networks (GNNs). Although VAEs and GNNs led to significant improvements
in VS performance, these methods suffer from reduced performance when scaling
to large virtual compound datasets. The performance of these methods has shown
only incremental improvements in the past few years. To address this problem,
we developed a novel method using multiparameter persistence (MP) homology that
produces topological fingerprints of the compounds as multidimensional vectors.
Our primary contribution is framing the VS process as a new topology-based
graph ranking problem by partitioning a compound into chemical substructures
informed by the periodic properties of its atoms and extracting their
persistent homology features at multiple resolution levels. We show that the
margin loss fine-tuning of pretrained Triplet networks attains highly
competitive results in differentiating between compounds in the embedding space
and ranking their likelihood of becoming effective drug candidates. We further
establish theoretical guarantees for the stability properties of our proposed
MP signatures, and demonstrate that our models, enhanced by the MP signatures,
outperform state-of-the-art methods on benchmark datasets by a wide and highly
statistically significant margin (e.g., 93% gain for Cleves-Jain and 54% gain
for DUD-E Diverse dataset).
- Abstract(参考訳): コンピュータ支援薬物発見(CADD)において、仮想スクリーニング(VS)は、化合物の大きなライブラリーにおいて分子標的に結合する可能性が最も高い薬物候補を特定するために用いられる。
これまでのVSのほとんどの手法は、標準化合物表現(SMILES文字列、モーガン指紋など)の使用や、より複雑な変分オートエンコーダ(VAE)とグラフニューラルネットワーク(GNN)の訓練によって、化合物の代替指紋の生成に重点を置いてきた。
VAEとGNNはVSのパフォーマンスを大幅に改善したが、これらのメソッドは大規模な仮想複合データセットへのスケーリング時のパフォーマンス低下に悩まされている。
これらの手法のパフォーマンスは、過去数年間で漸進的な改善しか示していない。
この問題に対処するため,多次元ベクトルとして化合物のトポロジ的指紋を生成する多パラメータ持続性(MP)ホモロジーを用いた新しい手法を開発した。
我々の主要な貢献は、原子の周期的性質から情報を得た化合物を化学サブ構造に分割し、それらの持続的ホモロジー特徴を複数の解像度レベルで抽出することで、vsプロセスを新しいトポロジーベースのグラフランキング問題としてフレーミングすることである。
プレトレーニングトトリプルトネットワークのマージン損失微調整は, 組込み空間における化合物の相違や, 有効な薬物候補になる可能性のランク付けにおいて, 高い競争力を発揮することを示す。
さらに、提案MPシグネチャの安定性に関する理論的保証を確立し、MPシグネチャによって強化された我々のモデルが、幅広い統計的に有意な差(例えば、Cleves-Jainの93%、DUD-E Diverseの54%の利得)でベンチマークデータセットの最先端手法より優れていることを示す。
関連論文リスト
- Teaching MLPs to Master Heterogeneous Graph-Structured Knowledge for Efficient and Accurate Inference [53.38082028252104]
我々はHGNNの優れた性能とリレーショナルの効率的な推論を組み合わせたHG2MとHG2M+を紹介する。
HG2Mは直接、教師HGNNの入力とソフトラベルをターゲットとしてノード特徴を持つ生徒を訓練する。
HG2Mは、大規模IGB-3M-19データセット上でのHGNNよりも379.24$timesの速度アップを示す。
論文 参考訳(メタデータ) (2024-11-21T11:39:09Z) - Unlocking Potential Binders: Multimodal Pretraining DEL-Fusion for Denoising DNA-Encoded Libraries [51.72836644350993]
マルチモーダルプレトレーニング DEL-Fusion Model (MPDF)
我々は,異なる複合表現とそれらのテキスト記述の対比対象を適用した事前学習タスクを開発する。
本稿では, 原子, 分子, 分子レベルでの複合情報をアマルガメートする新しいDEL融合フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-07T17:32:21Z) - Heterogenous Memory Augmented Neural Networks [84.29338268789684]
ニューラルネットワークのための新しいヘテロジニアスメモリ拡張手法を提案する。
学習可能なメモリトークンをアテンション機構付きで導入することにより、膨大な計算オーバーヘッドを伴わずに性能を効果的に向上させることができる。
In-distriion (ID) と Out-of-distriion (OOD) の両方の条件下での様々な画像およびグラフベースのタスクに対するアプローチを示す。
論文 参考訳(メタデータ) (2023-10-17T01:05:28Z) - ADMET property prediction through combinations of molecular fingerprints [0.0]
ランダムフォレスト(ランダムフォレスト)またはサポートベクターマシン(サポートベクターマシン)は、最近開発された手法より一貫して優れている。
回帰アルゴリズムと分子指紋の詳細な研究により、勾配型決定木が明らかになった。
私たちは22のTherapeutics Data Commons ADMETベンチマークでモデルを検証しました。
論文 参考訳(メタデータ) (2023-09-29T22:39:18Z) - Boosting Convolution with Efficient MLP-Permutation for Volumetric
Medical Image Segmentation [32.645022002807416]
マルチレイヤパーセプトロン(MLP)ネットワークは、ViTに匹敵する結果により、研究者の間で人気を取り戻している。
本稿では,コンボリューションニューラルネットワーク(CNN)とPHNetの両方の長所を活かしたPHNetという,Vol-MedSeg用の新しい可変ハイブリッドネットワークを提案する。
論文 参考訳(メタデータ) (2023-03-23T08:59:09Z) - Modality-Agnostic Variational Compression of Implicit Neural
Representations [96.35492043867104]
Inlicit Neural Representation (INR) としてパラメータ化されたデータの関数的ビューに基づくモーダリティ非依存型ニューラル圧縮アルゴリズムを提案する。
潜時符号化と疎性の間のギャップを埋めて、ソフトゲーティング機構に非直線的にマッピングされたコンパクト潜時表現を得る。
このような潜在表現のデータセットを得た後、ニューラル圧縮を用いてモーダリティ非依存空間におけるレート/歪みトレードオフを直接最適化する。
論文 参考訳(メタデータ) (2023-01-23T15:22:42Z) - Pharmacoprint -- a combination of pharmacophore fingerprint and
artificial intelligence as a tool for computer-aided drug design [6.053347262128918]
我々はPharmacoprintと呼ばれる高分解能の医薬品用指紋を提案する。
分子の存在、型、および分子の薬理泳動の特徴の間の関係をコードする。
論文 参考訳(メタデータ) (2021-10-04T11:36:39Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z) - DeepGS: Deep Representation Learning of Graphs and Sequences for
Drug-Target Binding Affinity Prediction [8.292330541203647]
本稿では、ディープニューラルネットワークを用いて、アミノ酸やSMILES配列から局所的な化学コンテキストを抽出する、DeepGSと呼ばれる新しいエンドツーエンド学習フレームワークを提案する。
我々は提案手法を,KronRLS,Sim,DeepDTA,DeepCPIといった最先端モデルと比較するための広範な実験を行った。
論文 参考訳(メタデータ) (2020-03-31T01:35:39Z) - Adversarial Feature Hallucination Networks for Few-Shot Learning [84.31660118264514]
Adversarial Feature Hallucination Networks (AFHN) は条件付き Wasserstein Generative Adversarial Network (cWGAN) に基づいている。
合成された特徴の識別性と多様性を促進するために、2つの新規レギュレータがAFHNに組み込まれている。
論文 参考訳(メタデータ) (2020-03-30T02:43:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。