論文の概要: DrugCLIP: Contrastive Protein-Molecule Representation Learning for
Virtual Screening
- arxiv url: http://arxiv.org/abs/2310.06367v1
- Date: Tue, 10 Oct 2023 07:08:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-11 18:42:13.491481
- Title: DrugCLIP: Contrastive Protein-Molecule Representation Learning for
Virtual Screening
- Title(参考訳): drugclip: 仮想スクリーニングのためのコントラストタンパク質-分子表現学習
- Authors: Bowen Gao, Bo Qiang, Haichuan Tan, Minsi Ren, Yinjun Jia, Minsi Lu,
Jingjing Liu, Weiying Ma, Yanyan Lan
- Abstract要約: DrugCLIPは、仮想スクリーニングのための新しい対照的な学習フレームワークである。
明示的な結合親和性スコアなしで、大量のペアデータから結合タンパク質ポケットと分子の表現を調整できる。
様々な仮想スクリーニングベンチマークにおいて、従来のドッキングや教師あり学習方法よりも大幅に優れています。
- 参考スコア(独自算出の注目度): 16.31607535765497
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Virtual screening, which identifies potential drugs from vast compound
databases to bind with a particular protein pocket, is a critical step in
AI-assisted drug discovery. Traditional docking methods are highly
time-consuming, and can only work with a restricted search library in real-life
applications. Recent supervised learning approaches using scoring functions for
binding-affinity prediction, although promising, have not yet surpassed docking
methods due to their strong dependency on limited data with reliable
binding-affinity labels. In this paper, we propose a novel contrastive learning
framework, DrugCLIP, by reformulating virtual screening as a dense retrieval
task and employing contrastive learning to align representations of binding
protein pockets and molecules from a large quantity of pairwise data without
explicit binding-affinity scores. We also introduce a biological-knowledge
inspired data augmentation strategy to learn better protein-molecule
representations. Extensive experiments show that DrugCLIP significantly
outperforms traditional docking and supervised learning methods on diverse
virtual screening benchmarks with highly reduced computation time, especially
in zero-shot setting.
- Abstract(参考訳): 仮想スクリーニングは、大量の複合データベースから特定のタンパク質ポケットに結合する可能性のある薬物を識別する。
従来のドッキング手法は非常に時間がかかり、リアルタイムアプリケーションでは限定的な検索ライブラリでしか動作しない。
バインディング-アフィニティ予測のためのスコアリング関数を用いた最近の教師付き学習アプローチは、有望ではあるが、信頼できるバインディング-アフィニティラベルを持つ限られたデータに強く依存しているため、ドッキングメソッドを超えていない。
本稿では,仮想スクリーニングを高密度検索タスクとして再構成し,結合タンパク質ポケットや分子の表現を明示的な結合親和性スコアを伴わずに多量のペアデータから整列させるコントラスト学習手法であるD薬CLIPを提案する。
また,生物知識に基づくデータ拡張戦略を導入し,より優れたタンパク質分子表現を学習する。
大規模な実験では、特にゼロショット設定において、DragonCLIPは計算時間を大幅に削減した様々な仮想スクリーニングベンチマークにおいて、従来のドッキングおよび教師付き学習手法よりも大幅に優れていた。
関連論文リスト
- Understanding active learning of molecular docking and its applications [0.6554326244334868]
本研究では,2次元構造のみを用いて,能動的学習手法がドッキングスコアを効果的に予測する方法を検討する。
以上の結果から,サロゲートモデルではドッキング量の高い化合物に代表される構造パターンを記憶する傾向が示唆された。
我々の総合的な分析は、仮想スクリーニングキャンペーンにおけるアクティブラーニング手法の信頼性と潜在的な適用可能性を示している。
論文 参考訳(メタデータ) (2024-06-14T05:43:42Z) - ContraNovo: A Contrastive Learning Approach to Enhance De Novo Peptide
Sequencing [70.12220342151113]
ContraNovoは、コントラスト学習を利用してスペクトルとペプチドの関係を抽出する先駆的アルゴリズムである。
ContraNovoは、現代最先端のソリューションを一貫して誇張している。
論文 参考訳(メタデータ) (2023-12-18T12:49:46Z) - PIGNet2: A Versatile Deep Learning-based Protein-Ligand Interaction
Prediction Model for Binding Affinity Scoring and Virtual Screening [0.0]
タンパク質-リガンド相互作用の予測(PLI)は、薬物発見において重要な役割を果たす。
結合親和性を正確に評価し、効率的な仮想スクリーニングを行う汎用モデルの開発は依然として課題である。
本稿では、物理インフォームドグラフニューラルネットワークと組み合わせて、新しいデータ拡張戦略を導入することにより、実現可能なソリューションを提案する。
論文 参考訳(メタデータ) (2023-07-03T14:46:49Z) - HaLP: Hallucinating Latent Positives for Skeleton-based Self-Supervised
Learning of Actions [69.14257241250046]
ラベルなしの骨格に基づく行動認識のためのモデル学習のための新しいコントラスト学習手法を提案する。
私たちの重要な貢献は、単純なモジュールであるHalucinate Latent Positivesのコントラスト学習へのHalucinate HaLPです。
実験を通して、標準のコントラスト学習フレームワーク内でこれらの生成した正を使用すれば、一貫した改善がもたらされることを示す。
論文 参考訳(メタデータ) (2023-04-01T21:09:43Z) - DEL-Dock: Molecular Docking-Enabled Modeling of DNA-Encoded Libraries [1.290382979353427]
我々は、リガンドベースの記述子とドッキングされたタンパク質-リガンド複合体の3次元空間情報を組み合わせた新しいパラダイムDEL-Dockを導入する。
本モデルでは,分子富化スコアを予測するために,DELカウントデータを効果的にデノベートできることを示す。
論文 参考訳(メタデータ) (2022-11-30T22:00:24Z) - Few-Shot Learning for Biometric Verification [2.3226893628361682]
機械学習アプリケーションでは、できるだけ多くの情報を供給することが一般的である。ほとんどの場合、モデルはより正確に予測できる大規模なデータセットを扱うことができる。
本稿では,Few-Shot 学習手法による最先端のアキュラシーと比較し,バイオメトリックスデータの検証を行う,新しいエンドツーエンド軽量アーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-11-12T22:49:25Z) - SSM-DTA: Breaking the Barriers of Data Scarcity in Drug-Target Affinity
Prediction [127.43571146741984]
薬物標的親和性(DTA)は、早期の薬物発見において極めて重要である。
湿式実験は依然として最も信頼性の高い方法であるが、時間と資源が集中している。
既存の手法は主に、データ不足の問題に適切に対処することなく、利用可能なDTAデータに基づく技術開発に重点を置いている。
SSM-DTAフレームワークについて述べる。
論文 参考訳(メタデータ) (2022-06-20T14:53:25Z) - Federated Cycling (FedCy): Semi-supervised Federated Learning of
Surgical Phases [57.90226879210227]
FedCyは、FLと自己教師付き学習を組み合わせた半教師付き学習(FSSL)手法で、ラベル付きビデオとラベルなしビデオの両方の分散データセットを利用する。
外科的段階の自動認識作業において,最先端のFSSL法よりも顕著な性能向上を示した。
論文 参考訳(メタデータ) (2022-03-14T17:44:53Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z) - Deep Learning for Virtual Screening: Five Reasons to Use ROC Cost
Functions [80.12620331438052]
深層学習は サイリコの何十億もの分子を 迅速にスクリーニングする 重要なツールとなりました
その重要性にもかかわらず、厳密なクラス不均衡、高い決定しきい値、いくつかのデータセットにおける基底真理ラベルの欠如など、これらのモデルのトレーニングにおいて重大な課題が続いている。
このような場合、クラス不均衡に対するロバスト性から、レシーバ動作特性(ROC)を直接最適化することを好んで論じる。
論文 参考訳(メタデータ) (2020-06-25T08:46:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。