論文の概要: CompassDock: Comprehensive Accurate Assessment Approach for Deep Learning-Based Molecular Docking in Inference and Fine-Tuning
- arxiv url: http://arxiv.org/abs/2406.06841v2
- Date: Tue, 01 Oct 2024 11:14:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-02 16:31:37.822064
- Title: CompassDock: Comprehensive Accurate Assessment Approach for Deep Learning-Based Molecular Docking in Inference and Fine-Tuning
- Title(参考訳): CompassDock:推論と微調整における深層学習に基づく分子ドッキングのための総合的精度評価手法
- Authors: Ahmet Sarigun, Vedran Franke, Bora Uyar, Altuna Akalin,
- Abstract要約: PDBBindデータセットの物理・化学的・生物活性特性を包括的に分析した。
Compassは、結合親和性エネルギーを計算するための新しい経験的スコア機能であるPoseCheckとAA-Scoreを統合している。
Compassには最先端のディープラーニングベースの分子ドッキング手法が組み込まれている。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Datasets used for molecular docking, such as PDBBind, contain technical variability - they are noisy. Although the origins of the noise have been discussed, a comprehensive analysis of the physical, chemical, and bioactivity characteristics of the datasets is still lacking. To address this gap, we introduce the Comprehensive Accurate Assessment (Compass). Compass integrates two key components: PoseCheck, which examines ligand strain energy, protein-ligand steric clashes, and interactions, and AA-Score, a new empirical scoring function for calculating binding affinity energy. Together, these form a unified workflow that assesses both the physical/chemical properties and bioactivity favorability of ligands and protein-ligand interactions. Our analysis of the PDBBind dataset using Compass reveals substantial noise in the ground truth data. Additionally, we propose CompassDock, which incorporates the Compass module with DiffDock, the state-of-the-art deep learning-based molecular docking method, to enable accurate assessment of docked ligands during inference. Finally, we present a new paradigm for enhancing molecular docking model performance by fine-tuning with Compass Scores, which encompass binding affinity energy, strain energy, and the number of steric clashes identified by Compass. Our results show that, while fine-tuning without Compass improves the percentage of docked poses with RMSD < 2{\AA}, it leads to a decrease in physical/chemical and bioactivity favorability. In contrast, fine-tuning with Compass shows a limited improvement in RMSD < 2{\AA} but enhances the physical/chemical and bioactivity favorability of the ligand conformation. The source code is available publicly at https://github.com/BIMSBbioinfo/CompassDock.
- Abstract(参考訳): PDBBindのような分子ドッキングに使用されるデータセットには、技術的多様性がある。
ノイズの起源については議論されているが、データセットの物理的, 化学的, 生物活性特性の包括的分析はいまだに欠落している。
このギャップに対処するため、包括的精度評価(Compass)を導入する。
コンパスは、リガンドひずみエネルギー、タンパク質-リガンド立体衝突、相互作用を調べるPoseCheckと、結合親和性エネルギーを計算するための新しい経験的スコア関数AA-Scoreの2つの重要なコンポーネントを統合する。
これらは統合されたワークフローを形成し、リガンドとタンパク質-リガンド相互作用の物理的・化学的性質と生物活性の双方を評価する。
Compass を用いた PDBBind データセットの解析により,地中真理データにかなりのノイズが現れる。
さらに,CompassモジュールとDiffDockを組み込んだCompassDockを提案する。
最後に、結合親和性エネルギー、ひずみエネルギー、およびコンパスによって同定された立体衝突の数を含むコンパススコアの微調整により分子ドッキングモデルの性能を向上させるための新しいパラダイムを提案する。
以上の結果から,コンパスなしでの微調整は,RMSD<2{\AA} によるドッキングポーズの割合を向上するが,身体・化学的・生物活性の低下につながることが示唆された。
対照的に、コンパスによる微調整はRMSD < 2{\AA} を限定的に改善するが、リガンドコンホメーションの物理的・化学的・生物活性の優位性を高める。
ソースコードはhttps://github.com/BIMSBbioinfo/CompassDockで公開されている。
関連論文リスト
- NovoBench: Benchmarking Deep Learning-based De Novo Peptide Sequencing Methods in Proteomics [58.03989832372747]
Emphde novoペプチドシークエンシングのための初となるNovoBenchベンチマークを報告する。
多様な質量スペクトルデータ、統合モデル、総合的な評価指標から構成される。
DeepNovo、PointNovo、Casanovo、InstaNovo、AdaNovo、$pi$-HelixNovoといった最近の手法が私たちのフレームワークに統合されています。
論文 参考訳(メタデータ) (2024-06-16T08:23:21Z) - MoleculeCLA: Rethinking Molecular Benchmark via Computational Ligand-Target Binding Analysis [18.940529282539842]
約140,000個の小分子からなる大規模かつ高精度な分子表現データセットを構築した。
我々のデータセットは、モデルの開発と設計をガイドするために、重要な物理化学的解釈性を提供します。
このデータセットは、分子表現学習のためのより正確で信頼性の高いベンチマークとして機能すると考えています。
論文 参考訳(メタデータ) (2024-06-13T02:50:23Z) - FREED++: Improving RL Agents for Fragment-Based Molecule Generation by
Thorough Reproduction [33.57089414199478]
強化学習(Reinforcement Learning, RL)はドッキングスコア(DS)を報奨として分子を生成するための有望なアプローチとして登場した。
我々はFREED(arXiv:2110.01219)と呼ばれる分子生成の最近のモデルを再現し、精査し、改善する
論文 参考訳(メタデータ) (2024-01-18T09:54:19Z) - SE(3)-Invariant Multiparameter Persistent Homology for Chiral-Sensitive
Molecular Property Prediction [1.534667887016089]
多パラメータ持続ホモロジー(MPPH)を用いた新しい分子指紋生成法を提案する。
この技術は、正確な分子特性予測が不可欠である薬物発見と材料科学において、かなりの重要性を持っている。
分子特性の予測における既存の最先端手法よりも優れた性能を示し,MoleculeNetベンチマークで広範囲な評価を行った。
論文 参考訳(メタデータ) (2023-12-12T09:33:54Z) - Objective-Agnostic Enhancement of Molecule Properties via Multi-Stage
VAE [1.3597551064547502]
変異オートエンコーダ(VAE)は医薬品発見の一般的な方法であり、その性能を改善するために様々なアーキテクチャやパイプラインが提案されている。
VAEアプローチは、データが高次元の周囲空間に埋め込まれた低次元多様体上にあるとき、多様体の回復不良に悩まされることが知られている。
本稿では, 合成データセット上での多様体回復を向上する多段階VAEアプローチを創薬分野に適用することを検討する。
論文 参考訳(メタデータ) (2023-08-24T20:22:22Z) - Leveraging Side Information for Ligand Conformation Generation using
Diffusion-Based Approaches [12.71967232020327]
リガンド分子コンホメーション生成は、薬物発見において重要な課題である。
この問題を解決するためにディープラーニングモデルが開発されている。
これらのモデルはしばしば、本質的な側情報がないため、意味のある構造やランダム性を欠いたコンフォメーションを生成する。
論文 参考訳(メタデータ) (2023-08-02T09:56:47Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - Optimizing Molecules using Efficient Queries from Property Evaluations [66.66290256377376]
汎用的なクエリベースの分子最適化フレームワークであるQMOを提案する。
QMOは効率的なクエリに基づいて入力分子の所望の特性を改善する。
QMOは, 有機分子を最適化するベンチマークタスクにおいて, 既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-03T18:51:18Z) - ASGN: An Active Semi-supervised Graph Neural Network for Molecular
Property Prediction [61.33144688400446]
本稿では,ラベル付き分子とラベルなし分子の両方を組み込んだ,アクティブ半教師付きグラフニューラルネットワーク(ASGN)を提案する。
教師モデルでは,分子構造や分子分布から情報を共同で活用する汎用表現を学習するための,新しい半教師付き学習手法を提案する。
最後に,分子多様性の観点から,フレームワーク学習全体を通して情報的データを選択するための新しい能動的学習戦略を提案する。
論文 参考訳(メタデータ) (2020-07-07T04:22:39Z) - Rectified Meta-Learning from Noisy Labels for Robust Image-based Plant
Disease Diagnosis [64.82680813427054]
植物病は食料安全保障と作物生産に対する主要な脅威の1つである。
1つの一般的なアプローチは、葉画像分類タスクとしてこの問題を変換し、強力な畳み込みニューラルネットワーク(CNN)によって対処できる。
本稿では,正規化メタ学習モジュールを共通CNNパラダイムに組み込んだ新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-17T09:51:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。