論文の概要: Exploring QSAR Models for Activity-Cliff Prediction
- arxiv url: http://arxiv.org/abs/2301.13644v1
- Date: Tue, 31 Jan 2023 13:56:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-01 16:31:19.295074
- Title: Exploring QSAR Models for Activity-Cliff Prediction
- Title(参考訳): アクティブ・クリフ予測のためのQSARモデルの検討
- Authors: Markus Dablander, Thierry Hanser, Renaud Lambiotte, Garrett M. Morris
- Abstract要約: 小さな構造変化によってのみ異なるが、特定の標的に対する結合親和性に大きな違いを示す類似化合物のペアは、活性崖(Activity cliffs、ACs)として知られている。
我々は3つの分子表現法(拡張結合性指紋、物理化学的記述ベクトル、グラフ同型ネットワーク)と3つの回帰法(ランダムフォレスト、k-アネレスト、多層パーセプトロン)を組み合わせることにより、9つの異なるQSARモデルを構築した。
両化合物の活性が不明な場合, 試験モデル間では交流感度が低いが, 実際の活性が低い場合には, 交流感度が著しく上昇する。
- 参考スコア(独自算出の注目度): 1.0499611180329804
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Pairs of similar compounds that only differ by a small structural
modification but exhibit a large difference in their binding affinity for a
given target are known as activity cliffs (ACs). It has been hypothesised that
quantitative structure-activity relationship (QSAR) models struggle to predict
ACs and that ACs thus form a major source of prediction error. However, a study
to explore the AC-prediction power of modern QSAR methods and its relationship
to general QSAR-prediction performance is lacking. We systematically construct
nine distinct QSAR models by combining three molecular representation methods
(extended-connectivity fingerprints, physicochemical-descriptor vectors and
graph isomorphism networks) with three regression techniques (random forests,
k-nearest neighbours and multilayer perceptrons); we then use each resulting
model to classify pairs of similar compounds as ACs or non-ACs and to predict
the activities of individual molecules in three case studies: dopamine receptor
D2, factor Xa, and SARS-CoV-2 main protease. We observe low AC-sensitivity
amongst the tested models when the activities of both compounds are unknown,
but a substantial increase in AC-sensitivity when the actual activity of one of
the compounds is given. Graph isomorphism features are found to be competitive
with or superior to classical molecular representations for AC-classification
and can thus be employed as baseline AC-prediction models or simple
compound-optimisation tools. For general QSAR-prediction, however,
extended-connectivity fingerprints still consistently deliver the best
performance. Our results provide strong support for the hypothesis that indeed
QSAR methods frequently fail to predict ACs. We propose twin-network training
for deep learning models as a potential future pathway to increase
AC-sensitivity and thus overall QSAR performance.
- Abstract(参考訳): 類似した化合物のペアは、小さな構造的修飾によってのみ異なるが、特定の標的に対する結合親和性に大きな差を示すが、アクティビティ・クリフ(acs)として知られている。
定量的構造活性相関モデル(QSAR)がACの予測に苦慮し、ACが予測誤差の主要な原因となると推測されている。
しかし, 現代のQSAR手法の交流予測能力と一般QSAR予測性能との関係について検討する研究は乏しい。
We systematically construct nine distinct QSAR models by combining three molecular representation methods (extended-connectivity fingerprints, physicochemical-descriptor vectors and graph isomorphism networks) with three regression techniques (random forests, k-nearest neighbours and multilayer perceptrons); we then use each resulting model to classify pairs of similar compounds as ACs or non-ACs and to predict the activities of individual molecules in three case studies: dopamine receptor D2, factor Xa, and SARS-CoV-2 main protease.
両化合物の活性が不明な場合, 試験モデル間での交流感度は低いが, それぞれの化合物の活性が実際に与えられると, かなりの交流感度が増大する。
グラフアイソモーフィズムの特徴は、AC分類のための古典的な分子表現と競合するか、優れていることが分かっており、したがってベースラインのAC予測モデルや単純な化合物最適化ツールとして利用することができる。
しかし、一般的なQSAR予測では、拡張接続性指紋は、常に最高のパフォーマンスを提供する。
以上の結果から,QSAR法はACの予測に失敗することが多いという仮説を強く支持する。
本稿では,交流感度の向上とQSAR全体の性能向上を目的とした,深層学習モデルのためのツインネットワークトレーニングを提案する。
関連論文リスト
- Kolmogorov-Arnold Neural Networks for High-Entropy Alloys Design [14.37149160708975]
Kolmogorov-Arnold Networks (KAN)は、最近開発されたアーキテクチャであり、入力機能の精度と解釈性の両方を改善することを目的としている。
本研究では,HEA設計のための3つの異なるデータセットを探索し,分類モデルと回帰モデルの両方に対するkanの適用を実証する。
論文 参考訳(メタデータ) (2024-10-11T01:48:47Z) - Graph Stochastic Neural Process for Inductive Few-shot Knowledge Graph Completion [63.68647582680998]
I-FKGC(inductive few-shot knowledge graph completion)と呼ばれる課題に焦点をあてる。
帰納的推論(inductive reasoning)の概念に着想を得て,I-FKGCを帰納的推論問題とした。
本稿では,仮説の連成分布をモデル化したニューラルプロセスに基づく仮説抽出器を提案する。
第2のモジュールでは、この仮説に基づいて、クエリセットのトリプルが抽出された仮説と一致するかどうかをテストするグラフアテンションベースの予測器を提案する。
論文 参考訳(メタデータ) (2024-08-03T13:37:40Z) - Optimizing OOD Detection in Molecular Graphs: A Novel Approach with Diffusion Models [71.39421638547164]
本稿では,入力分子と再構成グラフの類似性を比較する補助拡散モデルに基づくフレームワークを用いてOOD分子を検出することを提案する。
IDトレーニングサンプルの再構成に向けた生成バイアスのため、OOD分子の類似度スコアは検出を容易にするためにはるかに低い。
本研究は,PGR-MOOD(PGR-MOOD)とよばれる分子OOD検出のためのプロトタイプグラフ再構成のアプローチを開拓し,3つのイノベーションを生かした。
論文 参考訳(メタデータ) (2024-04-24T03:25:53Z) - Understanding Augmentation-based Self-Supervised Representation Learning
via RKHS Approximation and Regression [53.15502562048627]
最近の研究は、自己教師付き学習とグラフラプラシアン作用素のトップ固有空間の近似との関係を構築している。
この研究は、増強に基づく事前訓練の統計的分析に発展する。
論文 参考訳(メタデータ) (2023-06-01T15:18:55Z) - Uni-QSAR: an Auto-ML Tool for Molecular Property Prediction [15.312021665242154]
分子特性予測タスクのための強力なオートMLツールUni-QSARを提案する。
Uni-QSARは、1Dシーケンシャルトークンの分子表現学習(MRL)、2Dトポロジーグラフと3Dコンバータを事前学習モデルと組み合わせて、大規模未ラベルデータからのリッチ表現を活用する。
論文 参考訳(メタデータ) (2023-04-24T16:29:08Z) - Activity Cliff Prediction: Dataset and Benchmark [20.41770222873952]
本稿ではまず,AC予測のための大規模データセットACNetを紹介する。
ACNetは400K以上のMMP(Matched Molecular Pairs)を190のターゲットに対してキュレートする。
本稿では、深いニューラルネットワークで符号化された分子表現の予測性能を交流予測のためにベンチマークするためのベースラインフレームワークを提案する。
論文 参考訳(メタデータ) (2023-02-15T09:19:07Z) - Can Pre-trained Models Really Learn Better Molecular Representations for
AI-aided Drug Discovery? [22.921555120408907]
事前学習モデルにより抽出された表現の質を評価するために,Representation-Property Relation Analysis (RePRA) という手法を提案する。
2つのスコアは、RePRAによって検出された一般化されたACとSHを測定するように設計されている。
実験では、7つの事前学習されたモデルによって生成された10の目標タスクからの分子の表現を解析した。
論文 参考訳(メタデータ) (2022-08-21T10:05:25Z) - Improved Drug-target Interaction Prediction with Intermolecular Graph
Transformer [98.8319016075089]
本稿では,3方向トランスフォーマーアーキテクチャを用いて分子間情報をモデル化する手法を提案する。
分子間グラフ変換器(IGT)は、それぞれ、結合活性と結合ポーズ予測の2番目のベストに対して、最先端のアプローチを9.1%と20.5%で上回っている。
IGTはSARS-CoV-2に対して有望な薬物スクリーニング能力を示す。
論文 参考訳(メタデータ) (2021-10-14T13:28:02Z) - Counterfactual Samples Synthesizing and Training for Robust Visual
Question Answering [59.20766562530209]
VQAモデルは、トレーニングセットにおける表面的な言語的相関をキャプチャする傾向にある。
近年のVQA研究は、ターゲットとなるVQAモデルのトレーニングを規則化する補助的な質問専用モデルを導入している。
本稿では,新しいモデル非依存型対実サンプル合成訓練(CSST)戦略を提案する。
論文 参考訳(メタデータ) (2021-10-03T14:31:46Z) - Counterfactual Variable Control for Robust and Interpretable Question
Answering [57.25261576239862]
ディープニューラルネットワークに基づく質問応答(QA)モデルは、多くの場合、堅牢でも説明もできない。
本稿では、因果推論を用いてQAモデルのこのような突発的な「能力」を検証する。
本稿では,任意のショートカット相関を明示的に緩和する,CVC(Counterfactual Variable Control)という新しい手法を提案する。
論文 参考訳(メタデータ) (2020-10-12T10:09:05Z) - A semi-supervised learning framework for quantitative structure-activity
regression modelling [0.0]
本研究では, テスト化合物とトレーニングデータとの類似性を考慮した予測を行い, レポート選択バイアスの調整を行うことが可能であることを示す。
この手法について,GlaxoSmithKline が報告した大規模化合物の集合に関する公開構造活性データを用いて述べる。
論文 参考訳(メタデータ) (2020-01-07T07:56:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。