論文の概要: Insights into performance evaluation of com-pound-protein interaction
prediction methods
- arxiv url: http://arxiv.org/abs/2202.00001v1
- Date: Fri, 28 Jan 2022 20:07:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-05 07:35:36.647500
- Title: Insights into performance evaluation of com-pound-protein interaction
prediction methods
- Title(参考訳): com-pound-protein相互作用予測法の性能評価に関する知見
- Authors: Adiba Yaseen (1), Imran Amin (2), Naeem Akhter (1), Asa Ben-Hur (3)
and Fayyaz Minhas (4) ((1) Department of Computer and Information Sciences
(DCIS), Pakistan Institute of Engineering and Applied Sciences (PIEAS),
Islamabad, Pakistan,(2) National Institute for Biotechnology and Genetic
Engineering, Faisalabad, Pakistan,(3) Department of Computer Science,
Colorado State University, Fort Collins, USA (4) Tissue Image Analytics
Centre, Department of Computer Science, University of Warwick, Coven-try, UK)
- Abstract要約: 複合タンパク質相互作用(CPI)の機械学習による予測は、薬物設計、スクリーニング、再資源化研究において重要である。
我々は、モデル性能の楽観的な推定に繋がる実験設計において、多くの基本的な問題を観察してきた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Motivation: Machine learning based prediction of compound-protein
interactions (CPIs) is important for drug design, screening and repurposing
studies and can improve the efficiency and cost-effectiveness of wet lab
assays. Despite the publication of many research papers reporting CPI
predictors in the recent years, we have observed a number of fundamental issues
in experiment design that lead to over optimistic estimates of model
performance. Results: In this paper, we analyze the impact of several important
factors affecting generalization perfor-mance of CPI predictors that are
overlooked in existing work: 1. Similarity between training and test examples
in cross-validation 2. The strategy for generating negative examples, in the
absence of experimentally verified negative examples. 3. Choice of evaluation
protocols and performance metrics and their alignment with real-world use of
CPI predictors in screening large compound libraries. Using both an existing
state-of-the-art method (CPI-NN) and a proposed kernel based approach, we have
found that assessment of predictive performance of CPI predictors requires
careful con-trol over similarity between training and test examples. We also
show that random pairing for gen-erating synthetic negative examples for
training and performance evaluation results in models with better
generalization performance in comparison to more sophisticated strategies used
in existing studies. Furthermore, we have found that our kernel based approach,
despite its simple design, exceeds the prediction performance of CPI-NN. We
have used the proposed model for compound screening of several proteins
including SARS-CoV-2 Spike and Human ACE2 proteins and found strong evidence in
support of its top hits. Availability: Code and raw experimental results
available at https://github.com/adibayaseen/HKRCPI Contact:
Fayyaz.minhas@warwick.ac.uk
- Abstract(参考訳): モチベーション: 複合タンパク質相互作用(CPI)の機械学習による予測は, 薬物設計, スクリーニング, 再資源化研究において重要であり, 湿式ラボアッセイの効率性と費用対効果を向上させることができる。
近年,cpi予測因子を報告する多くの研究論文が公表されているが,モデル性能の楽観的評価に繋がる実験設計の問題点が数多く報告されている。
結果:本論文では,既存の研究で見落としているCPI予測器の一般化に影響を及ぼすいくつかの重要な要因について分析する。
クロスバリデーションにおけるトレーニングとテスト例の類似性
2. 実験的に検証された否定例がない場合に、否定例を生成するための戦略。
3. 評価プロトコルと性能指標の選択と大規模複合ライブラリのスクリーニングにおけるCPI予測器の現実利用との整合性
既存の最先端手法(CPI-NN)とカーネルベースのアプローチの両方を用いて、CPI予測器の予測性能の評価には、トレーニングとテスト例の類似性について慎重に検討する必要があることが分かった。
また、訓練や性能評価のための合成陰性例生成のためのランダムペアリングは、既存の研究で使われているより洗練された戦略と比較して、より一般化された性能を持つモデルに結果をもたらすことを示した。
さらに、カーネルベースのアプローチは、そのシンプルな設計にもかかわらず、CPI-NNの予測性能を上回ることが判明した。
提案したモデルを用いてSARS-CoV-2 SpikeやHuman ACE2などのタンパク質の複合スクリーニングを行い,そのトップヒットを裏付ける強い証拠を見出した。
可用性: https://github.com/adibayaseen/HKRCPI Contact: Fayyaz.minhas@warwick.ac.uk
関連論文リスト
- C-XGBoost: A tree boosting model for causal effect estimation [8.246161706153805]
因果効果推定は、平均処理効果と、治療の条件平均処理効果を、利用可能なデータから得られる結果に推定することを目的としている。
本稿では,C-XGBoost という新たな因果推論モデルを提案する。
論文 参考訳(メタデータ) (2024-03-31T17:43:37Z) - The Mirrored Influence Hypothesis: Efficient Data Influence Estimation by Harnessing Forward Passes [30.30769701138665]
我々は、訓練データとテストデータの間の相互影響を浮き彫りにして、ミラーレッド影響仮説を導入し、探求する。
具体的には、テスト予測に対するトレーニングデータの影響を評価することは、等価だが逆問題として再定義することができることを示唆している。
トレーニングポイント毎に前方パスとペアを組むことで,特定のテストサンプルの勾配を計算し,トレーニングデータの影響を推定する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-02-14T03:43:05Z) - Measuring and Improving Attentiveness to Partial Inputs with
Counterfactuals [95.5442607785241]
我々は,新しい評価手法であるCAT(Facterfactual Attentiveness Test)を提案する。
CATは、入力の一部を別の例から別の例に置き換えることで、予測を変更する注意深いモデルを期待することで、反事実を使用する。
実験データの精度が向上する一方, GPT3 は実演回数の増加により注意力の低下がみられた。
論文 参考訳(メタデータ) (2023-11-16T06:27:35Z) - On the Theories Behind Hard Negative Sampling for Recommendation [51.64626293229085]
ハードネガティブサンプリング(HNS)を効果的に活用するための2つの洞察に富んだガイドラインを提供する。
パーソナライズされたランク付け(BPR)学習者におけるHNSの利用は、一方通行部分AUC(OPAUC)の最適化と等価であることを示す。
これらの分析は、初めてトップKレコメンデーションパフォーマンスを最適化するHNSの理論的基盤を確立する。
論文 参考訳(メタデータ) (2023-02-07T13:57:03Z) - Towards Robust Visual Question Answering: Making the Most of Biased
Samples via Contrastive Learning [54.61762276179205]
我々は,ビザドサンプルを最大限に活用することで,ロバストなVQAモデルを構築するための新しいコントラスト学習手法 MMBS を提案する。
具体的には、元のトレーニングサンプルからスプリアス相関に関連する情報を排除し、比較学習のための正のサンプルを構築する。
我々は,OODデータセットのVQA-CP v2において,IDデータセットのVQA v2上での堅牢なパフォーマンスを維持しながら,競争性能を達成することで,コントリビューションを検証した。
論文 参考訳(メタデータ) (2022-10-10T11:05:21Z) - A Supervised Machine Learning Approach for Sequence Based
Protein-protein Interaction (PPI) Prediction [4.916874464940376]
計算タンパク質間相互作用(PPI)予測技術は、時間、コスト、偽陽性相互作用の低減に大きく貢献する。
提案したソリューションをSeqPIPコンペティションの結果とともに紹介した。
論文 参考訳(メタデータ) (2022-03-23T18:27:25Z) - ACP++: Action Co-occurrence Priors for Human-Object Interaction
Detection [102.9428507180728]
ヒューマン・オブジェクト・インタラクション(HOI)検出のタスクにおける一般的な問題は、多数のHOIクラスが少数のラベル付き例しか持たないことである。
我々は、人間と物体の相互作用の間に自然の相関関係と反相関が存在することを観察した。
我々は、これらの先行知識を学習し、特に稀なクラスにおいて、より効果的な訓練に活用する手法を提案する。
論文 参考訳(メタデータ) (2021-09-09T06:02:50Z) - Practical Assessment of Generalization Performance Robustness for Deep
Networks via Contrastive Examples [36.50563671470897]
データ変換を伴うトレーニング画像は、ディープニューラルネットワーク(DNN)の一般化性能評価のためのテストセットを補完する対照的な例として提案されている。
そこで本研究では,DNN ジーンラリゼーション性能推定のためのコントラスト例を用いた実践的フレームワーク ContRE を提案する。
論文 参考訳(メタデータ) (2021-06-20T08:46:01Z) - Performance Evaluation of Adversarial Attacks: Discrepancies and
Solutions [51.8695223602729]
機械学習モデルの堅牢性に挑戦するために、敵対攻撃方法が開発されました。
本稿では,Piece-wise Sampling Curving(PSC)ツールキットを提案する。
psc toolkitは計算コストと評価効率のバランスをとるオプションを提供する。
論文 参考訳(メタデータ) (2021-04-22T14:36:51Z) - Double Robust Representation Learning for Counterfactual Prediction [68.78210173955001]
そこで本稿では, 対実予測のための2次ロバスト表現を学習するための, スケーラブルな新しい手法を提案する。
我々は、個々の治療効果と平均的な治療効果の両方に対して、堅牢で効率的な対実的予測を行う。
このアルゴリズムは,実世界の最先端技術と合成データとの競合性能を示す。
論文 参考訳(メタデータ) (2020-10-15T16:39:26Z) - Fisher-Schultz Lecture: Generic Machine Learning Inference on
Heterogenous Treatment Effects in Randomized Experiments, with an Application
to Immunization in India [3.3449509626538543]
ランダム化実験における異種効果の重要な特徴を推定し,推定する手法を提案する。
主な特徴は、機械学習プロキシを使用した効果の最良の線形予測器、インパクトグループによってソートされた平均効果、および最も最も最も影響の少ないユニットの平均特性である。
論文 参考訳(メタデータ) (2017-12-13T14:47:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。