論文の概要: Development and Evaluation of Conformal Prediction Methods for QSAR
- arxiv url: http://arxiv.org/abs/2304.00970v1
- Date: Mon, 3 Apr 2023 13:41:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-04 15:22:44.990582
- Title: Development and Evaluation of Conformal Prediction Methods for QSAR
- Title(参考訳): QSARのための等角予測手法の開発と評価
- Authors: Yuting Xu, Andy Liaw, Robert P. Sheridan, Vladimir Svetnik
- Abstract要約: 定量的構造活性相関モデル(QSAR)は、化合物の生物活性を予測するために一般的に用いられる手法である。
優れた予測性能を達成する機械学習(ML)アルゴリズムの多くは、予測の不確実性を推定するためのいくつかのアドオンメソッドを必要とする。
コンフォーマル予測(CP)は予測アルゴリズムに非依存であり、データ分布の弱い仮定の下で有効な予測間隔を生成できる。
- 参考スコア(独自算出の注目度): 0.5161531917413706
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The quantitative structure-activity relationship (QSAR) regression model is a
commonly used technique for predicting biological activities of compounds using
their molecular descriptors. Predictions from QSAR models can help, for
example, to optimize molecular structure; prioritize compounds for further
experimental testing; and estimate their toxicity. In addition to the accurate
estimation of the activity, it is highly desirable to obtain some estimate of
the uncertainty associated with the prediction, e.g., calculate a prediction
interval (PI) containing the true molecular activity with a pre-specified
probability, say 70%, 90% or 95%. The challenge is that most machine learning
(ML) algorithms that achieve superior predictive performance require some
add-on methods for estimating uncertainty of their prediction. The development
of these algorithms is an active area of research by statistical and ML
communities but their implementation for QSAR modeling remains limited.
Conformal prediction (CP) is a promising approach. It is agnostic to the
prediction algorithm and can produce valid prediction intervals under some weak
assumptions on the data distribution. We proposed computationally efficient CP
algorithms tailored to the most advanced ML models, including Deep Neural
Networks and Gradient Boosting Machines. The validity and efficiency of
proposed conformal predictors are demonstrated on a diverse collection of QSAR
datasets as well as simulation studies.
- Abstract(参考訳): qsar回帰モデル(quantical structure-activity relationship)は、分子記述子を用いて化合物の生物活性を予測する手法である。
QSARモデルからの予測は、例えば分子構造を最適化し、化合物をさらなる実験的試験に優先し、毒性を推定するのに役立つ。
活性の正確な推定に加えて、予測に関連する不確実性(例えば、特定の確率で真の分子活性を含む予測間隔(PI)を70%、90%、95%の確率で計算することなどが好ましい。
課題は、予測性能の優れた機械学習(ML)アルゴリズムの多くは、予測の不確実性を推定するためにいくつかのアドオンメソッドを必要とすることである。
これらのアルゴリズムの開発は統計およびMLコミュニティによる活発な研究領域であるが、QSARモデリングの実装は限定的である。
共形予測(cp)は有望なアプローチである。
予測アルゴリズムと無関係であり、データ分布の弱い仮定の下で有効な予測間隔を生成することができる。
我々は,Deep Neural NetworksやGradient Boosting Machinesなど,最も高度なMLモデルに適した計算効率の高いCPアルゴリズムを提案する。
提案する共形予測器の有効性と効率は,QSARデータセットの多種多様な収集とシミュレーション研究で実証された。
関連論文リスト
- Ensemble Prediction via Covariate-dependent Stacking [0.0]
本研究は,CDST (Co-dependent stacking') という,アンサンブル予測の新しい手法を提案する。
従来の積み重ね方式とは異なり、CDSTはモデルウェイトを共変量の関数として柔軟に変化させ、複雑なシナリオにおける予測性能を向上させる。
以上の結果から,CDSTは時間的・時間的予測の問題に特に有用であり,様々なデータ分析分野の研究者や実践者にとって強力なツールとなることが示唆された。
論文 参考訳(メタデータ) (2024-08-19T07:31:31Z) - Ranking and Combining Latent Structured Predictive Scores without Labeled Data [2.5064967708371553]
本稿では,新しい教師なしアンサンブル学習モデル(SUEL)を提案する。
連続的な予測スコアを持つ予測器のセット間の依存関係を利用して、ラベル付きデータなしで予測器をランク付けし、それらをアンサンブルされたスコアに重み付けする。
提案手法の有効性は、シミュレーション研究とリスク遺伝子発見の現実的応用の両方を通じて厳密に評価されている。
論文 参考訳(メタデータ) (2024-08-14T20:14:42Z) - Achieving Well-Informed Decision-Making in Drug Discovery: A Comprehensive Calibration Study using Neural Network-Based Structure-Activity Models [4.619907534483781]
薬物と標的の相互作用を予測する計算モデルは、新しい治療薬の開発を加速するための貴重なツールである。
しかし、そのようなモデルはキャリブレーションが不十分であり、信頼性の低い不確実性推定をもたらす。
本研究では,ポストホックキャリブレーション法と不確実な定量化手法を組み合わせることで,モデルの精度とキャリブレーションを向上できることを示す。
論文 参考訳(メタデータ) (2024-07-19T10:29:00Z) - CogDPM: Diffusion Probabilistic Models via Cognitive Predictive Coding [62.075029712357]
本研究は認知拡散確率モデル(CogDPM)を紹介する。
CogDPMは拡散モデルの階層的サンプリング能力に基づく精度推定法と拡散モデル固有の性質から推定される精度重み付きガイダンスを備える。
我々は,Universal Kindomの降水量と表面風速データセットを用いた実世界の予測タスクにCogDPMを適用した。
論文 参考訳(メタデータ) (2024-05-03T15:54:50Z) - Prediction-Powered Inference [68.97619568620709]
予測を用いた推論は、実験データセットに機械学習システムからの予測を補足した場合に有効な統計的推論を行うためのフレームワークである。
このフレームワークは、手段、量子、線形およびロジスティック回帰係数などの量に対して証明可能な信頼区間を計算するための単純なアルゴリズムを生成する。
予測による推論により、研究者は機械学習を使用して、より有効な、よりデータ効率の高い結論を導き出すことができる。
論文 参考訳(メタデータ) (2023-01-23T18:59:28Z) - Low cost prediction of probability distributions of molecular properties
for early virtual screening [0.8702432681310399]
本稿では, 階層的相関再構築手法を適用し, 人口統計, 財務, 天文学的データの解析に応用した。
この手法は、望まれる物理化学的/ADMET特性の可能性が低い化合物の迅速な拒絶を可能にするため、医薬化学者にとって大きな支援となる。
論文 参考訳(メタデータ) (2022-07-21T13:29:26Z) - Scalable computation of prediction intervals for neural networks via
matrix sketching [79.44177623781043]
既存の不確実性推定アルゴリズムでは、モデルアーキテクチャとトレーニング手順を変更する必要がある。
本研究では、与えられたトレーニングされたニューラルネットワークに適用し、近似予測間隔を生成できる新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-05-06T13:18:31Z) - Dense Uncertainty Estimation [62.23555922631451]
本稿では,ニューラルネットワークと不確実性推定手法について検討し,正確な決定論的予測と確実性推定の両方を実現する。
本研究では,アンサンブルに基づく手法と生成モデルに基づく手法の2つの不確実性推定法について検討し,それらの長所と短所を,完全/半端/弱度に制御されたフレームワークを用いて説明する。
論文 参考訳(メタデータ) (2021-10-13T01:23:48Z) - When in Doubt: Neural Non-Parametric Uncertainty Quantification for
Epidemic Forecasting [70.54920804222031]
既存の予測モデルは不確実な定量化を無視し、誤校正予測をもたらす。
不確実性を考慮した時系列予測のためのディープニューラルネットワークの最近の研究にもいくつかの制限がある。
本稿では,予測タスクを確率的生成過程としてモデル化し,EPIFNPと呼ばれる機能的ニューラルプロセスモデルを提案する。
論文 参考訳(メタデータ) (2021-06-07T18:31:47Z) - Probabilistic Gradient Boosting Machines for Large-Scale Probabilistic
Regression [51.770998056563094]
PGBM(Probabilistic Gradient Boosting Machines)は、確率的予測を生成する手法である。
既存の最先端手法と比較してPGBMの利点を実証的に示す。
論文 参考訳(メタデータ) (2021-06-03T08:32:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。