論文の概要: Development and Evaluation of Conformal Prediction Methods for QSAR
- arxiv url: http://arxiv.org/abs/2304.00970v1
- Date: Mon, 3 Apr 2023 13:41:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-04 15:22:44.990582
- Title: Development and Evaluation of Conformal Prediction Methods for QSAR
- Title(参考訳): QSARのための等角予測手法の開発と評価
- Authors: Yuting Xu, Andy Liaw, Robert P. Sheridan, Vladimir Svetnik
- Abstract要約: 定量的構造活性相関モデル(QSAR)は、化合物の生物活性を予測するために一般的に用いられる手法である。
優れた予測性能を達成する機械学習(ML)アルゴリズムの多くは、予測の不確実性を推定するためのいくつかのアドオンメソッドを必要とする。
コンフォーマル予測(CP)は予測アルゴリズムに非依存であり、データ分布の弱い仮定の下で有効な予測間隔を生成できる。
- 参考スコア(独自算出の注目度): 0.5161531917413706
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The quantitative structure-activity relationship (QSAR) regression model is a
commonly used technique for predicting biological activities of compounds using
their molecular descriptors. Predictions from QSAR models can help, for
example, to optimize molecular structure; prioritize compounds for further
experimental testing; and estimate their toxicity. In addition to the accurate
estimation of the activity, it is highly desirable to obtain some estimate of
the uncertainty associated with the prediction, e.g., calculate a prediction
interval (PI) containing the true molecular activity with a pre-specified
probability, say 70%, 90% or 95%. The challenge is that most machine learning
(ML) algorithms that achieve superior predictive performance require some
add-on methods for estimating uncertainty of their prediction. The development
of these algorithms is an active area of research by statistical and ML
communities but their implementation for QSAR modeling remains limited.
Conformal prediction (CP) is a promising approach. It is agnostic to the
prediction algorithm and can produce valid prediction intervals under some weak
assumptions on the data distribution. We proposed computationally efficient CP
algorithms tailored to the most advanced ML models, including Deep Neural
Networks and Gradient Boosting Machines. The validity and efficiency of
proposed conformal predictors are demonstrated on a diverse collection of QSAR
datasets as well as simulation studies.
- Abstract(参考訳): qsar回帰モデル(quantical structure-activity relationship)は、分子記述子を用いて化合物の生物活性を予測する手法である。
QSARモデルからの予測は、例えば分子構造を最適化し、化合物をさらなる実験的試験に優先し、毒性を推定するのに役立つ。
活性の正確な推定に加えて、予測に関連する不確実性(例えば、特定の確率で真の分子活性を含む予測間隔(PI)を70%、90%、95%の確率で計算することなどが好ましい。
課題は、予測性能の優れた機械学習(ML)アルゴリズムの多くは、予測の不確実性を推定するためにいくつかのアドオンメソッドを必要とすることである。
これらのアルゴリズムの開発は統計およびMLコミュニティによる活発な研究領域であるが、QSARモデリングの実装は限定的である。
共形予測(cp)は有望なアプローチである。
予測アルゴリズムと無関係であり、データ分布の弱い仮定の下で有効な予測間隔を生成することができる。
我々は,Deep Neural NetworksやGradient Boosting Machinesなど,最も高度なMLモデルに適した計算効率の高いCPアルゴリズムを提案する。
提案する共形予測器の有効性と効率は,QSARデータセットの多種多様な収集とシミュレーション研究で実証された。
関連論文リスト
- Prediction-Powered Inference [68.97619568620709]
予測を用いた推論は、実験データセットに機械学習システムからの予測を補足した場合に有効な統計的推論を行うためのフレームワークである。
このフレームワークは、手段、量子、線形およびロジスティック回帰係数などの量に対して証明可能な信頼区間を計算するための単純なアルゴリズムを生成する。
予測による推論により、研究者は機械学習を使用して、より有効な、よりデータ効率の高い結論を導き出すことができる。
論文 参考訳(メタデータ) (2023-01-23T18:59:28Z) - Improving Accuracy Without Losing Interpretability: A ML Approach for
Time Series Forecasting [4.025941501724274]
時系列予測では、分解に基づくアルゴリズムが集約データを意味のあるコンポーネントに分解する。
近年のアルゴリズムは、予測精度を向上させるために、機械学習(以下、ML)手法と分解を組み合わせていることが多い。
本稿では,分解とMLを組み合わせたハイブリッドアルゴリズムW-Rを提案する。
論文 参考訳(メタデータ) (2022-12-13T14:51:10Z) - Sparse high-dimensional linear regression with a partitioned empirical
Bayes ECM algorithm [62.997667081978825]
疎高次元線形回帰に対する計算効率が高く強力なベイズ的手法を提案する。
パラメータに関する最小の事前仮定は、プラグイン経験的ベイズ推定(英語版)を用いて用いられる。
提案手法はRパッケージプローブに実装されている。
論文 参考訳(メタデータ) (2022-09-16T19:15:50Z) - Low cost prediction of probability distributions of molecular properties
for early virtual screening [0.8702432681310399]
本稿では, 階層的相関再構築手法を適用し, 人口統計, 財務, 天文学的データの解析に応用した。
この手法は、望まれる物理化学的/ADMET特性の可能性が低い化合物の迅速な拒絶を可能にするため、医薬化学者にとって大きな支援となる。
論文 参考訳(メタデータ) (2022-07-21T13:29:26Z) - Scalable computation of prediction intervals for neural networks via
matrix sketching [79.44177623781043]
既存の不確実性推定アルゴリズムでは、モデルアーキテクチャとトレーニング手順を変更する必要がある。
本研究では、与えられたトレーニングされたニューラルネットワークに適用し、近似予測間隔を生成できる新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-05-06T13:18:31Z) - On the Relation between Prediction and Imputation Accuracy under Missing
Covariates [0.0]
近年の研究では、計算のための現代の機械学習アルゴリズムの利用傾向が増している。
近年の研究では、計算のための現代の機械学習アルゴリズムの利用傾向が増している。
論文 参考訳(メタデータ) (2021-12-09T23:30:44Z) - Dense Uncertainty Estimation [62.23555922631451]
本稿では,ニューラルネットワークと不確実性推定手法について検討し,正確な決定論的予測と確実性推定の両方を実現する。
本研究では,アンサンブルに基づく手法と生成モデルに基づく手法の2つの不確実性推定法について検討し,それらの長所と短所を,完全/半端/弱度に制御されたフレームワークを用いて説明する。
論文 参考訳(メタデータ) (2021-10-13T01:23:48Z) - When in Doubt: Neural Non-Parametric Uncertainty Quantification for
Epidemic Forecasting [70.54920804222031]
既存の予測モデルは不確実な定量化を無視し、誤校正予測をもたらす。
不確実性を考慮した時系列予測のためのディープニューラルネットワークの最近の研究にもいくつかの制限がある。
本稿では,予測タスクを確率的生成過程としてモデル化し,EPIFNPと呼ばれる機能的ニューラルプロセスモデルを提案する。
論文 参考訳(メタデータ) (2021-06-07T18:31:47Z) - Probabilistic Gradient Boosting Machines for Large-Scale Probabilistic
Regression [51.770998056563094]
PGBM(Probabilistic Gradient Boosting Machines)は、確率的予測を生成する手法である。
既存の最先端手法と比較してPGBMの利点を実証的に示す。
論文 参考訳(メタデータ) (2021-06-03T08:32:13Z) - A Deep Learning Algorithm for High-Dimensional Exploratory Item Factor
Analysis [0.0]
探索項目因子分析(IFA)のための深層学習に基づくVIアルゴリズムについて検討する。
提案手法は、探索型IFAのための重要重み付きオートエンコーダ(IWAE)と呼ばれる深層人工ニューラルネットワークモデルを適用する。
IWAEは標本サイズやIWサンプル数の増加に伴って,より正確な推定値が得られることを示す。
論文 参考訳(メタデータ) (2020-01-22T03:02:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。