論文の概要: Comparative Evaluation of Applicability Domain Definition Methods for Regression Models
- arxiv url: http://arxiv.org/abs/2411.00920v1
- Date: Fri, 01 Nov 2024 14:12:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-05 14:42:27.056678
- Title: Comparative Evaluation of Applicability Domain Definition Methods for Regression Models
- Title(参考訳): 回帰モデルに対する適用可能性領域定義法の比較評価
- Authors: Shakir Khurshid, Bharath Kumar Loganathan, Matthieu Duvinage,
- Abstract要約: 適用可能性領域とは、予測モデルの予測が信頼性と正確さを期待するデータの範囲を指す。
本稿では,非決定論的ベイズニューラルネットワークに基づく新しい手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: The applicability domain refers to the range of data for which the prediction of the predictive model is expected to be reliable and accurate and using a model outside its applicability domain can lead to incorrect results. The ability to define the regions in data space where a predictive model can be safely used is a necessary condition for having safer and more reliable predictions to assure the reliability of new predictions. However, defining the applicability domain of a model is a challenging problem, as there is no clear and universal definition or metric for it. This work aims to make the applicability domain more quantifiable and pragmatic. Eight applicability domain detection techniques were applied to seven regression models, trained on five different datasets, and their performance was benchmarked using a validation framework. We also propose a novel approach based on non-deterministic Bayesian neural networks to define the applicability domain of the model. Our method exhibited superior accuracy in defining the Applicability Domain compared to previous methods, highlighting its potential in this regard.
- Abstract(参考訳): 適用可能性領域は、予測モデルの予測が信頼性と正確さを期待されるデータの範囲を指し、適用可能性領域外のモデルを使用することで、誤った結果につながる可能性がある。
予測モデルを安全に使用可能なデータ空間内の領域を定義する能力は、新しい予測の信頼性を保証するために、より安全で信頼性の高い予測を行うために必要な条件である。
しかしながら、モデルの応用可能性領域を定義することは、明確な普遍的な定義や計量が存在しないため、難しい問題である。
この作業は、適用性ドメインをより定量化し、実用的なものにすることを目的としています。
8つの適用可能なドメイン検出技術が7つの回帰モデルに適用され、5つの異なるデータセットでトレーニングされ、それらのパフォーマンスは検証フレームワークを使用してベンチマークされた。
また、非決定論的ベイズニューラルネットワークに基づく新しいアプローチを提案し、モデルの適用性ドメインを定義する。
本手法は,従来の手法と比較して,適用可能性領域の定義に優れた精度を示し,その可能性を強調した。
関連論文リスト
- Source-Free Domain-Invariant Performance Prediction [68.39031800809553]
本研究では,不確実性に基づく推定を主軸としたソースフリー手法を提案する。
オブジェクト認識データセットのベンチマーク実験により、既存のソースベースの手法は、限られたソースサンプルの可用性で不足していることが判明した。
提案手法は,現在の最先端のソースフリーおよびソースベース手法よりも優れており,ドメイン不変性能推定の有効性が確認されている。
論文 参考訳(メタデータ) (2024-08-05T03:18:58Z) - Determining Domain of Machine Learning Models using Kernel Density Estimates: Applications in Materials Property Prediction [1.8551396341435895]
我々は,カーネル密度推定を用いたモデル領域の評価手法を開発した。
確立された化学知識に基づく無関係と判断された化学物質群は,本測定値と有意な相違が認められた。
相違性の高い尺度は、モデル性能の低さとモデル不確実性の評価の低さと関連している。
論文 参考訳(メタデータ) (2024-05-28T15:41:16Z) - Source-Free Unsupervised Domain Adaptation with Hypothesis Consolidation
of Prediction Rationale [53.152460508207184]
Source-Free Unsupervised Domain Adaptation (SFUDA)は、モデルがターゲットのドメインラベルやソースドメインデータにアクセスせずに新しいドメインに適応する必要がある、という課題である。
本稿では,各サンプルについて複数の予測仮説を考察し,各仮説の背景にある理論的根拠について考察する。
最適性能を達成するために,モデル事前適応,仮説統合,半教師付き学習という3段階の適応プロセスを提案する。
論文 参考訳(メタデータ) (2024-02-02T05:53:22Z) - Finite Sample Confidence Regions for Linear Regression Parameters Using
Arbitrary Predictors [1.6860963320038902]
線形モデルのパラメータに対する信頼領域を構築するための新しい手法を任意の予測器からの予測を用いて検討する。
導出された信頼領域は、混合線形プログラミングフレームワーク内の制約としてキャストすることができ、線形目的の最適化を可能にする。
従来の手法とは異なり、信頼領域は空であり、仮説テストに使用できる。
論文 参考訳(メタデータ) (2024-01-27T00:15:48Z) - Outlier-Based Domain of Applicability Identification for Materials
Property Prediction Models [0.38073142980733]
本稿では,大きな特徴空間を用いた適用可能性領域の探索手法を提案するとともに,検出された領域についてより深い知見を得るための解析手法を提案する。
本研究では,大きな特徴空間を用いた適用可能性領域の探索手法を提案するとともに,検出された領域についてより深い知見を得るための解析手法を提案する。
論文 参考訳(メタデータ) (2023-01-17T07:51:12Z) - Uncertainty Quantification for Rule-Based Models [0.03807314298073299]
ルールベースの分類モデルは、確率をモデル化し、統計モデルのように予測に変換するのではなく、直接値を予測する。
本稿では,二項出力を持つ二項分類器をブラックボックスとして扱うメタモデルの形で不確実な定量化フレームワークを提案し,その推定に対する信頼度とともに,与えられた入力におけるそのベースモデルの予測精度を推定する。
論文 参考訳(メタデータ) (2022-11-03T15:50:09Z) - Variational Model Perturbation for Source-Free Domain Adaptation [64.98560348412518]
確率的枠組みにおける変分ベイズ推定によるモデルパラメータの摂動を導入する。
本研究では,ベイズニューラルネットワークの学習と理論的関連性を実証し,目的領域に対する摂動モデルの一般化可能性を示す。
論文 参考訳(メタデータ) (2022-10-19T08:41:19Z) - Uncertainty-guided Source-free Domain Adaptation [77.3844160723014]
ソースフリードメイン適応(SFDA)は、事前訓練されたソースモデルのみを使用することで、未ラベルのターゲットデータセットに分類器を適応させることを目的としている。
本稿では、ソースモデル予測の不確実性を定量化し、ターゲット適応の導出に利用することを提案する。
論文 参考訳(メタデータ) (2022-08-16T08:03:30Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。