論文の概要: On the Relation between Prediction and Imputation Accuracy under Missing
Covariates
- arxiv url: http://arxiv.org/abs/2112.05248v1
- Date: Thu, 9 Dec 2021 23:30:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-14 01:46:38.384353
- Title: On the Relation between Prediction and Imputation Accuracy under Missing
Covariates
- Title(参考訳): 欠落共変量における予測とインプテーション精度の関係について
- Authors: Burim Ramosaj, Justus Tulowietzki, Markus Pauly
- Abstract要約: 近年の研究では、計算のための現代の機械学習アルゴリズムの利用傾向が増している。
近年の研究では、計算のための現代の機械学習アルゴリズムの利用傾向が増している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Missing covariates in regression or classification problems can prohibit the
direct use of advanced tools for further analysis. Recent research has realized
an increasing trend towards the usage of modern Machine Learning algorithms for
imputation. It originates from their capability of showing favourable
prediction accuracy in different learning problems. In this work, we analyze
through simulation the interaction between imputation accuracy and prediction
accuracy in regression learning problems with missing covariates when Machine
Learning based methods for both, imputation and prediction are used. In
addition, we explore imputation performance when using statistical inference
procedures in prediction settings, such as coverage rates of (valid) prediction
intervals. Our analysis is based on empirical datasets provided by the UCI
Machine Learning repository and an extensive simulation study.
- Abstract(参考訳): 回帰問題や分類問題における共変量の欠如は、さらなる分析に先進的なツールを直接使用することを禁じる可能性がある。
近年の研究では、計算のための現代の機械学習アルゴリズムの利用傾向が増している。
それは、異なる学習問題において好ましい予測精度を示す能力に由来する。
本研究では,共変量の欠如を伴う回帰学習問題におけるインプテーション精度と予測精度の相互作用をシミュレーションし,インプテーションと予測の両方の手法を用いた場合の解析を行った。
さらに,予測区間のカバレッジ率などの予測設定において,統計的推測手法を用いた場合の計算性能について検討する。
UCI Machine Learningレポジトリが提供する経験的データセットと、広範なシミュレーション研究に基づいて分析を行った。
関連論文リスト
- Imputation for prediction: beware of diminishing returns [12.424671213282256]
失敗の値はさまざまな分野に分散しており、予測モデルをトレーニングしデプロイする上での課題を提起している。
最近の理論的および実証的な研究は、単純な定数計算が一貫性と競争力を持つことを示唆している。
本研究の目的は, 先進的な計算手法への投資が, 予測精度を著しく向上させるかどうかを明らかにすることである。
論文 参考訳(メタデータ) (2024-07-29T09:01:06Z) - Distribution-free risk assessment of regression-based machine learning
algorithms [6.507711025292814]
我々は回帰アルゴリズムとモデル予測の周囲に定義された区間内に存在する真のラベルの確率を計算するリスク評価タスクに焦点をあてる。
そこで,本研究では,正のラベルを所定の確率で含むことが保証される予測区間を提供する共形予測手法を用いてリスク評価問題を解決する。
論文 参考訳(メタデータ) (2023-10-05T13:57:24Z) - Structured Radial Basis Function Network: Modelling Diversity for
Multiple Hypotheses Prediction [51.82628081279621]
多重モード回帰は非定常過程の予測や分布の複雑な混合において重要である。
構造的放射基底関数ネットワークは回帰問題に対する複数の仮説予測器のアンサンブルとして提示される。
この構造モデルにより, このテッセルレーションを効率よく補間し, 複数の仮説対象分布を近似することが可能であることが証明された。
論文 参考訳(メタデータ) (2023-09-02T01:27:53Z) - Online machine-learning forecast uncertainty estimation for sequential
data assimilation [0.0]
予測の不確実性の定量化は、最先端の数値予測とデータ同化システムの重要な側面である。
本研究では、状態依存予測の不確実性を推定する畳み込みニューラルネットワークに基づく機械学習手法を提案する。
ハイブリッドデータ同化法は,アンサンブルが比較的小さい場合に,アンサンブルカルマンフィルタと同等の性能を示す。
論文 参考訳(メタデータ) (2023-05-12T19:23:21Z) - Improving Adaptive Conformal Prediction Using Self-Supervised Learning [72.2614468437919]
我々は、既存の予測モデルの上に自己教師付きプレテキストタスクを持つ補助モデルを訓練し、自己教師付きエラーを付加的な特徴として用いて、非整合性スコアを推定する。
合成データと実データの両方を用いて、効率(幅)、欠陥、共形予測間隔の超過といった付加情報の利点を実証的に実証する。
論文 参考訳(メタデータ) (2023-02-23T18:57:14Z) - Prediction-Powered Inference [68.97619568620709]
予測を用いた推論は、実験データセットに機械学習システムからの予測を補足した場合に有効な統計的推論を行うためのフレームワークである。
このフレームワークは、手段、量子、線形およびロジスティック回帰係数などの量に対して証明可能な信頼区間を計算するための単純なアルゴリズムを生成する。
予測による推論により、研究者は機械学習を使用して、より有効な、よりデータ効率の高い結論を導き出すことができる。
論文 参考訳(メタデータ) (2023-01-23T18:59:28Z) - Scalable computation of prediction intervals for neural networks via
matrix sketching [79.44177623781043]
既存の不確実性推定アルゴリズムでは、モデルアーキテクチャとトレーニング手順を変更する必要がある。
本研究では、与えられたトレーニングされたニューラルネットワークに適用し、近似予測間隔を生成できる新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-05-06T13:18:31Z) - Automated Learning of Interpretable Models with Quantified Uncertainty [0.0]
我々は遺伝子プログラミングに基づくシンボリックレグレッション(GPSR)の新しい枠組みを導入する。
GPSRはモデルエビデンスを用いて、進化の選択段階における置換確率を定式化する。
従来のGPSR実装と比較して、解釈可能性の向上、ノイズに対する堅牢性の向上、オーバーフィッティングの低減が示されている。
論文 参考訳(メタデータ) (2022-04-12T19:56:42Z) - Conformal prediction for the design problem [72.14982816083297]
機械学習の現実的な展開では、次にテストすべきデータを選択するために予測アルゴリズムを使用します。
このような設定では、トレーニングデータとテストデータの間には、異なるタイプの分散シフトがある。
このような環境で予測の不確実性を定量化する手法を提案する。
論文 参考訳(メタデータ) (2022-02-08T02:59:12Z) - Machine learning for causal inference: on the use of cross-fit
estimators [77.34726150561087]
より優れた統計特性を得るために、二重ローバストなクロスフィット推定器が提案されている。
平均因果効果(ACE)に対する複数の推定器の性能評価のためのシミュレーション研究を行った。
機械学習で使用する場合、二重確率のクロスフィット推定器は、バイアス、分散、信頼区間のカバレッジで他のすべての推定器よりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-04-21T23:09:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。