論文の概要: Multiple imputation using chained random forests: a preliminary study
based on the empirical distribution of out-of-bag prediction errors
- arxiv url: http://arxiv.org/abs/2004.14823v1
- Date: Thu, 30 Apr 2020 14:29:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-08 05:28:05.216869
- Title: Multiple imputation using chained random forests: a preliminary study
based on the empirical distribution of out-of-bag prediction errors
- Title(参考訳): 連鎖ランダム林を用いた多重インプテーション--バッグ外予測誤差の実証的分布に基づく予備的検討
- Authors: Shangzhi Hong, Yuqi Sun, Hanying Li, Henry S. Lynn
- Abstract要約: 実機外予測誤差の実験的分布を条件付き分布として,新しいRF型多重計算法を提案した。
提案した非パラメトリック法は、有効な複数の計算結果を提供することができる。
- 参考スコア(独自算出の注目度): 0.716879432974126
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Missing data are common in data analyses in biomedical fields, and imputation
methods based on random forests (RF) have become widely accepted, as the RF
algorithm can achieve high accuracy without the need for specification of data
distributions or relationships. However, the predictions from RF do not contain
information about prediction uncertainty, which was unacceptable for multiple
imputation. Available RF-based multiple imputation methods tried to do proper
multiple imputation either by sampling directly from observations under
predicting nodes without accounting for the prediction error or by making
normality assumption about the prediction error distribution. In this study, a
novel RF-based multiple imputation method was proposed by constructing
conditional distributions the empirical distribution of out-of-bag prediction
errors. The proposed method was compared with previous method with parametric
assumptions about RF's prediction errors and predictive mean matching based on
simulation studies on data with presence of interaction term. The proposed
non-parametric method can deliver valid multiple imputation results. The
accompanying R package for this study is publicly available.
- Abstract(参考訳): バイオメディカル分野のデータ解析において欠落データは一般的であり、RFアルゴリズムはデータ分布や関係の特定を必要とせずに高い精度を達成できるため、ランダムフォレスト(RF)に基づく計算法が広く受け入れられている。
しかし、RFからの予測には予測の不確実性に関する情報は含まれていない。
RFを用いた多重計算法では,予測誤差を考慮せずに予測ノード下での観測を直接サンプリングしたり,予測誤差分布について正規性仮定を行ったりすることで,適切な多重計算を試みた。
本研究では,バッグ外予測誤差の実験的分布を条件分布として,rfベース多重インプテーション法を提案する。
提案手法は、RFの予測誤差に関するパラメトリック仮定と、相互作用項が存在するデータに関するシミュレーション研究に基づく予測平均マッチングを用いて、従来の手法と比較した。
提案する非パラメトリック法は有効な複数のインプテーション結果を提供することができる。
この研究に付随するRパッケージが公開されている。
関連論文リスト
- Selective Nonparametric Regression via Testing [54.20569354303575]
本研究では,所定の点における条件分散の値に関する仮説を検証し,留置手順を開発する。
既存の手法とは異なり、提案手法は分散自体の値だけでなく、対応する分散予測器の不確実性についても考慮することができる。
論文 参考訳(メタデータ) (2023-09-28T13:04:11Z) - Quantification of Predictive Uncertainty via Inference-Time Sampling [57.749601811982096]
本稿では,データあいまいさの予測不確実性を推定するためのポストホックサンプリング手法を提案する。
この方法は与えられた入力に対して異なる可算出力を生成することができ、予測分布のパラメトリック形式を仮定しない。
論文 参考訳(メタデータ) (2023-08-03T12:43:21Z) - Confidence and Uncertainty Assessment for Distributional Random Forests [1.2767281330110625]
分布ランダムフォレスト (DRF) は条件分布を推定するために最近導入されたランダムフォレストである。
条件平均処理効果、条件量子化、条件相関など、幅広いターゲットを推定するために使用できる。
DRFのアルゴリズムを特徴付け、ブートストラップ近似を開発する。
論文 参考訳(メタデータ) (2023-02-11T19:10:01Z) - A general framework for multi-step ahead adaptive conformal
heteroscedastic time series forecasting [0.0]
本稿では,適応アンサンブルバッチ多出力多出力共形量子化回帰(AEnbMIMOCQR)と呼ばれる新しいモデル非依存アルゴリズムを提案する。
これにより、予測者は、固定された特定された誤発見率に対して、分布のない方法で、複数段階の事前予測間隔を生成できる。
本手法は, 整合予測の原理に基づいているが, データの分割は不要であり, データの交換ができない場合でも, ほぼ正確なカバレッジを提供する。
論文 参考訳(メタデータ) (2022-07-28T16:40:26Z) - NUQ: Nonparametric Uncertainty Quantification for Deterministic Neural
Networks [151.03112356092575]
本研究では,Nadaraya-Watson の条件付きラベル分布の非パラメトリック推定に基づく分類器の予測の不確かさの測定方法を示す。
種々の実世界の画像データセットにおける不確実性推定タスクにおいて,本手法の強い性能を示す。
論文 参考訳(メタデータ) (2022-02-07T12:30:45Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z) - Posterior Network: Uncertainty Estimation without OOD Samples via
Density-Based Pseudo-Counts [33.45069308137142]
Posterior Network (PostNet) は、任意のサンプルに対する予測確率よりも、個々の閉形式後部分布を予測する。
PostNetは、OODの検出とデータセットシフトによる不確実なキャリブレーションにおいて、最先端の成果を達成する。
論文 参考訳(メタデータ) (2020-06-16T15:16:32Z) - Balance-Subsampled Stable Prediction [55.13512328954456]
本稿では, 分数分解設計理論に基づく新しいバランスサブサンプル安定予測法を提案する。
設計理論解析により,提案手法は分布シフトによって誘導される予測器間の共起効果を低減できることを示した。
合成および実世界の両方のデータセットに関する数値実験により、BSSPアルゴリズムは未知のテストデータ間で安定した予測を行うためのベースライン法を著しく上回っていることが示された。
論文 参考訳(メタデータ) (2020-06-08T07:01:38Z) - Learning to Predict Error for MRI Reconstruction [67.76632988696943]
提案手法による予測の不確実性は予測誤差と強く相関しないことを示す。
本稿では,2段階の予測誤差の目標ラベルと大小を推定する新しい手法を提案する。
論文 参考訳(メタデータ) (2020-02-13T15:55:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。