Fugu-MT 論文翻訳(概要): Prediction Error Estimation in Random Forests

論文の概要: Prediction Error Estimation in Random Forests

arxiv url: http://arxiv.org/abs/2309.00736v1
Date: Fri, 1 Sep 2023 21:16:02 GMT
ステータス: 翻訳完了
システム内更新日: 2023-09-07 01:36:23.793253
Title: Prediction Error Estimation in Random Forests
Title（参考訳）: ランダム森林における予測誤差の推定
Authors: Ian Krupkin and Johanna Hardin
Abstract要約: 分類の場合、ランダムフォレストによる予測誤差の推定は、真の誤差率と平均的に近いことを示す。さらに、この結果は、クロスバリデーション、バッグング、データ分割など、さまざまなエラー推定戦略にまたがることを示す。
参考スコア（独自算出の注目度）: 1.5229257192293204
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: In this paper, error estimates of classification Random Forests are quantitatively assessed. Based on the initial theoretical framework built by Bates et al. (2023), the true error rate and expected error rate are theoretically and empirically investigated in the context of a variety of error estimation methods common to Random Forests. We show that in the classification case, Random Forests' estimates of prediction error is closer on average to the true error rate instead of the average prediction error. This is opposite the findings of Bates et al. (2023) which were given for logistic regression. We further show that this result holds across different error estimation strategies such as cross-validation, bagging, and data splitting.
Abstract（参考訳）: 本稿では,ランダム林の分類誤差を定量的に評価する。 Bates et al. (2023) によって構築された最初の理論的枠組みに基づき、ランダムフォレストに共通する様々なエラー推定手法の文脈において、真のエラー率と予測誤差率を理論的および実験的に検討する。分類の場合、ランダムフォレストの平均予測誤差は、平均予測誤差ではなく、真の誤差率に近いことが示されている。これは、ロジスティック回帰のために与えられたBates et al. (2023) の発見とは逆である。さらに,この結果がクロスバリデーションやバッキング,データ分割など,さまざまなエラー推定戦略にまたがることを示す。

関連論文リスト

Clustered random forests with correlated data for optimal estimation and inference under potential covariate shift [4.13592995550836]
我々はクラスタ内の依存を示す独立したグループから生じるランダムなデータに対するランダムなフォレストアルゴリズムであるClustered Random Forestsを開発した。集団化されたランダム林を構成する各決定木の葉回り予測は、重み付き最小二乗推定器の形を取る。伐採された無作為林は、特定の樹木分割基準に対して、ポイントワイド条件の平均推定に最適なミニマックスレートを示す。
論文参考訳（メタデータ） (2025-03-16T20:07:23Z)
In-Context Parametric Inference: Point or Distribution Estimators? [66.22308335324239]
償却点推定器は一般に後部推論より優れているが、後者は低次元問題では競争力がある。実験の結果, 償却点推定器は一般に後部推定より優れているが, 後者は低次元問題では競争力があることがわかった。
論文参考訳（メタデータ） (2025-02-17T10:00:24Z)
Challenges learning from imbalanced data using tree-based models: Prevalence estimates systematically depend on hyperparameters and can be upwardly biased [0.0]
不均衡二項分類問題は、多くの研究分野において発生する。モデルのトレーニングのための(より)バランスのとれたデータセットを作成するために、多数派のクラスをサブサンプルするのが一般的です。これは、モデルが新しいデータと同じデータ生成プロセスに従わないデータセットから学習するため、モデルの予測をバイアスする。
論文参考訳（メタデータ） (2024-12-17T19:38:29Z)
Regression Trees for Fast and Adaptive Prediction Intervals [2.6763498831034043]
本稿では,局所的なカバレッジ保証を伴う回帰問題に対して,予測間隔を調整するための一連の手法を提案する。回帰木とランダムフォレストを適合度スコアでトレーニングすることで分割を作成する。提案手法は多種多様な適合性スコアや予測設定に適用できるため,多種多様である。
論文参考訳（メタデータ） (2024-02-12T01:17:09Z)
Confidence and Uncertainty Assessment for Distributional Random Forests [1.2767281330110625]
分布ランダムフォレスト (DRF) は条件分布を推定するために最近導入されたランダムフォレストである。条件平均処理効果、条件量子化、条件相関など、幅広いターゲットを推定するために使用できる。 DRFのアルゴリズムを特徴付け、ブートストラップ近似を開発する。
論文参考訳（メタデータ） (2023-02-11T19:10:01Z)
The Implicit Delta Method [61.36121543728134]
本稿では,不確実性のトレーニング損失を無限に正規化することで機能する,暗黙のデルタ法を提案する。有限差分により無限小変化が近似された場合でも, 正則化による評価の変化は評価推定器の分散に一定であることを示す。
論文参考訳（メタデータ） (2022-11-11T19:34:17Z)
Uncertainty estimation of pedestrian future trajectory using Bayesian approximation [137.00426219455116]
動的トラフィックシナリオでは、決定論的予測に基づく計画は信頼できない。著者らは、決定論的アプローチが捉えられない近似を用いて予測中の不確実性を定量化する。将来の状態の不確実性に対する降雨重量と長期予測の影響について検討した。
論文参考訳（メタデータ） (2022-05-04T04:23:38Z)
On Variance Estimation of Random Forests [0.0]
本稿では,不完全U-統計量に基づく不偏分散推定器を開発する。我々は,計算コストを増大させることなく,より低いバイアスとより正確な信頼区間のカバレッジを評価できることを示した。
論文参考訳（メタデータ） (2022-02-18T03:35:47Z)
Dense Uncertainty Estimation [62.23555922631451]
本稿では,ニューラルネットワークと不確実性推定手法について検討し,正確な決定論的予測と確実性推定の両方を実現する。本研究では,アンサンブルに基づく手法と生成モデルに基づく手法の2つの不確実性推定法について検討し,それらの長所と短所を,完全/半端/弱度に制御されたフレームワークを用いて説明する。
論文参考訳（メタデータ） (2021-10-13T01:23:48Z)
Cross-validation: what does it estimate and how well does it do it? [2.049702429898688]
クロスバリデーションは予測誤差を推定するために広く使われている手法であるが、その振る舞いは複雑であり、完全には理解されていない。これは、通常の最小二乗に適合する線形モデルの場合ではなく、同じ集団から引き出された他の目に見えない訓練セットに適合するモデルの平均予測誤差を推定するものである。
論文参考訳（メタデータ） (2021-04-01T17:58:54Z)
Improving Uncertainty Calibration via Prior Augmented Data [56.88185136509654]
ニューラルネットワークは、普遍関数近似器として機能することで、複雑なデータ分布から学習することに成功した。彼らはしばしば予測に自信過剰であり、不正確で誤った確率的予測に繋がる。本稿では,モデルが不当に過信である特徴空間の領域を探索し,それらの予測のエントロピーをラベルの以前の分布に対して条件的に高める手法を提案する。
論文参考訳（メタデータ） (2021-02-22T07:02:37Z)
Achieving Reliable Causal Inference with Data-Mined Variables: A Random Forest Approach to the Measurement Error Problem [1.5749416770494704]
一般的な実証的戦略は、利用可能なデータから関心のある変数を'マイニング'する予測モデリング手法の適用を含む。最近の研究は、機械学習モデルからの予測は必然的に不完全であるため、予測変数に基づく計量分析は測定誤差によるバイアスに悩まされる可能性が高いことを強調している。ランダムフォレストと呼ばれるアンサンブル学習技術を用いて,これらのバイアスを軽減する新しい手法を提案する。
論文参考訳（メタデータ） (2020-12-19T21:48:23Z)
Unlabelled Data Improves Bayesian Uncertainty Calibration under Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文参考訳（メタデータ） (2020-06-26T13:50:19Z)
Learning to Predict Error for MRI Reconstruction [67.76632988696943]
提案手法による予測の不確実性は予測誤差と強く相関しないことを示す。本稿では,2段階の予測誤差の目標ラベルと大小を推定する新しい手法を提案する。
論文参考訳（メタデータ） (2020-02-13T15:55:32Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。