論文の概要: Confidence intervals for the random forest generalization error
- arxiv url: http://arxiv.org/abs/2112.06101v1
- Date: Sat, 11 Dec 2021 23:58:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-16 09:51:43.914814
- Title: Confidence intervals for the random forest generalization error
- Title(参考訳): ランダム森林一般化誤差に対する信頼区間
- Authors: Marques F., Paulo C
- Abstract要約: ランダムな森林のトレーニングプロセスの下には、一般化誤差に対する信頼区間を計算するための経路が存在することを示す。
構成に関わる計算コストの低さに加えて、この信頼区間はシミュレーションを通して示され、良好なカバレッジと幅の適切な縮小率を有する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We show that underneath the training process of a random forest there lies
not only the well known and almost computationally free out-of-bag point
estimate of its generalization error, but also a path to compute a confidence
interval for the generalization error which does not demand a retraining of the
forest or any forms of data splitting. Besides the low computational cost
involved in its construction, this confidence interval is shown through
simulations to have good coverage and appropriate shrinking rate of its width
in terms of the training sample size.
- Abstract(参考訳): 本研究では,ランダム森林の訓練過程において,その一般化誤差のよく知られた計算量的自由点推定だけでなく,森林の再訓練やデータ分割を必要としない一般化誤差に対する信頼区間を計算する経路が存在することを示す。
その構築に関わる計算コストの低さに加えて、この信頼区間は、トレーニングサンプルサイズの観点から、適切なカバレッジと適切な幅縮小率を持つようにシミュレーションによって示される。
関連論文リスト
- Relaxed Quantile Regression: Prediction Intervals for Asymmetric Noise [51.87307904567702]
量子レグレッション(Quantile regression)は、出力の分布における量子の実験的推定を通じてそのような間隔を得るための主要なアプローチである。
本稿では、この任意の制約を除去する量子回帰に基づく区間構成の直接的な代替として、Relaxed Quantile Regression (RQR)を提案する。
これにより、柔軟性が向上し、望ましい品質が向上することが実証された。
論文 参考訳(メタデータ) (2024-06-05T13:36:38Z) - Score Matching-based Pseudolikelihood Estimation of Neural Marked
Spatio-Temporal Point Process with Uncertainty Quantification [59.81904428056924]
我々は、不確実な定量化を伴うmarkPsを学習するためのスコアMAtching推定器であるSMASHを紹介する。
具体的には,スコアマッチングによるマークPsの擬似的類似度を推定することにより,正規化自由度を推定する。
提案手法の優れた性能は、事象予測と不確実性定量化の両方において広範な実験によって実証される。
論文 参考訳(メタデータ) (2023-10-25T02:37:51Z) - Prediction Error Estimation in Random Forests [1.2891210250935148]
分類の場合、ランダムフォレストによる予測誤差の推定は、真の誤差率と平均的に近いことを示す。
さらに、我々の結果は、クロスバリデーション、バッグング、データ分割など、さまざまなエラー推定戦略にまたがっていることを示す。
論文 参考訳(メタデータ) (2023-09-01T21:16:02Z) - The Implicit Delta Method [61.36121543728134]
本稿では,不確実性のトレーニング損失を無限に正規化することで機能する,暗黙のデルタ法を提案する。
有限差分により無限小変化が近似された場合でも, 正則化による評価の変化は評価推定器の分散に一定であることを示す。
論文 参考訳(メタデータ) (2022-11-11T19:34:17Z) - Confidence Band Estimation for Survival Random Forests [6.343191621807365]
サバイバル・ランダム・フォレスト(Survival random forest)は、検閲されたサバイバルデータをモデリングするための一般的な機械学習ツールである。
本稿では、無限次不完全U-統計学における最近の発展を延長することにより、バイアスのない信頼バンド推定を提案する。
数値解析により,提案手法は信頼性帯域を正確に推定し,所望のカバレッジ率を達成することを示す。
論文 参考訳(メタデータ) (2022-04-26T02:27:26Z) - On Variance Estimation of Random Forests [0.0]
本稿では,不完全U-統計量に基づく不偏分散推定器を開発する。
我々は,計算コストを増大させることなく,より低いバイアスとより正確な信頼区間のカバレッジを評価できることを示した。
論文 参考訳(メタデータ) (2022-02-18T03:35:47Z) - Cross-validation: what does it estimate and how well does it do it? [2.049702429898688]
クロスバリデーションは予測誤差を推定するために広く使われている手法であるが、その振る舞いは複雑であり、完全には理解されていない。
これは、通常の最小二乗に適合する線形モデルの場合ではなく、同じ集団から引き出された他の目に見えない訓練セットに適合するモデルの平均予測誤差を推定するものである。
論文 参考訳(メタデータ) (2021-04-01T17:58:54Z) - Interpretable Machines: Constructing Valid Prediction Intervals with
Random Forests [0.0]
最近の研究で機械学習アルゴリズムを使用する場合の重要な問題は、解釈能力の欠如です。
Random Forest Regression Learnerのこのギャップへの貢献について紹介します。
いくつかのパラメトリックおよび非パラメトリック予測区間がランダムフォレスト点予測のために提供される。
モンテカルロシミュレーションによる徹底的な調査を行い,提案手法の性能を評価した。
論文 参考訳(メタデータ) (2021-03-09T23:05:55Z) - Log-Likelihood Ratio Minimizing Flows: Towards Robust and Quantifiable
Neural Distribution Alignment [52.02794488304448]
そこで本研究では,対数様比統計量と正規化フローに基づく新しい分布アライメント手法を提案する。
入力領域の局所構造を保存する領域アライメントにおいて,結果の最小化を実験的に検証する。
論文 参考訳(メタデータ) (2020-03-26T22:10:04Z) - Optimal Change-Point Detection with Training Sequences in the Large and
Moderate Deviations Regimes [72.68201611113673]
本稿では,情報理論の観点から,新しいオフライン変化点検出問題について検討する。
基礎となる事前および変更後分布の知識は分かっておらず、利用可能なトレーニングシーケンスからのみ学習できると仮定する。
論文 参考訳(メタデータ) (2020-03-13T23:39:40Z) - A General Method for Robust Learning from Batches [56.59844655107251]
本稿では,バッチから頑健な学習を行う一般的なフレームワークについて考察し,連続ドメインを含む任意の領域に対する分類と分布推定の限界について考察する。
本手法は,一括分節分類,一括分節,単調,対数凹,ガウス混合分布推定のための,最初の頑健な計算効率の学習アルゴリズムを導出する。
論文 参考訳(メタデータ) (2020-02-25T18:53:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。