論文の概要: Simplifying Random Forests' Probabilistic Forecasts
- arxiv url: http://arxiv.org/abs/2408.12332v2
- Date: Sat, 12 Oct 2024 14:25:56 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-08 05:37:29.299430
- Title: Simplifying Random Forests' Probabilistic Forecasts
- Title(参考訳): ランダム森林の確率的予測の簡易化
- Authors: Nils Koster, Fabian Krüger,
- Abstract要約: ランダムフォレスト(RF)は分類と回帰の両方に有用であることが証明されている。
本稿では,RFを用いた予測分布の簡易化について検討する。
既存のRFモデルを再訓練することなく、任意の予測タスクに適用することができる。
- 参考スコア(独自算出の注目度): 1.534667887016089
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Since their introduction by Breiman, Random Forests (RFs) have proven to be useful for both classification and regression tasks. The RF prediction of a previously unseen observation can be represented as a weighted sum of all training sample observations. This nearest-neighbor-type representation is useful, among other things, for constructing forecast distributions (Meinshausen, 2006). In this paper, we consider simplifying RF-based forecast distributions by sparsifying them. That is, we focus on a small subset of nearest neighbors while setting the remaining weights to zero. This sparsification step greatly improves the interpretability of RF predictions. It can be applied to any forecasting task without re-training existing RF models. In empirical experiments, we document that the simplified predictions can be similar to or exceed the original ones in terms of forecasting performance. We explore the statistical sources of this finding via a stylized analytical model of RFs. The model suggests that simplification is particularly promising if the unknown true forecast distribution contains many small weights that are estimated imprecisely.
- Abstract(参考訳): Breimanによる導入以来、ランダムフォレスト(RF)は分類と回帰の両方に有用であることが証明されている。
未確認観測のRF予測は、すべてのトレーニングサンプル観測の重み付け和として表すことができる。
この近傍型表現は、予測分布の構築に特に有用である(Meinshausen, 2006)。
本稿では,RFを用いた予測分布の簡易化について検討する。
すなわち、最も近い隣人の小さな部分集合に焦点をあて、残りの重みを 0 に設定する。
このスペーシフィケーションステップは、RF予測の解釈可能性を大幅に改善する。
既存のRFモデルを再訓練することなく、任意の予測タスクに適用することができる。
実証実験では、単純化された予測は、予測性能の点で元の予測と似ているか、あるいは上回っているかを示す。
RFのスタイリング解析モデルを用いて,この発見の統計的源泉を探究する。
モデルは、未知の真の予測分布が不正確に推定される多くの小さな重みを含む場合、単純化が特に有望であることを示唆している。
関連論文リスト
- Improving probabilistic forecasts of extreme wind speeds by training statistical post-processing models with weighted scoring rules [0.0]
閾値重み付き連続ランク確率スコア(twCRPS)を用いたトレーニングは、後処理モデルの極端なイベント性能を向上させる。
極端事象の確率論的予測の性能が向上し,分布物体の予測性能が低下する分布体テールトレードオフが発見された。
論文 参考訳(メタデータ) (2024-07-22T11:07:52Z) - Relaxed Quantile Regression: Prediction Intervals for Asymmetric Noise [51.87307904567702]
量子レグレッション(Quantile regression)は、出力の分布における量子の実験的推定を通じてそのような間隔を得るための主要なアプローチである。
本稿では、この任意の制約を除去する量子回帰に基づく区間構成の直接的な代替として、Relaxed Quantile Regression (RQR)を提案する。
これにより、柔軟性が向上し、望ましい品質が向上することが実証された。
論文 参考訳(メタデータ) (2024-06-05T13:36:38Z) - Generating Synthetic Ground Truth Distributions for Multi-step Trajectory Prediction using Probabilistic Composite Bézier Curves [4.837320865223374]
本稿では,合成確率的B'ezier曲線に基づく合成データセット生成手法を提案する。
本稿では, 生成した地中真実分布データを用いて, 模範的軌道予測モデルの評価を行う。
論文 参考訳(メタデータ) (2024-04-05T20:50:06Z) - Nearest Neighbour Score Estimators for Diffusion Generative Models [16.189734871742743]
トレーニングセットから複数のサンプルを抽出し,推定値の分散を劇的に低減する新しい近傍スコア関数推定器を提案する。
拡散モデルでは,確率フローODE統合のための学習ネットワークを推定器で置き換えることができ,将来的な研究の新たな道が開かれる。
論文 参考訳(メタデータ) (2024-02-12T19:27:30Z) - Enhanced Local Explainability and Trust Scores with Random Forest Proximities [0.9423257767158634]
我々は任意のランダム森林回帰モデルと分類モデルを適応重み付きK近傍モデルとして数学的に定式化できるという事実を利用する。
この線形性は、トレーニングセットの観測における任意のモデル予測に対する属性を生成するRF予測の局所的な説明可能性を促進する。
本稿では, モデル予測だけでなく, サンプル外性能を説明するために, SHAPと組み合わせて, この近接性に基づく説明可能性のアプローチをいかに活用できるかを示す。
論文 参考訳(メタデータ) (2023-10-19T02:42:20Z) - When Rigidity Hurts: Soft Consistency Regularization for Probabilistic
Hierarchical Time Series Forecasting [69.30930115236228]
確率的階層的時系列予測は時系列予測の重要な変種である。
ほとんどの手法は点予測に焦点を絞っており、確率的確率分布を十分に調整していない。
ProFHiTは,階層全体の予測分布を共同でモデル化する完全確率的階層予測モデルである。
論文 参考訳(メタデータ) (2023-10-17T20:30:16Z) - When Rigidity Hurts: Soft Consistency Regularization for Probabilistic
Hierarchical Time Series Forecasting [69.30930115236228]
確率的階層的時系列予測は時系列予測の重要な変種である。
ほとんどの手法は点予測に焦点を絞っており、確率的確率分布を十分に調整していない。
ProFHiTは,階層全体の予測分布を共同でモデル化する完全確率的階層予測モデルである。
論文 参考訳(メタデータ) (2022-06-16T06:13:53Z) - Uncertainty estimation of pedestrian future trajectory using Bayesian
approximation [137.00426219455116]
動的トラフィックシナリオでは、決定論的予測に基づく計画は信頼できない。
著者らは、決定論的アプローチが捉えられない近似を用いて予測中の不確実性を定量化する。
将来の状態の不確実性に対する降雨重量と長期予測の影響について検討した。
論文 参考訳(メタデータ) (2022-05-04T04:23:38Z) - Distributionally Robust Models with Parametric Likelihood Ratios [123.05074253513935]
3つの単純なアイデアにより、より広いパラメトリックな確率比のクラスを用いてDROでモデルを訓練することができる。
パラメトリック逆数を用いてトレーニングしたモデルは、他のDROアプローチと比較して、サブポピュレーションシフトに対して一貫して頑健であることがわかった。
論文 参考訳(メタデータ) (2022-04-13T12:43:12Z) - Distributional Gradient Boosting Machines [77.34726150561087]
私たちのフレームワークはXGBoostとLightGBMをベースにしています。
我々は,このフレームワークが最先端の予測精度を実現することを示す。
論文 参考訳(メタデータ) (2022-04-02T06:32:19Z) - Multiple imputation using chained random forests: a preliminary study
based on the empirical distribution of out-of-bag prediction errors [0.716879432974126]
実機外予測誤差の実験的分布を条件付き分布として,新しいRF型多重計算法を提案した。
提案した非パラメトリック法は、有効な複数の計算結果を提供することができる。
論文 参考訳(メタデータ) (2020-04-30T14:29:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。