論文の概要: AR-Sieve Bootstrap for the Random Forest and a simulation-based comparison with rangerts time series prediction
- arxiv url: http://arxiv.org/abs/2410.00942v1
- Date: Tue, 1 Oct 2024 14:07:58 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-05 00:09:47.544045
- Title: AR-Sieve Bootstrap for the Random Forest and a simulation-based comparison with rangerts time series prediction
- Title(参考訳): AR-Sieve Bootstrap for the Random Forest and a Simulation-based comparison with Rangerts time series prediction
- Authors: Cabrel Teguemne Fokam, Carsten Jentsch, Michel Lang, Markus Pauly,
- Abstract要約: ランダムフォレスト(RF)アルゴリズムは、時系列予測を含む幅広い問題に適用できる。
RFと残りのブートストラップ技術の組み合わせを提案する。
ARSBはDGPを自己回帰過程と仮定する。
- 参考スコア(独自算出の注目度): 1.3832821078847204
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The Random Forest (RF) algorithm can be applied to a broad spectrum of problems, including time series prediction. However, neither the classical IID (Independent and Identically distributed) bootstrap nor block bootstrapping strategies (as implemented in rangerts) completely account for the nature of the Data Generating Process (DGP) while resampling the observations. We propose the combination of RF with a residual bootstrapping technique where we replace the IID bootstrap with the AR-Sieve Bootstrap (ARSB), which assumes the DGP to be an autoregressive process. To assess the new model's predictive performance, we conduct a simulation study using synthetic data generated from different types of DGPs. It turns out that ARSB provides more variation amongst the trees in the forest. Moreover, RF with ARSB shows greater accuracy compared to RF with other bootstrap strategies. However, these improvements are achieved at some efficiency costs.
- Abstract(参考訳): ランダムフォレスト(RF)アルゴリズムは、時系列予測を含む幅広い問題に適用できる。
しかし、古典的なIID(独立性とIdentically分散)ブートストラップやブロックブートストラップ戦略(レンジトで実装されている)は、観測を再サンプリングしながらデータ生成プロセス(DGP)の性質を完全に説明していない。
本稿では, DGP を自己回帰プロセスとみなす AR-Sieve Bootstrap (ARSB) に, IID ブートストラップを置き換えた残留ブートストラップ技術と組み合わせて提案する。
新たなモデルの予測性能を評価するために,異なるタイプのDGPから生成された合成データを用いてシミュレーション研究を行う。
ARSBは、森林内の木々の多様性をより高めていることが判明した。
さらに、ARSBを用いたRFは、他のブートストラップ戦略に比べて精度が高い。
しかし、これらの改善はある程度の効率性で達成されている。
関連論文リスト
- Anchor Data Augmentation [53.39044919864444]
非線形過パラメータ回帰におけるデータ拡張のための新しいアルゴリズムを提案する。
我々のデータ拡張アルゴリズムは、因果関係に関する文献から借用し、最近提案されたデータ拡張のためのアンカー回帰(AR)法を拡張した。
論文 参考訳(メタデータ) (2023-11-12T21:08:43Z) - Forest Parameter Prediction by Multiobjective Deep Learning of
Regression Models Trained with Pseudo-Target Imputation [6.853936752111048]
リモートセンシングデータを用いた森林パラメータの予測において、回帰モデルは、伝統的に地上基準データの小さなサンプルに基づいて訓練されてきた。
本稿では, 擬似ターゲットとみなす既存の RS ベースの予測マップからのデータを用いて, この真の予測対象のサンプルをインプットする。
我々は、空中レーザー走査(ALS)データから構築された予測マップを用いて、正確な擬似ターゲットと、Sentinel-1のCバンド合成開口レーダ(SAR)のデータを回帰器として提供する。
論文 参考訳(メタデータ) (2023-06-19T18:10:47Z) - Random forests for binary geospatial data [0.0]
既存のバイナリデータに対するランダムフォレストの実装では、地理空間や時系列設定に共通するデータ相関を明示的に説明することはできない。
最近の研究は、一般化最小二乗損失(GLS)を用いた空間共分散を含むランダム森林(RF)をRF-GLSに拡張している。
二進データの場合、GLS損失はGiniの不純物測度の拡張であり、後者は通常の最小二乗損失(OLS)と全く同じである。
一般化された第1段階からの平均関数のRF-GLS推定を組み込む新しいリンク変換手法を提案する。
論文 参考訳(メタデータ) (2023-02-27T14:34:33Z) - Fast variable selection makes scalable Gaussian process BSS-ANOVA a
speedy and accurate choice for tabular and time series regression [0.0]
ガウス過程 (GP) は長い歴史を持つ非パラメトリック回帰エンジンである。
拡張性のあるGPアプローチの1つは、2009年に開発されたKL(Karhunen-Lo'eve)分解カーネルBSS-ANOVAである。
項の数を迅速かつ効果的に制限し、競争力のある精度の方法をもたらす新しい変数選択法である。
論文 参考訳(メタデータ) (2022-05-26T23:41:43Z) - Local Gaussian process extrapolation for BART models with applications
to causal inference [0.7734726150561088]
本稿では, ガウス過程をBARTの葉ノードに移植し, 観測データの範囲外の点を予測するための新しい外挿法を提案する。
シミュレーション研究において、新しいアプローチはJackknife+のような一般的な代替手段よりも優れたパフォーマンスを誇っている。
論文 参考訳(メタデータ) (2022-04-23T00:37:53Z) - Distributionally Robust Models with Parametric Likelihood Ratios [123.05074253513935]
3つの単純なアイデアにより、より広いパラメトリックな確率比のクラスを用いてDROでモデルを訓練することができる。
パラメトリック逆数を用いてトレーニングしたモデルは、他のDROアプローチと比較して、サブポピュレーションシフトに対して一貫して頑健であることがわかった。
論文 参考訳(メタデータ) (2022-04-13T12:43:12Z) - GP-BART: a novel Bayesian additive regression trees approach using
Gaussian processes [1.03590082373586]
GP-BARTモデル(GP-BART model)は、すべての木間の各終端ノードの予測にGP先行を仮定することで制限に対処するBARTの拡張である。
モデルの有効性は、シミュレーションおよび実世界のデータへの応用を通じて実証され、様々なシナリオにおける従来のモデリング手法のパフォーマンスを上回る。
論文 参考訳(メタデータ) (2022-04-05T11:18:44Z) - Non-Gaussian Gaussian Processes for Few-Shot Regression [71.33730039795921]
乱変数ベクトルの各成分上で動作し,パラメータを全て共有する可逆なODEベースのマッピングを提案する。
NGGPは、様々なベンチマークとアプリケーションに対する競合する最先端のアプローチよりも優れています。
論文 参考訳(メタデータ) (2021-10-26T10:45:25Z) - An EM Approach to Non-autoregressive Conditional Sequence Generation [49.11858479436565]
自己回帰(AR)モデルは条件付きシーケンス生成において支配的なアプローチである。
非自己回帰(NAR)モデルは、最近、すべての出力トークンを並列に生成することでレイテンシを低減するために提案されている。
本稿では,ARモデルとNARモデルの両方を統合期待最大化フレームワークで協調的に最適化する手法を提案する。
論文 参考訳(メタデータ) (2020-06-29T20:58:57Z) - Stochastic-Sign SGD for Federated Learning with Theoretical Guarantees [49.91477656517431]
量子化に基づく解法は、フェデレートラーニング(FL)において広く採用されている。
上記のプロパティをすべて享受する既存のメソッドはありません。
本稿では,SIGNSGDに基づく直感的かつ理論的に簡易な手法を提案し,そのギャップを埋める。
論文 参考訳(メタデータ) (2020-02-25T15:12:15Z) - Learnable Bernoulli Dropout for Bayesian Deep Learning [53.79615543862426]
Learnable Bernoulli Dropout (LBD) は、他のモデルパラメータと共に最適化されたパラメータとしてドロップアウト率を考慮する新しいモデルに依存しないドロップアウトスキームである。
LBDは画像分類とセマンティックセグメンテーションにおける精度と不確実性の推定を改善する。
論文 参考訳(メタデータ) (2020-02-12T18:57:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。