論文の概要: Generalised Boosted Forests
- arxiv url: http://arxiv.org/abs/2102.12561v1
- Date: Wed, 24 Feb 2021 21:17:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-27 02:04:07.889950
- Title: Generalised Boosted Forests
- Title(参考訳): 一般化ブースト森林
- Authors: Indrayudh Ghosal, Giles Hooker
- Abstract要約: リンク空間におけるMLE型推定から始まり、それから一般化された残余を定義する。
これらの残差とそれに対応する重みをベースとなるランダムフォレストに適合させ、これを繰り返してブーストランダムフォレストを得る。
我々は、ランダムな森林ステップの両方がテストセットのログ類似度を減少させることをシミュレーションおよび実データで示す。
- 参考スコア(独自算出の注目度): 0.9899017174990579
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper extends recent work on boosting random forests to model
non-Gaussian responses. Given an exponential family $\mathbb{E}[Y|X] =
g^{-1}(f(X))$ our goal is to obtain an estimate for $f$. We start with an
MLE-type estimate in the link space and then define generalised residuals from
it. We use these residuals and some corresponding weights to fit a base random
forest and then repeat the same to obtain a boost random forest. We call the
sum of these three estimators a \textit{generalised boosted forest}. We show
with simulated and real data that both the random forest steps reduces test-set
log-likelihood, which we treat as our primary metric. We also provide a
variance estimator, which we can obtain with the same computational cost as the
original estimate itself. Empirical experiments on real-world data and
simulations demonstrate that the methods can effectively reduce bias, and that
confidence interval coverage is conservative in the bulk of the covariate
distribution.
- Abstract(参考訳): 本稿では、非ガウス応答をモデル化するためのランダム森林の促進に関する最近の研究を拡張した。
指数族 $\mathbb{E}[Y|X] = g^{-1}(f(X))$ を考えると、私たちの目標は$f$の見積もりを得ることです。
リンク空間におけるMLE型推定から始まり、それから一般化された残余を定義する。
これらの残差とそれに対応する重みをベースとなるランダムフォレストに適合させ、これを繰り返してブーストランダムフォレストを得る。
これら3つの見積もりの合計を \textit{Generalized Boosted Forest} と呼ぶ。
我々は、ランダムな森林ステップの両方がテストセットのログ類似度を減少させることをシミュレーションおよび実データで示す。
また, 分散推定器も提供し, 計算コストは元の推定値と同じである。
実世界のデータとシミュレーションに関する実証実験は、この手法がバイアスを効果的に低減し、信頼区間のカバレッジが共変量分布の大部分で保守的であることを示した。
関連論文リスト
- Relaxed Quantile Regression: Prediction Intervals for Asymmetric Noise [51.87307904567702]
量子レグレッション(Quantile regression)は、出力の分布における量子の実験的推定を通じてそのような間隔を得るための主要なアプローチである。
本稿では、この任意の制約を除去する量子回帰に基づく区間構成の直接的な代替として、Relaxed Quantile Regression (RQR)を提案する。
これにより、柔軟性が向上し、望ましい品質が向上することが実証された。
論文 参考訳(メタデータ) (2024-06-05T13:36:38Z) - Inference with Mondrian Random Forests [6.97762648094816]
我々は、モンドリアンのランダムな森林回帰推定器に対して、ベリー・エッセイン型中央極限定理とともに、正確なバイアスと分散特性を与える。
未知回帰関数に対する有効な統計的推測法を提案する。
効率的で実装可能なアルゴリズムは、バッチとオンラインの学習設定の両方に考案されている。
論文 参考訳(メタデータ) (2023-10-15T01:41:42Z) - Accelerating Generalized Random Forests with Fixed-Point Trees [2.810283834703862]
適応的なカーネル重み付けアルゴリズムとしてランダムフォレストを利用する。
固定点反復型近似から誘導される一般化ランダム林に対する新しい木成長則を提案する。
論文 参考訳(メタデータ) (2023-06-20T21:45:35Z) - Revealing Unobservables by Deep Learning: Generative Element Extraction
Networks (GEEN) [5.3028918247347585]
本稿では,ランダムサンプル中の潜伏変数$X*$を推定する新しい手法を提案する。
我々の知る限りでは、この論文は観測においてそのような識別を初めて提供するものである。
論文 参考訳(メタデータ) (2022-10-04T01:09:05Z) - Distributional Gradient Boosting Machines [77.34726150561087]
私たちのフレームワークはXGBoostとLightGBMをベースにしています。
我々は,このフレームワークが最先端の予測精度を実現することを示す。
論文 参考訳(メタデータ) (2022-04-02T06:32:19Z) - On Variance Estimation of Random Forests [0.0]
本稿では,不完全U-統計量に基づく不偏分散推定器を開発する。
我々は,計算コストを増大させることなく,より低いバイアスとより正確な信頼区間のカバレッジを評価できることを示した。
論文 参考訳(メタデータ) (2022-02-18T03:35:47Z) - Unrolling Particles: Unsupervised Learning of Sampling Distributions [102.72972137287728]
粒子フィルタリングは複素系の優れた非線形推定を計算するために用いられる。
粒子フィルタは様々なシナリオにおいて良好な推定値が得られることを示す。
論文 参考訳(メタデータ) (2021-10-06T16:58:34Z) - Heavy-tailed Streaming Statistical Estimation [58.70341336199497]
ストリーミング$p$のサンプルから重み付き統計推定の課題を考察する。
そこで我々は,傾きの雑音に対して,よりニュアンスな条件下での傾きの傾きの低下を設計し,より詳細な解析を行う。
論文 参考訳(メタデータ) (2021-08-25T21:30:27Z) - Random Planted Forest: a directly interpretable tree ensemble [0.0]
回帰設定における予測のための新しい解釈可能な木ベースアルゴリズムを提案する。
シミュレーション研究により,無作為植林手法の予測と可視化特性について検討した。
論文 参考訳(メタデータ) (2020-12-29T01:51:59Z) - Showing Your Work Doesn't Always Work [73.63200097493576]
『Show Your Work: Improved Reporting of Experimental Results』では、最高の学習モデルの有効性を報告している。
解析的にそれらの推定器は偏りがあり、エラーを起こしやすい仮定を用いていることを示す。
我々は、偏見のない代替案を導き、統計的シミュレーションから経験的な証拠で主張を裏付ける。
論文 参考訳(メタデータ) (2020-04-28T17:59:01Z) - Censored Quantile Regression Forest [81.9098291337097]
我々は、検閲に適応し、データが検閲を示さないときに量子スコアをもたらす新しい推定方程式を開発する。
提案手法は, パラメトリックなモデリング仮定を使わずに, 時間単位の定量を推定することができる。
論文 参考訳(メタデータ) (2020-01-08T23:20:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。