論文の概要: Targeted tuning of random forests for quantile estimation and prediction intervals
- arxiv url: http://arxiv.org/abs/2507.01430v1
- Date: Wed, 02 Jul 2025 07:32:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-03 14:23:00.085771
- Title: Targeted tuning of random forests for quantile estimation and prediction intervals
- Title(参考訳): 定量推定と予測区間のためのランダム森林の目標調整
- Authors: Matthew Berkowitz, Rachel MacKay Altman, Thomas M. Loughin,
- Abstract要約: 本稿では,推定定量値の精度を向上するランダム森林(RF)の新たなチューニング手法を提案する。
そこで本研究では,QCLチューニング結果が,デフォルトパラメータ値を用いて達成した値よりも,より正確なカバレッジ確率を持つ定量推定値となることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a novel tuning procedure for random forests (RFs) that improves the accuracy of estimated quantiles and produces valid, relatively narrow prediction intervals. While RFs are typically used to estimate mean responses (conditional on covariates), they can also be used to estimate quantiles by estimating the full distribution of the response. However, standard approaches for building RFs often result in excessively biased quantile estimates. To reduce this bias, our proposed tuning procedure minimizes "quantile coverage loss" (QCL), which we define as the estimated bias of the marginal quantile coverage probability estimate based on the out-of-bag sample. We adapt QCL tuning to handle censored data and demonstrate its use with random survival forests. We show that QCL tuning results in quantile estimates with more accurate coverage probabilities than those achieved using default parameter values or traditional tuning (using MSPE for uncensored data and C-index for censored data), while also reducing the estimated MSE of these coverage probabilities. We discuss how the superior performance of QCL tuning is linked to its alignment with the estimation goal. Finally, we explore the validity and width of prediction intervals created using this method.
- Abstract(参考訳): 本稿では,推定された定量値の精度を向上し,比較的狭い予測区間を生成するランダム森林(RF)の新しいチューニング手法を提案する。
RFは平均応答(共変量に関する条件)を推定するために使用されるのが一般的であるが、応答の完全な分布を推定することで量子化を推定するためにも用いられる。
しかし、RFを構築するための標準的なアプローチは、しばしば過度に偏りのある量子的推定をもたらす。
このバイアスを低減するため,本提案手法は「QCL (quantile coverage loss) 」を最小化し,バッグ外サンプルに基づく限界量子的カバレッジ確率推定値の推定バイアスとして定義する。
我々は、検閲されたデータを扱うためにQCLチューニングを適用し、ランダムサバイバル森林での使用を実演する。
また,QCLチューニングの結果は,デフォルトパラメータ値や従来のチューニング(非検閲データではMSPE,検閲データではCインデックス)よりも精度の高い定量推定値であり,また,これらのカバレッジ確率の推定MSEを低減していることを示す。
本稿では,QCLチューニングの優れた性能と推定目標との整合性との関連について論じる。
最後に,本手法を用いて生成した予測区間の妥当性と幅について検討する。
関連論文リスト
- COIN: Uncertainty-Guarding Selective Question Answering for Foundation Models with Provable Risk Guarantees [51.5976496056012]
COINは、統計的に有効な閾値を校正し、質問毎に1つの生成された回答をフィルタリングする不確実性保護選択フレームワークである。
COINはキャリブレーションセット上で経験的誤差率を推定し、信頼区間法を適用して真誤差率に高い確率上界を確立する。
リスク管理におけるCOINの堅牢性,許容回答を維持するための強いテストタイムパワー,キャリブレーションデータによる予測効率を実証する。
論文 参考訳(メタデータ) (2025-06-25T07:04:49Z) - Semiparametric conformal prediction [79.6147286161434]
ベクトル値の非整合性スコアの結合相関構造を考慮した共形予測セットを構築する。
スコアの累積分布関数(CDF)を柔軟に推定する。
提案手法は,現実の回帰問題に対して,所望のカバレッジと競争効率をもたらす。
論文 参考訳(メタデータ) (2024-11-04T14:29:02Z) - Relaxed Quantile Regression: Prediction Intervals for Asymmetric Noise [51.87307904567702]
量子レグレッション(Quantile regression)は、出力の分布における量子の実験的推定を通じてそのような間隔を得るための主要なアプローチである。
本稿では、この任意の制約を除去する量子回帰に基づく区間構成の直接的な代替として、Relaxed Quantile Regression (RQR)を提案する。
これにより、柔軟性が向上し、望ましい品質が向上することが実証された。
論文 参考訳(メタデータ) (2024-06-05T13:36:38Z) - Overlapping Batch Confidence Intervals on Statistical Functionals
Constructed from Time Series: Application to Quantiles, Optimization, and
Estimation [5.068678962285631]
定常時系列データを用いて構築した統計関数に対する信頼区間手順を提案する。
OBx制限は、バッチのサイズと重複の程度によってパラメータ化されたWienerプロセスの特定の機能であり、依存を特徴づけるための必須の機械を形成する。
論文 参考訳(メタデータ) (2023-07-17T16:21:48Z) - SUMO: Unbiased Estimation of Log Marginal Probability for Latent
Variable Models [80.22609163316459]
無限級数のランダム化トランケーションに基づく潜在変数モデルに対して、ログ境界確率の非バイアス推定器とその勾配を導入する。
推定器を用いてトレーニングしたモデルは、同じ平均計算コストに対して、標準的な重要度サンプリングに基づくアプローチよりも優れたテストセット確率を与えることを示す。
論文 参考訳(メタデータ) (2020-04-01T11:49:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。