論文の概要: Lassoed Forests: Random Forests with Adaptive Lasso Post-selection
- arxiv url: http://arxiv.org/abs/2511.06698v2
- Date: Thu, 13 Nov 2025 01:07:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-13 14:36:36.949434
- Title: Lassoed Forests: Random Forests with Adaptive Lasso Post-selection
- Title(参考訳): Lassoed forests:Adaptive Lasso Post-selection
- Authors: Jing Shang, James Bannon, Benjamin Haibe-Kains, Robert Tibshirani,
- Abstract要約: 理論上,標準およびラッソ重み付きランダム林の相対的な性能は信号対雑音比に依存することを示す。
適応重み付けを適用し,ランダム林とラッソ選別を組み合わせた統合フレームワークを提案する。
- 参考スコア(独自算出の注目度): 36.24615773895282
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Random forests are a statistical learning technique that use bootstrap aggregation to average high-variance and low-bias trees. Improvements to random forests, such as applying Lasso regression to the tree predictions, have been proposed in order to reduce model bias. However, these changes can sometimes degrade performance (e.g., an increase in mean squared error). In this paper, we show in theory that the relative performance of these two methods, standard and Lasso-weighted random forests, depends on the signal-to-noise ratio. We further propose a unified framework to combine random forests and Lasso selection by applying adaptive weighting and show mathematically that it can strictly outperform the other two methods. We compare the three methods through simulation, including bias-variance decomposition, error estimates evaluation, and variable importance analysis. We also show the versatility of our method by applications to a variety of real-world datasets.
- Abstract(参考訳): ランダム・フォレスト(Random Forests)は、平均的な高分散木と低バイアス木にブートストラップアグリゲーションを利用する統計学習技術である。
モデルバイアスを低減するため, 樹木予測にラッソ回帰を適用するなど, ランダム林の改善が提案されている。
しかし、これらの変更はパフォーマンスを低下させることがある(例えば平均二乗誤差の増加)。
本稿では,この2つの手法,標準林とラッソ重み付きランダム林の相対的性能が信号-雑音比に依存することを示す。
さらに,適応重み付けを適用し,ランダム林とラッソ選別を組み合わせた統一的な枠組みを提案し,他の2つの手法を厳密に上回り得ることを数学的に示す。
本稿では, バイアス分散分解, 誤差推定評価, 変数重要度解析を含む3つの手法をシミュレーションにより比較する。
また,本手法の様々な実世界のデータセットへの応用による汎用性を示す。
関連論文リスト
- Clustered random forests with correlated data for optimal estimation and inference under potential covariate shift [4.13592995550836]
我々はクラスタ内の依存を示す独立したグループから生じるランダムなデータに対するランダムなフォレストアルゴリズムであるClustered Random Forestsを開発した。
集団化されたランダム林を構成する各決定木の葉回り予測は、重み付き最小二乗推定器の形を取る。
伐採された無作為林は、特定の樹木分割基準に対して、ポイントワイド条件の平均推定に最適なミニマックスレートを示す。
論文 参考訳(メタデータ) (2025-03-16T20:07:23Z) - Adaptive Split Balancing for Optimal Random Forest [8.916614661563893]
そこで本研究では,新しい適応型分割バランス法を用いて木を構築するランダムフォレストアルゴリズムを提案する。
本手法は,データから木構造を適応的に学習しながら,シンプルでスムーズなシナリオで最適性を実現する。
論文 参考訳(メタデータ) (2024-02-17T09:10:40Z) - Theoretical and Empirical Advances in Forest Pruning [0.0]
回帰林の精度と回帰樹の解釈可能性という両世界の最善を尽くすアプローチである森林伐採を再考する。
我々は、弱い仮定の下で、未伐採林に対するラッソ伐採林の利点を証明した。
我々は19の異なるデータセット上の未伐採林に対する伐採林の精度を検証した。
論文 参考訳(メタデータ) (2024-01-10T20:02:47Z) - Inference with Mondrian Random Forests [7.404568009919416]
我々は、モンドリアンのランダムな森林回帰推定器に対して、ベリー・エッセイン型中央極限定理とともに、正確なバイアスと分散特性を与える。
未知回帰関数に対する有効な統計的推測法を提案する。
効率的で実装可能なアルゴリズムは、バッチとオンラインの学習設定の両方に考案されている。
論文 参考訳(メタデータ) (2023-10-15T01:41:42Z) - Random Forest Weighted Local Fréchet Regression with Random Objects [18.128663071848923]
本稿では,新しいランダム森林重み付き局所Fr'echet回帰パラダイムを提案する。
最初の方法は、これらの重みを局所平均として、条件付きFr'echet平均を解くことである。
第二の手法は局所線形Fr'echet回帰を行い、どちらも既存のFr'echet回帰法を大幅に改善した。
論文 参考訳(メタデータ) (2022-02-10T09:10:59Z) - Stochastic Optimization Forests [60.523606291705214]
標準的なランダムな森林アルゴリズムのように予測精度を向上させるために分割するのではなく、分割を選択した木を栽培し、下流の意思決定品質を直接最適化することで、森林決定政策の訓練方法を示す。
概略分割基準は、各候補分割に対して正確に最適化された森林アルゴリズムに近い性能を保ちながら、100倍のランニング時間を短縮できることを示す。
論文 参考訳(メタデータ) (2020-08-17T16:56:06Z) - Censored Quantile Regression Forest [81.9098291337097]
我々は、検閲に適応し、データが検閲を示さないときに量子スコアをもたらす新しい推定方程式を開発する。
提案手法は, パラメトリックなモデリング仮定を使わずに, 時間単位の定量を推定することができる。
論文 参考訳(メタデータ) (2020-01-08T23:20:23Z) - Adaptive Correlated Monte Carlo for Contextual Categorical Sequence
Generation [77.7420231319632]
我々は,モンテカルロ (MC) ロールアウトの集合を分散制御のために評価する政策勾配推定器に,カテゴリー列の文脈的生成を適用する。
また,二分木ソフトマックスモデルに相関したMCロールアウトを用いることで,大語彙シナリオにおける高生成コストを低減できることを示す。
論文 参考訳(メタデータ) (2019-12-31T03:01:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。