論文の概要: Large Scale Prediction with Decision Trees
- arxiv url: http://arxiv.org/abs/2104.13881v5
- Date: Mon, 13 Nov 2023 19:40:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-15 19:49:55.213766
- Title: Large Scale Prediction with Decision Trees
- Title(参考訳): 決定木を用いた大規模予測
- Authors: Jason M. Klusowski and Peter M. Tian
- Abstract要約: 本稿では,分類・回帰木(CART)とC4.5手法を用いて構築した決定木が,回帰・分類タスクに一貫性があることを示す。
この分析における重要なステップは、不平等の確立であり、不特定モデルの適合性と複雑性のトレードオフを正確に評価することができる。
- 参考スコア(独自算出の注目度): 9.917147243076645
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper shows that decision trees constructed with Classification and
Regression Trees (CART) and C4.5 methodology are consistent for regression and
classification tasks, even when the number of predictor variables grows
sub-exponentially with the sample size, under natural 0-norm and 1-norm
sparsity constraints. The theory applies to a wide range of models, including
(ordinary or logistic) additive regression models with component functions that
are continuous, of bounded variation, or, more generally, Borel measurable.
Consistency holds for arbitrary joint distributions of the predictor variables,
thereby accommodating continuous, discrete, and/or dependent data. Finally, we
show that these qualitative properties of individual trees are inherited by
Breiman's random forests. A key step in the analysis is the establishment of an
oracle inequality, which allows for a precise characterization of the
goodness-of-fit and complexity tradeoff for a mis-specified model.
- Abstract(参考訳): 本稿では, CART法とC4.5法を用いて構築された決定木が, 自然の0ノルムと1ノルムの空間的制約の下で, 予測変数の数が標本サイズに比例して増加する場合でも, 回帰および分類タスクに一貫性があることを示す。
この理論は、連続な、有界変動の、あるいはより一般的にはボレル可測な成分関数を持つ(通常またはロジスティック)加法回帰モデルを含む幅広いモデルに適用される。
一貫性は予測変数の任意の結合分布を保持し、連続的、離散的、および/または依存的なデータを調節する。
最後に,個々の樹木の質的性質は,ブレイマンのランダム林に受け継がれていることを示す。
この分析における重要なステップは、不平等の確立であり、不特定モデルの適合性と複雑性のトレードオフを正確に評価することができる。
関連論文リスト
- Statistical Advantages of Oblique Randomized Decision Trees and Forests [0.0]
リッジ関数のフレキシブル次元縮小モデルクラスに対して一般化誤差と収束率を求める。
軸方向のモンドリアン木のリスクに対する低い境界は、これらの線形次元減少モデルに対してこれらの推定値が最適であることを示す。
論文 参考訳(メタデータ) (2024-07-02T17:35:22Z) - Distributional Adaptive Soft Regression Trees [0.0]
本稿では,多変量ソフトスプリットルールを用いた分布回帰木の新しいタイプを提案する。
ソフトスプリットの大きな利点の1つは、滑らかな高次元函数を1つの木で見積もることができることである。
シミュレーションにより,アルゴリズムは優れた特性を有し,様々なベンチマーク手法より優れていることを示す。
論文 参考訳(メタデータ) (2022-10-19T08:59:02Z) - On the Strong Correlation Between Model Invariance and Generalization [54.812786542023325]
一般化は、見えないデータを分類するモデルの能力をキャプチャする。
不変性はデータの変換におけるモデル予測の一貫性を測定する。
データセット中心の視点から、あるモデルの精度と不変性は異なるテストセット上で線形に相関している。
論文 参考訳(メタデータ) (2022-07-14T17:08:25Z) - Predicting Out-of-Domain Generalization with Neighborhood Invariance [59.05399533508682]
局所変換近傍における分類器の出力不変性の尺度を提案する。
私たちの測度は計算が簡単で、テストポイントの真のラベルに依存しません。
画像分類,感情分析,自然言語推論のベンチマーク実験において,我々の測定値と実際のOOD一般化との間に強い相関関係を示す。
論文 参考訳(メタデータ) (2022-07-05T14:55:16Z) - TreeFlow: Going beyond Tree-based Gaussian Probabilistic Regression [0.0]
ツリーアンサンブルを使うことの利点と柔軟な確率分布をモデル化する能力を組み合わせたツリーベースアプローチであるTreeFlowを紹介した。
提案手法は, 諸量, 特徴量, 目標寸法の異なる回帰ベンチマークを用いて評価する。
論文 参考訳(メタデータ) (2022-06-08T20:06:23Z) - On Uncertainty Estimation by Tree-based Surrogate Models in Sequential
Model-based Optimization [13.52611859628841]
予測不確実性推定の観点から,ランダム化木の様々なアンサンブルを再検討し,その挙動について検討する。
BwO林と呼ばれる無作為な樹木のアンサンブルを構築するための新しい手法を提案する。
実験により,既存の樹木モデルに対するBwO林の有効性と性能について様々な状況で検証した。
論文 参考訳(メタデータ) (2022-02-22T04:50:37Z) - A cautionary tale on fitting decision trees to data from additive
models: generalization lower bounds [9.546094657606178]
本研究では,異なる回帰モデルに対する決定木の一般化性能について検討する。
これにより、アルゴリズムが新しいデータに一般化するために(あるいは作らない)仮定する帰納的バイアスが引き起こされる。
スパース加法モデルに適合する大規模な決定木アルゴリズムに対して、シャープな2乗誤差一般化を低い境界で証明する。
論文 参考訳(メタデータ) (2021-10-18T21:22:40Z) - Estimation of Bivariate Structural Causal Models by Variational Gaussian
Process Regression Under Likelihoods Parametrised by Normalising Flows [74.85071867225533]
因果機構は構造因果モデルによって記述できる。
最先端の人工知能の大きな欠点の1つは、説明責任の欠如である。
論文 参考訳(メタデータ) (2021-09-06T14:52:58Z) - Variational Causal Networks: Approximate Bayesian Inference over Causal
Structures [132.74509389517203]
離散DAG空間上の自己回帰分布をモデル化したパラメトリック変分族を導入する。
実験では,提案した変分後部が真の後部を良好に近似できることを示した。
論文 参考訳(メタデータ) (2021-06-14T17:52:49Z) - Latent Causal Invariant Model [128.7508609492542]
現在の教師付き学習は、データ適合プロセス中に急激な相関を学習することができる。
因果予測を求める潜在因果不変モデル(LaCIM)を提案する。
論文 参考訳(メタデータ) (2020-11-04T10:00:27Z) - On the Discrepancy between Density Estimation and Sequence Generation [92.70116082182076]
log-likelihoodは、同じファミリー内のモデルを考えるとき、BLEUと非常に相関している。
異なる家族間でのモデルランキングの相関はみられない。
論文 参考訳(メタデータ) (2020-02-17T20:13:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。