論文の概要: Heterogeneous Oblique Double Random Forest
- arxiv url: http://arxiv.org/abs/2304.06788v1
- Date: Thu, 13 Apr 2023 19:14:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-17 15:29:18.081859
- Title: Heterogeneous Oblique Double Random Forest
- Title(参考訳): 不均質な斜め二重ランダム林
- Authors: M.A. Ganaie and M. Tanveer and I. Beheshti and N. Ahmad and P.N.
Suganthan
- Abstract要約: 斜め決定木の性能は、斜め超平面の生成方法とそれらの超平面の生成に使用されるデータに依存する。
提案モデルでは、ブートストラップデータ上の各非リーフノードに複数の線形分類器を用い、最適線形分類器に基づいて元のデータを分割する。
実験により, 導入した異質な二重ランダム林の性能は, ベースラインモデルよりも比較的良好であることが示唆された。
- 参考スコア(独自算出の注目度): 1.2599533416395767
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The decision tree ensembles use a single data feature at each node for
splitting the data. However, splitting in this manner may fail to capture the
geometric properties of the data. Thus, oblique decision trees generate the
oblique hyperplane for splitting the data at each non-leaf node. Oblique
decision trees capture the geometric properties of the data and hence, show
better generalization. The performance of the oblique decision trees depends on
the way oblique hyperplanes are generate and the data used for the generation
of those hyperplanes. Recently, multiple classifiers have been used in a
heterogeneous random forest (RaF) classifier, however, it fails to generate the
trees of proper depth. Moreover, double RaF studies highlighted that larger
trees can be generated via bootstrapping the data at each non-leaf node and
splitting the original data instead of the bootstrapped data recently. The
study of heterogeneous RaF lacks the generation of larger trees while as the
double RaF based model fails to take over the geometric characteristics of the
data. To address these shortcomings, we propose heterogeneous oblique double
RaF. The proposed model employs several linear classifiers at each non-leaf
node on the bootstrapped data and splits the original data based on the optimal
linear classifier. The optimal hyperplane corresponds to the models based on
the optimized impurity criterion. The experimental analysis indicates that the
performance of the introduced heterogeneous double random forest is
comparatively better than the baseline models. To demonstrate the effectiveness
of the proposed heterogeneous double random forest, we used it for the
diagnosis of Schizophrenia disease. The proposed model predicted the disease
more accurately compared to the baseline models.
- Abstract(参考訳): 決定木アンサンブルは、データを分割するために各ノードで単一のデータ特徴を使用する。
しかし、この方法での分割はデータの幾何学的性質を捉えるのに失敗する。
したがって、斜め決定木は、各非リーフノードでデータを分割する斜め超平面を生成する。
斜め決定木はデータの幾何学的性質を捉え、より良い一般化を示す。
斜め決定木の性能は、斜め超平面の生成方法とそれらの超平面の生成に使用されるデータに依存する。
近年,不均質なランダムフォレスト (raf) 分類器において,複数の分類器が使用されているが,適切な深さの樹木を発生できない。
さらに、二重RaF研究は、各非リーフノードでデータをブートストラップし、ブートストラップされたデータの代わりに元のデータを分割することで、より大きなツリーを生成することができることを強調した。
ヘテロジニアスRaFの研究は、二重RaFモデルがデータの幾何学的特性を引き継ぐのに失敗する一方で、大きな木の生成を欠いている。
これらの欠点に対処するために、異種斜め複層RaFを提案する。
提案モデルでは, ブートストラップデータの各非リーフノードに線形分類器を複数使用し, 最適線形分類器に基づいて元のデータを分割する。
最適超平面は、最適化された不純物基準に基づくモデルに対応する。
実験により,導入した異質な二重ランダム林の性能はベースラインモデルよりも比較的良好であることが示唆された。
提案する不均質な二重ランダム林の有効性を実証するために,統合失調症の診断に用いた。
提案モデルは,本疾患をベースラインモデルよりも正確に予測した。
関連論文リスト
- Identifying General Mechanism Shifts in Linear Causal Representations [58.6238439611389]
我々は,未知の潜在因子の線形混合を観測する線形因果表現学習環境について考察する。
近年の研究では、潜伏要因の復元や、それに基づく構造因果モデルの構築が可能であることが示されている。
非常に穏やかな標準仮定の下では、シフトしたノードの集合を識別することが可能である。
論文 参考訳(メタデータ) (2024-10-31T15:56:50Z) - Heterogeneous Random Forest [2.0646127669654835]
不均一ランダムフォレスト(HRF)は、木多様性を有意義な方法で向上させるように設計されている。
HRFは、ほとんどのデータセットの精度において、他のアンサンブル手法よりも一貫して優れていた。
論文 参考訳(メタデータ) (2024-10-24T09:18:55Z) - Learning Deep Tree-based Retriever for Efficient Recommendation: Theory and Method [76.31185707649227]
効率的なレコメンデーションのために,Deep Tree-based Retriever (DTR)を提案する。
DTRは、トレーニングタスクを、同じレベルでツリーノード上のソフトマックスベースのマルチクラス分類としてフレーム化している。
非リーフノードのラベル付けによって引き起こされる準最適性を緩和するため、損失関数の補正法を提案する。
論文 参考訳(メタデータ) (2024-08-21T05:09:53Z) - Statistical Advantages of Oblique Randomized Decision Trees and Forests [0.0]
リッジ関数のフレキシブル次元縮小モデルクラスに対して一般化誤差と収束率を求める。
軸方向のモンドリアン木のリスクに対する低い境界は、これらの線形次元減少モデルに対してこれらの推定値が最適であることを示す。
論文 参考訳(メタデータ) (2024-07-02T17:35:22Z) - Forecasting with Hyper-Trees [50.72190208487953]
Hyper-Treesは時系列モデルのパラメータを学習するために設計されている。
対象とする時系列モデルのパラメータを特徴に関連付けることで、Hyper-Treesはパラメータ非定常性の問題にも対処する。
この新しいアプローチでは、木はまず入力特徴から情報表現を生成し、浅いネットワークはターゲットモデルパラメータにマップする。
論文 参考訳(メタデータ) (2024-05-13T15:22:15Z) - Generation is better than Modification: Combating High Class Homophily Variance in Graph Anomaly Detection [51.11833609431406]
異なるクラス間のホモフィリー分布の差は、ホモフィリックグラフやヘテロフィリックグラフよりも著しく大きい。
我々は、この現象を定量的に記述した、クラスホモフィリーバリアンスと呼ばれる新しい計量を導入する。
その影響を軽減するために,ホモフィリーエッジ生成グラフニューラルネットワーク(HedGe)と呼ばれる新しいGNNモデルを提案する。
論文 参考訳(メタデータ) (2024-03-15T14:26:53Z) - Hierarchical clustering with dot products recovers hidden tree structure [53.68551192799585]
本稿では,階層構造の回復に着目した凝集クラスタリングアルゴリズムの新しい視点を提案する。
クラスタを最大平均点積でマージし、例えば最小距離やクラスタ内分散でマージしないような、標準的なアルゴリズムの単純な変種を推奨する。
このアルゴリズムにより得られた木は、汎用確率的グラフィカルモデルの下で、データ中の生成的階層構造をボナフェイド推定することを示した。
論文 参考訳(メタデータ) (2023-05-24T11:05:12Z) - A cautionary tale on fitting decision trees to data from additive
models: generalization lower bounds [9.546094657606178]
本研究では,異なる回帰モデルに対する決定木の一般化性能について検討する。
これにより、アルゴリズムが新しいデータに一般化するために(あるいは作らない)仮定する帰納的バイアスが引き起こされる。
スパース加法モデルに適合する大規模な決定木アルゴリズムに対して、シャープな2乗誤差一般化を低い境界で証明する。
論文 参考訳(メタデータ) (2021-10-18T21:22:40Z) - Spectral Top-Down Recovery of Latent Tree Models [13.681975313065477]
スペクトルトップダウン・リカバリ (STDR) は、大きな潜在木モデルを推定するための分割・コンカレントアプローチである。
STDRの分割ステップは非ランダムです。
代わりに、観測されたノードに関連する適切なラプラシア行列のFiedlerベクトルに基づいている。
私達はSTDRが統計的に一貫性があることを証明し、高い確率で木を正確に回復するために必要なサンプルの数を縛ります。
論文 参考訳(メタデータ) (2021-02-26T02:47:42Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Optimal Decision Trees for Nonlinear Metrics [42.18286681448184]
本稿では,非線形メトリクスに対して最適な木を生成するための新しいアルゴリズムを提案する。
我々の知る限りでは、これは非線形メトリクスに対して証明可能な最適決定木を計算するための最初の方法である。
当社のアプローチは、線形メトリクスの最適化と比較した場合、トレードオフにつながります。
論文 参考訳(メタデータ) (2020-09-15T08:30:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。