論文の概要: Heterogeneous Oblique Double Random Forest
- arxiv url: http://arxiv.org/abs/2304.06788v1
- Date: Thu, 13 Apr 2023 19:14:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-17 15:29:18.081859
- Title: Heterogeneous Oblique Double Random Forest
- Title(参考訳): 不均質な斜め二重ランダム林
- Authors: M.A. Ganaie and M. Tanveer and I. Beheshti and N. Ahmad and P.N.
Suganthan
- Abstract要約: 斜め決定木の性能は、斜め超平面の生成方法とそれらの超平面の生成に使用されるデータに依存する。
提案モデルでは、ブートストラップデータ上の各非リーフノードに複数の線形分類器を用い、最適線形分類器に基づいて元のデータを分割する。
実験により, 導入した異質な二重ランダム林の性能は, ベースラインモデルよりも比較的良好であることが示唆された。
- 参考スコア(独自算出の注目度): 1.2599533416395767
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The decision tree ensembles use a single data feature at each node for
splitting the data. However, splitting in this manner may fail to capture the
geometric properties of the data. Thus, oblique decision trees generate the
oblique hyperplane for splitting the data at each non-leaf node. Oblique
decision trees capture the geometric properties of the data and hence, show
better generalization. The performance of the oblique decision trees depends on
the way oblique hyperplanes are generate and the data used for the generation
of those hyperplanes. Recently, multiple classifiers have been used in a
heterogeneous random forest (RaF) classifier, however, it fails to generate the
trees of proper depth. Moreover, double RaF studies highlighted that larger
trees can be generated via bootstrapping the data at each non-leaf node and
splitting the original data instead of the bootstrapped data recently. The
study of heterogeneous RaF lacks the generation of larger trees while as the
double RaF based model fails to take over the geometric characteristics of the
data. To address these shortcomings, we propose heterogeneous oblique double
RaF. The proposed model employs several linear classifiers at each non-leaf
node on the bootstrapped data and splits the original data based on the optimal
linear classifier. The optimal hyperplane corresponds to the models based on
the optimized impurity criterion. The experimental analysis indicates that the
performance of the introduced heterogeneous double random forest is
comparatively better than the baseline models. To demonstrate the effectiveness
of the proposed heterogeneous double random forest, we used it for the
diagnosis of Schizophrenia disease. The proposed model predicted the disease
more accurately compared to the baseline models.
- Abstract(参考訳): 決定木アンサンブルは、データを分割するために各ノードで単一のデータ特徴を使用する。
しかし、この方法での分割はデータの幾何学的性質を捉えるのに失敗する。
したがって、斜め決定木は、各非リーフノードでデータを分割する斜め超平面を生成する。
斜め決定木はデータの幾何学的性質を捉え、より良い一般化を示す。
斜め決定木の性能は、斜め超平面の生成方法とそれらの超平面の生成に使用されるデータに依存する。
近年,不均質なランダムフォレスト (raf) 分類器において,複数の分類器が使用されているが,適切な深さの樹木を発生できない。
さらに、二重RaF研究は、各非リーフノードでデータをブートストラップし、ブートストラップされたデータの代わりに元のデータを分割することで、より大きなツリーを生成することができることを強調した。
ヘテロジニアスRaFの研究は、二重RaFモデルがデータの幾何学的特性を引き継ぐのに失敗する一方で、大きな木の生成を欠いている。
これらの欠点に対処するために、異種斜め複層RaFを提案する。
提案モデルでは, ブートストラップデータの各非リーフノードに線形分類器を複数使用し, 最適線形分類器に基づいて元のデータを分割する。
最適超平面は、最適化された不純物基準に基づくモデルに対応する。
実験により,導入した異質な二重ランダム林の性能はベースラインモデルよりも比較的良好であることが示唆された。
提案する不均質な二重ランダム林の有効性を実証するために,統合失調症の診断に用いた。
提案モデルは,本疾患をベースラインモデルよりも正確に予測した。
関連論文リスト
- Latent Semantic Consensus For Deterministic Geometric Model Fitting [109.44565542031384]
我々はLSC(Latent Semantic Consensus)と呼ばれる効果的な方法を提案する。
LSCは、モデルフィッティング問題をデータポイントとモデル仮説に基づく2つの潜在意味空間に定式化する。
LSCは、一般的な多構造モデルフィッティングのために、数ミリ秒以内で一貫した、信頼性の高いソリューションを提供することができる。
論文 参考訳(メタデータ) (2024-03-11T05:35:38Z) - Sharded Bayesian Additive Regression Trees [1.4213973379473654]
データの分割を決定するためにランダム化補助変数とシャーディングツリーを導入する。
積空間上の部分モデルに対する最適シャーディングを最適に設計できることを観察することにより、交差木構造を導入し、木構造のみを用いてシャーディングとモデリングの両方を完全に指定する。
論文 参考訳(メタデータ) (2023-06-01T05:41:31Z) - Hierarchical clustering with dot products recovers hidden tree structure [53.68551192799585]
本稿では,階層構造の回復に着目した凝集クラスタリングアルゴリズムの新しい視点を提案する。
クラスタを最大平均点積でマージし、例えば最小距離やクラスタ内分散でマージしないような、標準的なアルゴリズムの単純な変種を推奨する。
このアルゴリズムにより得られた木は、汎用確率的グラフィカルモデルの下で、データ中の生成的階層構造をボナフェイド推定することを示した。
論文 参考訳(メタデータ) (2023-05-24T11:05:12Z) - HyperAid: Denoising in hyperbolic spaces for tree-fitting and
hierarchical clustering [36.738414547278154]
双曲空間におけるツリーメトリック・デノイング(HyperAid)に対する新しいアプローチを提案する。
Gromovの$delta$ hyperbolicity($delta$ hyperbolicity)の観点から評価すると、元のデータをツリーのようなデータに変換する。
我々はHyperAidを非負のエッジウェイトを強制するためのスキームに統合する。
論文 参考訳(メタデータ) (2022-05-19T17:33:16Z) - BCD Nets: Scalable Variational Approaches for Bayesian Causal Discovery [97.79015388276483]
構造方程式モデル(SEM)は、有向非巡回グラフ(DAG)を介して表される因果関係を推論する効果的な枠組みである。
近年の進歩により、観測データからDAGの有効最大点推定が可能となった。
線形ガウス SEM を特徴付ける DAG 上の分布を推定するための変分フレームワークである BCD Nets を提案する。
論文 参考訳(メタデータ) (2021-12-06T03:35:21Z) - MURAL: An Unsupervised Random Forest-Based Embedding for Electronic
Health Record Data [59.26381272149325]
異なる変数型でデータを表現するための教師なしランダムフォレストを提案する。
muraL forestsは、ノード分割変数がランダムに選択される一連の決定ツリーで構成されている。
提案手法を用いることで,競合するアプローチよりも正確なデータの視覚化と分類が可能であることを示す。
論文 参考訳(メタデータ) (2021-11-19T22:02:21Z) - A cautionary tale on fitting decision trees to data from additive
models: generalization lower bounds [9.546094657606178]
本研究では,異なる回帰モデルに対する決定木の一般化性能について検討する。
これにより、アルゴリズムが新しいデータに一般化するために(あるいは作らない)仮定する帰納的バイアスが引き起こされる。
スパース加法モデルに適合する大規模な決定木アルゴリズムに対して、シャープな2乗誤差一般化を低い境界で証明する。
論文 参考訳(メタデータ) (2021-10-18T21:22:40Z) - A Twin Neural Model for Uplift [59.38563723706796]
Upliftは条件付き治療効果モデリングの特定のケースです。
相対リスクのベイズ解釈との関連性を利用して定義した新たな損失関数を提案する。
本提案手法は,シミュレーション設定の最先端と大規模ランダム化実験による実データとの競合性を示す。
論文 参考訳(メタデータ) (2021-05-11T16:02:39Z) - Spectral Top-Down Recovery of Latent Tree Models [13.681975313065477]
スペクトルトップダウン・リカバリ (STDR) は、大きな潜在木モデルを推定するための分割・コンカレントアプローチである。
STDRの分割ステップは非ランダムです。
代わりに、観測されたノードに関連する適切なラプラシア行列のFiedlerベクトルに基づいている。
私達はSTDRが統計的に一貫性があることを証明し、高い確率で木を正確に回復するために必要なサンプルの数を縛ります。
論文 参考訳(メタデータ) (2021-02-26T02:47:42Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Optimal Decision Trees for Nonlinear Metrics [42.18286681448184]
本稿では,非線形メトリクスに対して最適な木を生成するための新しいアルゴリズムを提案する。
我々の知る限りでは、これは非線形メトリクスに対して証明可能な最適決定木を計算するための最初の方法である。
当社のアプローチは、線形メトリクスの最適化と比較した場合、トレードオフにつながります。
論文 参考訳(メタデータ) (2020-09-15T08:30:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。