Fugu-MT 論文翻訳(概要): Heterogeneous Oblique Double Random Forest

論文の概要: Heterogeneous Oblique Double Random Forest

arxiv url: http://arxiv.org/abs/2304.06788v1
Date: Thu, 13 Apr 2023 19:14:23 GMT
ステータス: 翻訳完了
システム内更新日: 2023-04-17 15:29:18.081859
Title: Heterogeneous Oblique Double Random Forest
Title（参考訳）: 不均質な斜め二重ランダム林
Authors: M.A. Ganaie and M. Tanveer and I. Beheshti and N. Ahmad and P.N. Suganthan
Abstract要約: 斜め決定木の性能は、斜め超平面の生成方法とそれらの超平面の生成に使用されるデータに依存する。提案モデルでは、ブートストラップデータ上の各非リーフノードに複数の線形分類器を用い、最適線形分類器に基づいて元のデータを分割する。実験により, 導入した異質な二重ランダム林の性能は, ベースラインモデルよりも比較的良好であることが示唆された。
参考スコア（独自算出の注目度）: 1.2599533416395767
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: The decision tree ensembles use a single data feature at each node for splitting the data. However, splitting in this manner may fail to capture the geometric properties of the data. Thus, oblique decision trees generate the oblique hyperplane for splitting the data at each non-leaf node. Oblique decision trees capture the geometric properties of the data and hence, show better generalization. The performance of the oblique decision trees depends on the way oblique hyperplanes are generate and the data used for the generation of those hyperplanes. Recently, multiple classifiers have been used in a heterogeneous random forest (RaF) classifier, however, it fails to generate the trees of proper depth. Moreover, double RaF studies highlighted that larger trees can be generated via bootstrapping the data at each non-leaf node and splitting the original data instead of the bootstrapped data recently. The study of heterogeneous RaF lacks the generation of larger trees while as the double RaF based model fails to take over the geometric characteristics of the data. To address these shortcomings, we propose heterogeneous oblique double RaF. The proposed model employs several linear classifiers at each non-leaf node on the bootstrapped data and splits the original data based on the optimal linear classifier. The optimal hyperplane corresponds to the models based on the optimized impurity criterion. The experimental analysis indicates that the performance of the introduced heterogeneous double random forest is comparatively better than the baseline models. To demonstrate the effectiveness of the proposed heterogeneous double random forest, we used it for the diagnosis of Schizophrenia disease. The proposed model predicted the disease more accurately compared to the baseline models.
Abstract（参考訳）: 決定木アンサンブルは、データを分割するために各ノードで単一のデータ特徴を使用する。しかし、この方法での分割はデータの幾何学的性質を捉えるのに失敗する。したがって、斜め決定木は、各非リーフノードでデータを分割する斜め超平面を生成する。斜め決定木はデータの幾何学的性質を捉え、より良い一般化を示す。斜め決定木の性能は、斜め超平面の生成方法とそれらの超平面の生成に使用されるデータに依存する。近年,不均質なランダムフォレスト (raf) 分類器において,複数の分類器が使用されているが,適切な深さの樹木を発生できない。さらに、二重RaF研究は、各非リーフノードでデータをブートストラップし、ブートストラップされたデータの代わりに元のデータを分割することで、より大きなツリーを生成することができることを強調した。ヘテロジニアスRaFの研究は、二重RaFモデルがデータの幾何学的特性を引き継ぐのに失敗する一方で、大きな木の生成を欠いている。これらの欠点に対処するために、異種斜め複層RaFを提案する。提案モデルでは, ブートストラップデータの各非リーフノードに線形分類器を複数使用し, 最適線形分類器に基づいて元のデータを分割する。最適超平面は、最適化された不純物基準に基づくモデルに対応する。実験により,導入した異質な二重ランダム林の性能はベースラインモデルよりも比較的良好であることが示唆された。提案する不均質な二重ランダム林の有効性を実証するために,統合失調症の診断に用いた。提案モデルは,本疾患をベースラインモデルよりも正確に予測した。

関連論文リスト

Learning Order Forest for Qualitative-Attribute Data Clustering [52.612779710298526]
本稿では,属性内定性値間の局所的な順序関係を柔軟に表現する木のような距離構造を探索する。より適切な木構造とクラスタを反復的に獲得するために,共同学習機構を提案する。実験により、共同学習は森林をクラスタリングタスクに適応させ、正確な結果を得ることを示した。
論文参考訳（メタデータ） (2026-03-03T07:49:50Z)
Unlasting: Unpaired Single-Cell Multi-Perturbation Estimation by Dual Conditional Diffusion Implicit Bridges [68.98973318553983]
本稿では,Dual Diffusion Implicit Bridges (DDIB) に基づくフレームワークを提案する。我々は、生物学的に意味のある方法で摂動シグナルを伝達するために遺伝子制御ネットワーク(GRN)情報を統合する。また、サイレント遺伝子を予測し、生成したプロファイルの品質を向上させるためのマスキング機構も組み込んだ。
論文参考訳（メタデータ） (2025-06-26T09:05:38Z)
Learning Decision Trees as Amortized Structure Inference [59.65621207449269]
本稿では,予測決定木アンサンブルを学習するためのハイブリッドアモータイズされた構造推論手法を提案する。提案手法であるDT-GFNは,標準分類ベンチマークにおける最先端決定木やディープラーニング手法よりも優れていることを示す。
論文参考訳（メタデータ） (2025-03-10T07:05:07Z)
A Powerful Random Forest Featuring Linear Extensions (RaFFLE) [1.2233362977312945]
RaFFLEは、ランダムな森林アンサンブル内でPILOTツリーをベースラーナーとして統合する新しいフレームワークである。 PILOT木は、従来の決定木の計算効率と線形モデル木の柔軟性を組み合わせたものである。 RaFFLEは様々な回帰問題に対処するための汎用ツールであることが証明されている。
論文参考訳（メタデータ） (2025-02-14T14:22:51Z)
Identifying General Mechanism Shifts in Linear Causal Representations [58.6238439611389]
我々は,未知の潜在因子の線形混合を観測する線形因果表現学習環境について考察する。近年の研究では、潜伏要因の復元や、それに基づく構造因果モデルの構築が可能であることが示されている。非常に穏やかな標準仮定の下では、シフトしたノードの集合を識別することが可能である。
論文参考訳（メタデータ） (2024-10-31T15:56:50Z)
Heterogeneous Random Forest [2.0646127669654835]
不均一ランダムフォレスト(HRF)は、木多様性を有意義な方法で向上させるように設計されている。 HRFは、ほとんどのデータセットの精度において、他のアンサンブル手法よりも一貫して優れていた。
論文参考訳（メタデータ） (2024-10-24T09:18:55Z)
Learning Deep Tree-based Retriever for Efficient Recommendation: Theory and Method [76.31185707649227]
効率的なレコメンデーションのために,Deep Tree-based Retriever (DTR)を提案する。 DTRは、トレーニングタスクを、同じレベルでツリーノード上のソフトマックスベースのマルチクラス分類としてフレーム化している。非リーフノードのラベル付けによって引き起こされる準最適性を緩和するため、損失関数の補正法を提案する。
論文参考訳（メタデータ） (2024-08-21T05:09:53Z)
Statistical Advantages of Oblique Randomized Decision Trees and Forests [0.0]
リッジ関数のフレキシブル次元縮小モデルクラスに対して一般化誤差と収束率を求める。軸方向のモンドリアン木のリスクに対する低い境界は、これらの線形次元減少モデルに対してこれらの推定値が最適であることを示す。
論文参考訳（メタデータ） (2024-07-02T17:35:22Z)
Forecasting with Hyper-Trees [50.72190208487953]
Hyper-Treesは時系列モデルのパラメータを学習するために設計されている。対象とする時系列モデルのパラメータを特徴に関連付けることで、Hyper-Treesはパラメータ非定常性の問題にも対処する。この新しいアプローチでは、木はまず入力特徴から情報表現を生成し、浅いネットワークはターゲットモデルパラメータにマップする。
論文参考訳（メタデータ） (2024-05-13T15:22:15Z)
Generation is better than Modification: Combating High Class Homophily Variance in Graph Anomaly Detection [51.11833609431406]
異なるクラス間のホモフィリー分布の差は、ホモフィリックグラフやヘテロフィリックグラフよりも著しく大きい。我々は、この現象を定量的に記述した、クラスホモフィリーバリアンスと呼ばれる新しい計量を導入する。その影響を軽減するために,ホモフィリーエッジ生成グラフニューラルネットワーク(HedGe)と呼ばれる新しいGNNモデルを提案する。
論文参考訳（メタデータ） (2024-03-15T14:26:53Z)
Hierarchical clustering with dot products recovers hidden tree structure [53.68551192799585]
本稿では,階層構造の回復に着目した凝集クラスタリングアルゴリズムの新しい視点を提案する。クラスタを最大平均点積でマージし、例えば最小距離やクラスタ内分散でマージしないような、標準的なアルゴリズムの単純な変種を推奨する。このアルゴリズムにより得られた木は、汎用確率的グラフィカルモデルの下で、データ中の生成的階層構造をボナフェイド推定することを示した。
論文参考訳（メタデータ） (2023-05-24T11:05:12Z)
A cautionary tale on fitting decision trees to data from additive models: generalization lower bounds [9.546094657606178]
本研究では,異なる回帰モデルに対する決定木の一般化性能について検討する。これにより、アルゴリズムが新しいデータに一般化するために(あるいは作らない)仮定する帰納的バイアスが引き起こされる。スパース加法モデルに適合する大規模な決定木アルゴリズムに対して、シャープな2乗誤差一般化を低い境界で証明する。
論文参考訳（メタデータ） (2021-10-18T21:22:40Z)
Spectral Top-Down Recovery of Latent Tree Models [13.681975313065477]
スペクトルトップダウン・リカバリ (STDR) は、大きな潜在木モデルを推定するための分割・コンカレントアプローチである。 STDRの分割ステップは非ランダムです。代わりに、観測されたノードに関連する適切なラプラシア行列のFiedlerベクトルに基づいている。私達はSTDRが統計的に一貫性があることを証明し、高い確率で木を正確に回復するために必要なサンプルの数を縛ります。
論文参考訳（メタデータ） (2021-02-26T02:47:42Z)
Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文参考訳（メタデータ） (2020-12-29T04:08:38Z)
Optimal Decision Trees for Nonlinear Metrics [42.18286681448184]
本稿では,非線形メトリクスに対して最適な木を生成するための新しいアルゴリズムを提案する。我々の知る限りでは、これは非線形メトリクスに対して証明可能な最適決定木を計算するための最初の方法である。当社のアプローチは、線形メトリクスの最適化と比較した場合、トレードオフにつながります。
論文参考訳（メタデータ） (2020-09-15T08:30:56Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。