論文の概要: Multi forests: Variable importance for multi-class outcomes
- arxiv url: http://arxiv.org/abs/2409.08925v1
- Date: Fri, 13 Sep 2024 15:40:29 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-16 15:59:55.439944
- Title: Multi forests: Variable importance for multi-class outcomes
- Title(参考訳): 多層林:多層林における重要度の重要性
- Authors: Roman Hornung, Alexander Hapfelmeier,
- Abstract要約: マルチフォレスト(MuFs)と呼ばれる新しいRF変種に基づく新しい変数重要度尺度(VIM)を導入する。
従来のRFと比較して, MuF の予測性能はわずかに低かった。
しかし、これはアルゴリズムの主要な目的であるマルチクラスVIMを計算することを考えると、制限要因ではない。
- 参考スコア(独自算出の注目度): 49.1574468325115
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In prediction tasks with multi-class outcomes, identifying covariates specifically associated with one or more outcome classes can be important. Conventional variable importance measures (VIMs) from random forests (RFs), like permutation and Gini importance, focus on overall predictive performance or node purity, without differentiating between the classes. Therefore, they can be expected to fail to distinguish class-associated covariates from covariates that only distinguish between groups of classes. We introduce a VIM called multi-class VIM, tailored for identifying exclusively class-associated covariates, via a novel RF variant called multi forests (MuFs). The trees in MuFs use both multi-way and binary splitting. The multi-way splits generate child nodes for each class, using a split criterion that evaluates how well these nodes represent their respective classes. This setup forms the basis of the multi-class VIM, which measures the discriminatory ability of the splits performed in the respective covariates with regard to this split criterion. Alongside the multi-class VIM, we introduce a second VIM, the discriminatory VIM. This measure, based on the binary splits, assesses the strength of the general influence of the covariates, irrespective of their class-associatedness. Simulation studies demonstrate that the multi-class VIM specifically ranks class-associated covariates highly, unlike conventional VIMs which also rank other types of covariates highly. Analyses of 121 datasets reveal that MuFs often have slightly lower predictive performance compared to conventional RFs. This is, however, not a limiting factor given the algorithm's primary purpose of calculating the multi-class VIM.
- Abstract(参考訳): 多クラス結果の予測タスクでは、1つ以上の結果クラスに特化して関連付けられた共変量を特定することが重要である。
従来の変分重要度尺度(VIM)は、変分やジニの重要度のようなランダムな森林(RF)からのものであり、クラス間で差別化することなく、全体的な予測性能やノードの純度に重点を置いている。
したがって、それらはクラス群のみを区別する共変量と類関連共変量との区別に失敗することが期待できる。
マルチフォレスト (MuFs) と呼ばれる新しいRF変異体を用いて, クラス関連変種のみを識別する「マルチクラスVIM」を導入した。
MuF のツリーはマルチウェイスプリッティングとバイナリスプリッティングの両方を使用する。
マルチウェイ分割は各クラスの子ノードを生成し、これらのノードがそれぞれのクラスをどれだけうまく表現しているかを評価する分割基準を使用する。
この設定は、この分割基準に関して各共変量で実行される分割の識別能力を測定するマルチクラスVIMの基礎を形成する。
マルチクラスのVIMと並行して,第2のVIMである差別型VIMを導入する。
この尺度は、二項分割に基づいて、クラス関連性に関係なく、共変量の一般的な影響の強さを評価する。
シミュレーション研究により、マルチクラスVIMは、他の種類の共変体を高度にランク付けする従来のVIMとは異なり、クラス関連共変体を高度にランク付けすることが示されている。
121データセットの分析により、MuFは従来のRFに比べて予測性能がわずかに低いことが判明した。
しかし、これはアルゴリズムの主要な目的であるマルチクラスVIMを計算することを考えると、制限要因ではない。
関連論文リスト
- Balanced Classification: A Unified Framework for Long-Tailed Object
Detection [74.94216414011326]
従来の検出器は、分類バイアスによる長期データを扱う際の性能劣化に悩まされる。
本稿では,カテゴリ分布の格差に起因する不平等の適応的是正を可能にする,BAlanced CLassification (BACL) と呼ばれる統一フレームワークを提案する。
BACLは、さまざまなバックボーンとアーキテクチャを持つさまざまなデータセット間で、一貫してパフォーマンス改善を実現している。
論文 参考訳(メタデータ) (2023-08-04T09:11:07Z) - MHCCL: Masked Hierarchical Cluster-Wise Contrastive Learning for
Multivariate Time Series [20.008535430484475]
Masked Hierarchical Cluster-wise Contrastive Learning modelを示す。
時系列の複数の潜在パーティションからなる階層構造から得られる意味情報を利用する。
教師なし時系列表現学習における最先端の手法よりも優れていることが示されている。
論文 参考訳(メタデータ) (2022-12-02T12:42:53Z) - Synergies between Disentanglement and Sparsity: Generalization and
Identifiability in Multi-Task Learning [79.83792914684985]
我々は,最大スパース基底予測器が不整合表現をもたらす条件を提供する新しい識別可能性の結果を証明した。
この理論的な結果から,両レベル最適化問題に基づくアンタングル表現学習の実践的アプローチを提案する。
論文 参考訳(メタデータ) (2022-11-26T21:02:09Z) - GFlowNets and variational inference [64.22223306224903]
本稿では,階層的変動推論(VI)と生成フローネットワーク(GFlowNets)という,確率論的アルゴリズムの2つのファミリー間のブリッジを構築する。
また, ある場合において, VIアルゴリズムは, 学習目標の期待勾配の等しさという意味で, GFlowNetsの特別な場合と等価であることを示した。
論文 参考訳(メタデータ) (2022-10-02T17:41:01Z) - Class-Incremental Lifelong Learning in Multi-Label Classification [3.711485819097916]
本稿では、連続したマルチラベル分類データストリームにオンラインのクラスインクリメンタル分類器を構築する、Lifelong Multi-Label (LML)分類について検討する。
そこで本研究では,AGCN (Augmented Graph Convolutional Network) を提案する。
論文 参考訳(メタデータ) (2022-07-16T05:14:07Z) - Maximum Batch Frobenius Norm for Multi-Domain Text Classification [19.393393465837377]
マルチドメインテキスト分類における特徴識別性を高めるために,最大バッチフロベニウスノルム(MBF)法を提案する。
2つのMDTCベンチマーク実験により,我々のMBFアプローチは最先端技術の性能を効果的に向上できることが示された。
論文 参考訳(メタデータ) (2022-01-29T14:37:56Z) - Gated recurrent units and temporal convolutional network for multilabel
classification [122.84638446560663]
本研究は,マルチラベル分類を管理するための新しいアンサンブル手法を提案する。
提案手法のコアは,Adamグラデーション最適化アプローチの変種で訓練された,ゲート再帰単位と時間畳み込みニューラルネットワークの組み合わせである。
論文 参考訳(メタデータ) (2021-10-09T00:00:16Z) - Forest R-CNN: Large-Vocabulary Long-Tailed Object Detection and Instance
Segmentation [75.93960390191262]
我々は、オブジェクトカテゴリ間の関係に関する事前知識を利用して、きめ細かいクラスを粗い親クラスにクラスタリングする。
そこで本研究では,NMS再サンプリング法を提案する。
提案手法はフォレストR-CNNと呼ばれ,ほとんどのオブジェクト認識モデルに適用可能なプラグイン・アンド・プレイモジュールとして機能する。
論文 参考訳(メタデータ) (2020-08-13T03:52:37Z) - Nonparallel Hyperplane Classifiers for Multi-category Classification [0.3867363075280544]
非並列超平面分類アルゴリズム(NHCA)が提案されているが、これはSVMと比較した場合の分類精度に匹敵するものである。
本稿では,TWSVM(Twin SVM),GEPSVM(Generalized eigenvalue proximal SVM),RegGEPSVM(Regularized GEPSVM),IGEPSVM( Improved GEPSVM)の4つのNHCAの比較検討を行った。
実験結果から,TDS-TWSVMは分類精度で他の手法よりも優れており,BT-RegGEPSVMの方が優れていることが示された。
論文 参考訳(メタデータ) (2020-04-16T08:03:40Z) - Adversarial Multi-Binary Neural Network for Multi-class Classification [19.298875915675502]
マルチタスクフレームワークを使用して、マルチクラス分類に対処する。
我々は,クラス固有の特徴とクラスに依存しない特徴を識別するために,対人訓練を実践する。
論文 参考訳(メタデータ) (2020-03-25T02:19:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。