論文の概要: Binary Split Categorical feature with Mean Absolute Error Criteria in CART
- arxiv url: http://arxiv.org/abs/2511.08470v1
- Date: Wed, 12 Nov 2025 02:00:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-12 20:17:03.830173
- Title: Binary Split Categorical feature with Mean Absolute Error Criteria in CART
- Title(参考訳): CARTにおける絶対誤差基準による二分別分類
- Authors: Peng Yu, Yike Chen, Chao Xu, Albert Bifet, Jesse Read,
- Abstract要約: カテゴリー的特徴に対する平均絶対誤差基準は、伝統的に様々な数値符号化法に依存してきた。
分類的特徴をMAE基準で扱う際の課題に対処する,新しい,効率的な分割アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 18.476195198589462
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the context of the Classification and Regression Trees (CART) algorithm, the efficient splitting of categorical features using standard criteria like GINI and Entropy is well-established. However, using the Mean Absolute Error (MAE) criterion for categorical features has traditionally relied on various numerical encoding methods. This paper demonstrates that unsupervised numerical encoding methods are not viable for the MAE criteria. Furthermore, we present a novel and efficient splitting algorithm that addresses the challenges of handling categorical features with the MAE criterion. Our findings underscore the limitations of existing approaches and offer a promising solution to enhance the handling of categorical data in CART algorithms.
- Abstract(参考訳): 分類・回帰木(CART)アルゴリズムの文脈では、GINIやEntropyといった標準基準を用いた分類的特徴の効率的な分割が確立されている。
しかし、分類的特徴に対する平均絶対誤差(MAE)基準は、伝統的に様々な数値符号化法に依存してきた。
本稿では, 教師なし数値符号化法はMAE基準では不可能であることを示す。
さらに、分類的特徴をMAE基準で扱う際の課題に対処する、新しく効率的な分割アルゴリズムを提案する。
我々の研究は既存のアプローチの限界を強調し、CARTアルゴリズムにおけるカテゴリデータの取り扱いを強化するための有望なソリューションを提供する。
関連論文リスト
- Adaptive Retrieval and Scalable Indexing for k-NN Search with Cross-Encoders [77.84801537608651]
クエリ-イムペアを共同で符号化することで類似性を計算するクロスエンコーダ(CE)モデルは、クエリ-イム関連性を推定する埋め込みベースモデル(デュアルエンコーダ)よりも優れている。
本稿では,潜時クエリとアイテム埋め込みを効率的に計算してCEスコアを近似し,CE類似度を近似したk-NN探索を行うスパース行列分解法を提案する。
論文 参考訳(メタデータ) (2024-05-06T17:14:34Z) - Synergistic eigenanalysis of covariance and Hessian matrices for enhanced binary classification [72.77513633290056]
本稿では, 学習モデルを用いて評価したヘッセン行列をトレーニングセットで評価した共分散行列の固有解析と, 深層学習モデルで評価したヘッセン行列を組み合わせた新しい手法を提案する。
本手法は複雑なパターンと関係を抽出し,分類性能を向上する。
論文 参考訳(メタデータ) (2024-02-14T16:10:42Z) - Enumerating the k-fold configurations in multi-class classification
problems [0.0]
人工知能が直面する危機は、報告されたk倍のクロスバリデーションに基づくパフォーマンススコアの不再現性によってもたらされる。
近年,要求性能スコアと実験装置の整合性をテストする数値的手法を導入している。
重要なユースケースとして、この手法はすべてのk-フォルダ構成の列挙に依存し、二項分類の場合のアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-01-24T22:40:00Z) - Polar Encoding: A Simple Baseline Approach for Classification with Missing Values [1.7205106391379026]
polar エンコーディングは $[0,1]$-valued 属性の表現で、値が欠けている。
計算を必要とせず、欠落した値が非欠落値と等価であることを保証し、決定木アルゴリズムに欠落した値を分割する方法を選択させる。
結果として得られた分類性能において、極符号化は最先端の戦略である「連鎖方程式による多重計算」や「復号化オートエンコーダによる多重計算」よりも優れた性能を示すことを示す。
論文 参考訳(メタデータ) (2022-10-04T20:56:24Z) - Unbiased Subdata Selection for Fair Classification: A Unified Framework
and Scalable Algorithms [0.8376091455761261]
このフレームワーク内の多くの分類モデルが混合整数凸プログラムとして再キャストできることを示した。
そして,提案問題において,分類結果の「解決不能な部分データ選択」が強く解決可能であることを示す。
これにより、分類インスタンスを解決するための反復精錬戦略(IRS)の開発を動機付けます。
論文 参考訳(メタデータ) (2020-12-22T21:09:38Z) - Classification with Rejection Based on Cost-sensitive Classification [83.50402803131412]
学習のアンサンブルによる拒絶を用いた新しい分類法を提案する。
実験により, クリーン, ノイズ, 正の未ラベル分類における提案手法の有用性が示された。
論文 参考訳(メタデータ) (2020-10-22T14:05:05Z) - Coherent Hierarchical Multi-Label Classification Networks [56.41950277906307]
C-HMCNN(h)はHMC問題に対する新しいアプローチであり、階層情報を利用して制約に整合した予測を生成し、性能を向上させる。
最先端モデルと比較してC-HMCNN(h)の優れた性能を示す広範囲な実験的検討を行った。
論文 参考訳(メタデータ) (2020-10-20T09:37:02Z) - Self-Weighted Robust LDA for Multiclass Classification with Edge Classes [111.5515086563592]
SWRLDAと呼ばれる,l21ノルムを基準とした新しい自己重み付き頑健なLDAを提案する。
提案するSWRLDAは実装が容易で,実際に高速に収束する。
論文 参考訳(メタデータ) (2020-09-24T12:32:55Z) - High-Dimensional Quadratic Discriminant Analysis under Spiked Covariance
Model [101.74172837046382]
そこで本研究では,魚の識別比を最大化する2次分類手法を提案する。
数値シミュレーションにより,提案した分類器は,合成データと実データの両方において古典的R-QDAよりも優れるだけでなく,計算量の削減も要求されることがわかった。
論文 参考訳(メタデータ) (2020-06-25T12:00:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。