論文の概要: A Hybrid Tsallis-Polarization Impurity Measure for Decision Trees: Theoretical Foundations and Empirical Evaluation
- arxiv url: http://arxiv.org/abs/2603.13241v1
- Date: Thu, 19 Feb 2026 19:17:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:42.221103
- Title: A Hybrid Tsallis-Polarization Impurity Measure for Decision Trees: Theoretical Foundations and Empirical Evaluation
- Title(参考訳): 決定木に対するハイブリッド・タリス・ポーラライゼーション不純物測定:理論的基礎と実証的評価
- Authors: Edouard Lansiaux, Idriss Jairi, Hayfa Zgaya-Biau,
- Abstract要約: 統合Tsallis Combination(ITC)は、決定木学習のためのハイブリッド不純物尺度である。
中心となる革新は、ツァリス・エントロピーの情報理論の基礎と偏極成分の分布非対称性に対する感度の相補性にある。
単純なパラメトリック測度 (Tsallis $=0.5$) が平均精度 (91.17%$) を達成するのに対し、ITCの変種は強力な理論的保証を持つ競争結果 (88.38-89.16%$) を得ることを示した。
- 参考スコア(独自算出の注目度): 1.547549252134621
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: We introduce the Integrated Tsallis Combination (ITC), a hybrid impurity measure for decision tree learning that combines normalized Tsallis entropy with an exponential polarization component. While many existing measures sacrifice theoretical soundness for computational efficiency or vice versa, ITC provides a mathematically principled framework that balances both aspects. The core innovation lies in the complementarity between Tsallis entropy's information-theoretic foundations and the polarization component's sensitivity to distributional asymmetry. We establish key theoretical properties-concavity under explicit parameter conditions, proper boundary conditions, and connections to classical measures-and provide a rigorous justification for the hybridization strategy. Through an extensive comparative evaluation on seven benchmark datasets comparing 23 impurity measures with five-fold repetition, we show that simple parametric measures (Tsallis $α=0.5$) achieve the highest average accuracy ($91.17\%$), while ITC variants yield competitive results ($88.38-89.16\%$) with strong theoretical guarantees. Statistical analysis (Friedman test: $χ^2=3.89$, $p=0.692$) reveals no significant global differences among top performers, indicating practical equivalence for many applications. ITC's value resides in its solid theoretical grounding-proven concavity under suitable conditions, flexible parameterization ($α$, $β$, $γ$), and computational efficiency $O(K)$-making it a rigorous, generalizable alternative when theoretical guarantees are paramount. We provide guidelines for measure selection based on application priorities and release an open-source implementation to foster reproducibility and further research.
- Abstract(参考訳): 本稿では,正規化Tsallisエントロピーと指数分極成分を組み合わせた決定木学習のためのハイブリッド不純物尺度であるIntegrated Tsallis Combination (ITC)を紹介する。
多くの既存の尺度は計算効率の理論的健全性を犠牲にしているが、ITCは両方の側面のバランスをとる数学的に原則化されたフレームワークを提供する。
中心となる革新は、ツァリス・エントロピーの情報理論の基礎と偏極成分の分布非対称性に対する感度の相補性にある。
我々は,明示的なパラメータ条件,適切な境界条件,古典的測度への接続の下で重要な理論的性質を確立するとともに,ハイブリッド化戦略の厳密な正当化を提供する。
23の不純物測定を5倍繰り返しと比較した7つのベンチマークデータセットの広範な評価を通じて、単純なパラメトリック測度(Tsallis $α=0.5$)が最高平均精度(91.17\%$)を達成するのに対し、ITC変種は強力な理論的保証を持つ競争結果(88.38-89.16\%$)を得ることを示した。
統計的分析 (Friedman test: $ ^2=3.89$, $p=0.692$) は、多くのアプリケーションにおいて実用的な等価性を示している。
ITCの値は、適切な条件下での堅固な理論的な接地性、柔軟なパラメータ化(α$, $β$, $γ$)、および理論的な保証が最重要である場合の厳密で一般化可能な代替手段としての計算効率$O(K)$- make it it is a rigorous and generalizable alternativeである。
我々は,アプリケーションプライオリティに基づいた選択測定のガイドラインを提供し,再現性の向上とさらなる研究を目的としたオープンソース実装をリリースする。
関連論文リスト
- On the Statistical Optimality of Optimal Decision Trees [6.920276126310231]
ランダムな設計の下で,世界規模で最適な経験的リスク最小化木に対する包括的統計理論を構築した。
まず,葉高が少なくとも$L$である木で達成可能な最適近似に対して,ERM推定器の過大なリスクを負う鋭いオラクル不等式を確立する。
新しい関数クラスよりも極小最大速度を導出する: 断片的にスパースな異方性ベソフ空間(PSHAB)である。
論文 参考訳(メタデータ) (2026-03-05T16:16:25Z) - A Polynomial-Time Axiomatic Alternative to SHAP for Feature Attribution [0.0]
我々は,XAI-TUゲームの一クラスを定式化することにより,協調ゲーム理論のレンズを通して特徴属性を研究する。
本稿では,2時間の閉形式ルールを組み合わせることで,低コストな帰属規則ESENSC_rev2を提案する。
実験により、ESENSC_rev2は正確なSHAPを近似し、スケーラビリティを大幅に向上することが示された。
論文 参考訳(メタデータ) (2026-02-28T06:30:35Z) - Principled Algorithms for Optimizing Generalized Metrics in Binary Classification [53.604375124674796]
一般化されたメトリクスを最適化するアルゴリズムを導入し、$H$-consistency と finite-sample generalization bounds をサポートする。
提案手法は,メトリクス最適化を一般化したコスト依存学習問題として再検討する。
我々は,理論性能を保証する新しいアルゴリズムMETROを開発した。
論文 参考訳(メタデータ) (2025-12-29T01:33:42Z) - Likelihood-Preserving Embeddings for Statistical Inference [0.0]
現代の機械学習の埋め込みは、高次元データの強力な圧縮を提供する。
本稿では,確率保存型埋め込みの理論を考案する。
ガウス分布とコーシー分布の実験は指数族理論によって予測される鋭い相転移を検証する。
論文 参考訳(メタデータ) (2025-12-27T16:21:55Z) - Kernel-Based Nonparametric Tests For Shape Constraints [0.0]
サンプル推定器の統計的特性を導出し、厳密な理論的保証を提供する。
有限格子上の形状制約を検証するためのWald型合同統計法を提案する。
論文 参考訳(メタデータ) (2025-10-19T08:07:33Z) - A Fresh Look at Generalized Category Discovery through Non-negative Matrix Factorization [83.12938977698988]
Generalized Category Discovery (GCD) は、ラベル付きベースデータを用いて、ベース画像と新規画像の両方を分類することを目的としている。
現在のアプローチでは、コサイン類似性に基づく共起行列 $barA$ の固有の最適化に不適切に対処している。
本稿では,これらの欠陥に対処するNon-Negative Generalized Category Discovery (NN-GCD) フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T07:24:11Z) - Online non-parametric likelihood-ratio estimation by Pearson-divergence
functional minimization [55.98760097296213]
iid 観測のペア $(x_t sim p, x'_t sim q)$ が時間の経過とともに観測されるような,オンラインな非パラメトリック LRE (OLRE) のための新しいフレームワークを提案する。
本稿では,OLRE法の性能に関する理論的保証と,合成実験における実証的検証について述べる。
論文 参考訳(メタデータ) (2023-11-03T13:20:11Z) - Pseudo-Spherical Contrastive Divergence [119.28384561517292]
エネルギーベースモデルの最大学習確率を一般化するために,擬球面コントラスト分散(PS-CD)を提案する。
PS-CDは難解な分割関数を避け、学習目的の一般化されたファミリーを提供する。
論文 参考訳(メタデータ) (2021-11-01T09:17:15Z) - Permutation Compressors for Provably Faster Distributed Nonconvex
Optimization [68.8204255655161]
本稿では,Gorbunov et al (2021) の MARINA 法が,理論的な通信複雑性の観点から最先端の手法とみなすことができることを示す。
MARINAの理論は、古典的な独立圧縮機設定を超えて、潜在的にエミュレートされた圧縮機の理論を支持するものである。
論文 参考訳(メタデータ) (2021-10-07T09:38:15Z) - A Precise High-Dimensional Asymptotic Theory for Boosting and
Minimum-$\ell_1$-Norm Interpolated Classifiers [3.167685495996986]
本稿では,分離可能なデータの強化に関する高精度な高次元理論を確立する。
統計モデルのクラスでは、ブースティングの普遍性誤差を正確に解析する。
また, 推力試験誤差と最適ベイズ誤差の関係を明示的に説明する。
論文 参考訳(メタデータ) (2020-02-05T00:24:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。