論文の概要: Splitting criteria for ordinal decision trees: an experimental study
- arxiv url: http://arxiv.org/abs/2412.13697v1
- Date: Wed, 18 Dec 2024 10:41:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-19 13:23:40.834013
- Title: Splitting criteria for ordinal decision trees: an experimental study
- Title(参考訳): 順序決定木の分割基準--実験的研究
- Authors: Rafael Ayllón-Gavilán, Francisco José Martínez-Estudillo, David Guijo-Rubio, César Hervás-Martínez, Pedro Antonio Gutiérrez,
- Abstract要約: 正規分類 (OC) は、ラベルが自然な順序を示す分類タスクに対処する機械学習分野である。
OCは順序関係を考慮に入れ、より正確で関連する結果を生み出す。
この研究は、順序関係を捉えるために設計された木に基づく方法論の実験的研究を行う。
- 参考スコア(独自算出の注目度): 6.575723870852787
- License:
- Abstract: Ordinal Classification (OC) is a machine learning field that addresses classification tasks where the labels exhibit a natural order. Unlike nominal classification, which treats all classes as equally distinct, OC takes the ordinal relationship into account, producing more accurate and relevant results. This is particularly critical in applications where the magnitude of classification errors has implications. Despite this, OC problems are often tackled using nominal methods, leading to suboptimal solutions. Although decision trees are one of the most popular classification approaches, ordinal tree-based approaches have received less attention when compared to other classifiers. This work conducts an experimental study of tree-based methodologies specifically designed to capture ordinal relationships. A comprehensive survey of ordinal splitting criteria is provided, standardising the notations used in the literature for clarity. Three ordinal splitting criteria, Ordinal Gini (OGini), Weighted Information Gain (WIG), and Ranking Impurity (RI), are compared to the nominal counterparts of the first two (Gini and information gain), by incorporating them into a decision tree classifier. An extensive repository considering 45 publicly available OC datasets is presented, supporting the first experimental comparison of ordinal and nominal splitting criteria using well-known OC evaluation metrics. Statistical analysis of the results highlights OGini as the most effective ordinal splitting criterion to date. Source code, datasets, and results are made available to the research community.
- Abstract(参考訳): 正規分類 (OC) は、ラベルが自然な順序を示す分類タスクに対処する機械学習分野である。
すべてのクラスを等しく異なるものとして扱う名目分類とは異なり、OCは順序関係を考慮に入れ、より正確で関連する結果を生み出す。
これは、分類誤差の大きさが影響するアプリケーションにおいて特に重要である。
それにもかかわらず、OC問題はしばしば名目上の手法で取り組まれ、最適でない解が導かれる。
決定木は最も一般的な分類手法の1つであるが、順序木に基づくアプローチは、他の分類法と比較してあまり注目されていない。
この研究は、順序関係を捉えるために特別に設計された木に基づく方法論の実験的研究を行う。
順序分割基準を総合的に調査し、明快な文献で使われる表記を標準化する。
3つの規則分割基準、OGini(OGini)、WIG(Weighted Information Gain)、ランキング不純物(Randing Impurity)を、決定木分類器に組み込むことで、第1の2つの名目(Giniと情報ゲイン)と比較する。
45の公開OCデータセットを考慮に入れた広範なリポジトリが紹介され、よく知られたOC評価指標を用いて、順序および名目分割基準の最初の実験的な比較をサポートする。
結果の統計的分析は、OGiniが現在までの最も効果的な順序分割基準であることを示している。
ソースコード、データセット、結果がリサーチコミュニティで公開されている。
関連論文リスト
- ABCDE: Application-Based Cluster Diff Evals [49.1574468325115]
それは実用性を目指しており、アイテムはアプリケーション固有の重要な値を持つことができ、クラスタリングがどちらが優れているかを判断するときに人間の判断を使うのは粗悪であり、アイテムの任意のスライスのためのメトリクスを報告できる。
クラスタリング品質の差分を測定するアプローチは、高価な地平を前もって構築し、それに関して各クラスタリングを評価する代わりに、ABCDEはクラスタリング間の実際の差分に基づいて、判定のための質問をサンプリングする。
論文 参考訳(メタデータ) (2024-07-31T08:29:35Z) - Improving the classification of extreme classes by means of loss regularisation and generalised beta distributions [8.640930010669042]
本稿では,一級・一級の分類性能を向上させるための一級正規化手法を提案する。
極端なクラスのパフォーマンスは、その感度を考慮に入れた新しいメトリクスを使って比較される。
提案手法により, 一般化されたベータ分布は, 極端なクラスにおける分類性能を向上することが示された。
論文 参考訳(メタデータ) (2024-07-17T08:57:42Z) - Regularization-Based Methods for Ordinal Quantification [49.606912965922504]
順序の場合、すなわち n>2 クラスの集合上で全順序が定義される場合について研究する。
本稿では,従来のアルゴリズムよりも優れた正規化OQアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-10-13T16:04:06Z) - Convolutional and Deep Learning based techniques for Time Series Ordinal Classification [7.047582157120573]
時系列規則分類(TSOC)は、このギャップをカバーする分野であるが、文献では未解明である。
本稿では,TSOC手法の最初のベンチマークを行い,対象ラベルの順序付けを利用して,現在のTSCの現状を向上する。
論文 参考訳(メタデータ) (2023-06-16T11:57:11Z) - Parametric Classification for Generalized Category Discovery: A Baseline
Study [70.73212959385387]
Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。
パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。
エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文 参考訳(メタデータ) (2022-11-21T18:47:11Z) - Ordinal Causal Discovery [2.0305676256390934]
本稿では,多くの実世界のアプリケーションに含まれる順序情報を利用して,因果構造を一意に識別する,識別可能な順序因果探索手法を提案する。
提案手法は, カテゴリー別および非カテゴリ別の両方において, 最先端の代替手法と比較して, 良好かつ堅牢な性能を有することを示す。
論文 参考訳(メタデータ) (2022-01-19T03:11:26Z) - Precision-Recall Curve (PRC) Classification Trees [5.503321733964237]
そこで本稿では,AUPRC (Precision-recall curve) に基づく木に基づく新しいアルゴリズムを提案する。
我々のアルゴリズムは「精度・リコール曲線分類木(Precision-Recall Curve classification tree)」と名付けられ、単に「PRC分類木(PRC classification tree)」と呼ばれる。
論文 参考訳(メタデータ) (2020-11-15T22:31:06Z) - Forest R-CNN: Large-Vocabulary Long-Tailed Object Detection and Instance
Segmentation [75.93960390191262]
我々は、オブジェクトカテゴリ間の関係に関する事前知識を利用して、きめ細かいクラスを粗い親クラスにクラスタリングする。
そこで本研究では,NMS再サンプリング法を提案する。
提案手法はフォレストR-CNNと呼ばれ,ほとんどのオブジェクト認識モデルに適用可能なプラグイン・アンド・プレイモジュールとして機能する。
論文 参考訳(メタデータ) (2020-08-13T03:52:37Z) - Cooperative Bi-path Metric for Few-shot Learning [50.98891758059389]
数発の分類問題の調査に2つの貢献をしている。
本稿では,従来の教師あり学習法において,ベースクラスで訓練されたシンプルで効果的なベースラインについて報告する。
本稿では, 基礎クラスと新しいクラス間の相関を利用して, 精度の向上を図る, 分類のための協調的二経路計量を提案する。
論文 参考訳(メタデータ) (2020-08-10T11:28:52Z) - An Effectiveness Metric for Ordinal Classification: Formal Properties
and Experimental Results [9.602361044877426]
本稿では,測定理論と情報理論に根ざした正規分類・閉度評価尺度の新しい尺度を提案する。
NLP共有タスクの合成データとデータの両方に対する理論的解析と実験結果から,提案手法が従来のタスクから品質面を同時に捉えていることが示唆された。
論文 参考訳(メタデータ) (2020-06-01T20:35:46Z) - Convolution-Weight-Distribution Assumption: Rethinking the Criteria of
Channel Pruning [90.2947802490534]
刈り取り基準の研究には2つの盲点がある。
フィルタのランク'Importance Score'はほぼ同じで、同様に刈り取られた構造になる。
いくつかのプルーニング基準で測定されたフィルタ'Importance Score'は、ネットワークの冗長性をよく区別するには近すぎる。
論文 参考訳(メタデータ) (2020-04-24T09:54:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。