論文の概要: Interpretable classifiers for tabular data via discretization and
feature selection
- arxiv url: http://arxiv.org/abs/2402.05680v1
- Date: Thu, 8 Feb 2024 13:58:16 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-09 14:54:37.079968
- Title: Interpretable classifiers for tabular data via discretization and
feature selection
- Title(参考訳): 離散化と特徴選択による表データ解釈可能な分類器
- Authors: Reijo Jaakkola, Tomi Janhunen, Antti Kuusisto, Masood Feyzbakhsh
Rankooh, Miikka Vilander
- Abstract要約: 表データから人間の解釈可能かつ正確な分類器を即座に計算する手法を提案する。
提案手法は14の実験により実証され,ランダム林,XGBoost,および文献における同じデータセットに対する既存の結果と主に類似したアキュラシーによる結果が得られた。
- 参考スコア(独自算出の注目度): 4.445953630612019
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce a method for computing immediately human interpretable yet
accurate classifiers from tabular data. The classifiers obtained are short
DNF-formulas, computed via first discretizing the original data to Boolean form
and then using feature selection coupled with a very fast algorithm for
producing the best possible Boolean classifier for the setting. We demonstrate
the approach via 14 experiments, obtaining results with accuracies mainly
similar to ones obtained via random forests, XGBoost, and existing results for
the same datasets in the literature. In several cases, our approach in fact
outperforms the reference results in relation to accuracy, even though the main
objective of our study is the immediate interpretability of our classifiers. We
also prove a new result on the probability that the classifier we obtain from
real-life data corresponds to the ideally best classifier with respect to the
background distribution the data comes from.
- Abstract(参考訳): 表データから人間の解釈可能かつ正確な分類器を即座に計算する手法を提案する。
得られた分類器は短いdnf形式であり、まず元のデータをブール形式に識別し、次に特徴の選択と非常に高速なアルゴリズムを組み合わせることで設定に最適なブール分類器を生成する。
この手法を14の実験で実証し,ランダム林,xgboost,および文献中の同じデータセットに対する既存の結果とよく似た精度で結果を得た。
いくつかのケースでは,本研究の目的が分類器の即時解釈性であるにもかかわらず,本手法は正確性に関する基準結果を上回っています。
また,実生活データから得られた分類器が,データが生み出す背景分布に関して理想的最良分類器に対応する確率について,新たな結果を示す。
関連論文リスト
- Input Data Adaptive Learning (IDAL) for Sub-acute Ischemic Stroke Lesion
Segmentation [0.11976120407592658]
本稿では、与えられた入力データに対して最適なトレーニングサンプルを適応的に選択することで、大規模なトレーニングベースから学習する方法を提案する。
提案アルゴリズムは,分類精度を大幅に向上させる。
論文 参考訳(メタデータ) (2024-03-12T09:11:02Z) - Convolutional autoencoder-based multimodal one-class classification [80.52334952912808]
1クラス分類は、単一のクラスからのデータを用いた学習のアプローチを指す。
マルチモーダルデータに適した深層学習一クラス分類法を提案する。
論文 参考訳(メタデータ) (2023-09-25T12:31:18Z) - Boosting Differentiable Causal Discovery via Adaptive Sample Reweighting [62.23057729112182]
異なるスコアに基づく因果探索法は観測データから有向非巡回グラフを学習する。
本稿では,Reweighted Score関数ReScoreの適応重みを動的に学習することにより因果発見性能を向上させるためのモデルに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-06T14:49:59Z) - Learning from aggregated data with a maximum entropy model [73.63512438583375]
我々は,観測されていない特徴分布を最大エントロピー仮説で近似することにより,ロジスティック回帰と類似した新しいモデルが,集約データからのみ学習されることを示す。
我々は、この方法で学習したモデルが、完全な非凝集データでトレーニングされたロジスティックモデルに匹敵するパフォーマンスを達成することができるという、いくつかの公開データセットに関する実証的な証拠を提示する。
論文 参考訳(メタデータ) (2022-10-05T09:17:27Z) - Visualizing Classifier Adjacency Relations: A Case Study in Speaker
Verification and Voice Anti-Spoofing [72.4445825335561]
任意のバイナリ分類器によって生成される検出スコアから2次元表現を導出する簡単な方法を提案する。
ランク相関に基づいて,任意のスコアを用いた分類器の視覚的比較を容易にする。
提案手法は完全に汎用的であり,任意の検出タスクに適用可能だが,自動話者検証と音声アンチスプーフィングシステムによるスコアを用いた手法を実証する。
論文 参考訳(メタデータ) (2021-06-11T13:03:33Z) - Evaluating State-of-the-Art Classification Models Against Bayes
Optimality [106.50867011164584]
正規化フローを用いて学習した生成モデルのベイズ誤差を正確に計算できることを示す。
われわれの手法を用いて、最先端の分類モデルについて徹底的な調査を行う。
論文 参考訳(メタデータ) (2021-06-07T06:21:20Z) - Learning from Incomplete Features by Simultaneous Training of Neural
Networks and Sparse Coding [24.3769047873156]
本稿では,不完全な特徴を持つデータセット上で分類器を訓練する問題に対処する。
私たちは、各データインスタンスで異なる機能のサブセット(ランダムまたは構造化)が利用できると仮定します。
新しい教師付き学習法が開発され、サンプルあたりの機能のサブセットのみを使用して、一般的な分類器を訓練する。
論文 参考訳(メタデータ) (2020-11-28T02:20:39Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - Random Hyperboxes [9.061408029414455]
本稿では,個々のハイパーボックスに基づく分類器の強度に基づいて,提案した分類器の一般化誤差を示す。
提案する分類器の有効性は、慎重に選択された例を用いて分析する。
実データセットの一般化誤差境界に関する既存の問題を特定し,潜在的研究の方向性を報告する。
論文 参考訳(メタデータ) (2020-06-01T03:42:20Z) - Dynamic Decision Boundary for One-class Classifiers applied to
non-uniformly Sampled Data [0.9569316316728905]
パターン認識の典型的な問題は、一様でないサンプルデータである。
本稿では,動的決定境界を持つ最小スパンニング木に基づく一クラス分類器を提案する。
論文 参考訳(メタデータ) (2020-04-05T18:29:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。