論文の概要: Interpretable Rule Discovery Through Bilevel Optimization of Split-Rules
of Nonlinear Decision Trees for Classification Problems
- arxiv url: http://arxiv.org/abs/2008.00410v1
- Date: Sun, 2 Aug 2020 06:35:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-03 19:22:09.262296
- Title: Interpretable Rule Discovery Through Bilevel Optimization of Split-Rules
of Nonlinear Decision Trees for Classification Problems
- Title(参考訳): 非線形決定木の2レベル最適化による分類問題に対する解釈可能なルール発見
- Authors: Yashesh Dhebar and Kalyanmoy Deb
- Abstract要約: 非線形決定木(NLDT)を用いた単純な数学的規則の集合として分類器を表現する。
各条件ノードにおける分割ルールの構造と決定木の深さを制限することにより、分類器の解釈可能性を保証する。
2~500種類の問題の結果は、より困難で複雑な分類タスクに提案手法を適用することのさらなる範囲を奨励し、開放している。
- 参考スコア(独自算出の注目度): 7.8140593450932965
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: For supervised classification problems involving design, control, other
practical purposes, users are not only interested in finding a highly accurate
classifier, but they also demand that the obtained classifier be easily
interpretable. While the definition of interpretability of a classifier can
vary from case to case, here, by a humanly interpretable classifier we restrict
it to be expressed in simplistic mathematical terms. As a novel approach, we
represent a classifier as an assembly of simple mathematical rules using a
non-linear decision tree (NLDT). Each conditional (non-terminal) node of the
tree represents a non-linear mathematical rule (split-rule) involving features
in order to partition the dataset in the given conditional node into two
non-overlapping subsets. This partitioning is intended to minimize the impurity
of the resulting child nodes. By restricting the structure of split-rule at
each conditional node and depth of the decision tree, the interpretability of
the classifier is assured. The non-linear split-rule at a given conditional
node is obtained using an evolutionary bilevel optimization algorithm, in which
while the upper-level focuses on arriving at an interpretable structure of the
split-rule, the lower-level achieves the most appropriate weights
(coefficients) of individual constituents of the rule to minimize the net
impurity of two resulting child nodes. The performance of the proposed
algorithm is demonstrated on a number of controlled test problems, existing
benchmark problems, and industrial problems. Results on two to 500-feature
problems are encouraging and open up further scopes of applying the proposed
approach to more challenging and complex classification tasks.
- Abstract(参考訳): 設計,制御,その他の実用目的を含む教師付き分類問題に対して,ユーザは高度に正確な分類器を見つけることに関心があるだけでなく,取得した分類器の解釈も容易であることを要求している。
分類器の解釈可能性の定義は、ケースによって異なるが、人間の解釈可能な分類器では、単純化された数学的用語で表現できるように制限する。
新たなアプローチとして、非線形決定木(NLDT)を用いた単純な数学的規則の集合として分類器を表現する。
ツリーの各条件(非終端)ノードは、与えられた条件ノード内のデータセットを2つの非重複部分集合に分割するために特徴を含む非線形数学的規則(スプリットルール)を表す。
この分割は、子ノードの不純物を最小化することを目的としている。
各条件ノードにおける分割ルールの構造と決定木の深さを制限することにより、分類器の解釈可能性を保証する。
与えられた条件付きノードにおける非線形スプリットルールは、上位レベルがスプリットルールの解釈可能な構造に到達することに集中する一方、下位レベルはルールの個々の構成要素の最も適切な重み(共効率)を達成し、2つの子ノードの純不純物を最小化する進化的二値最適化アルゴリズムを用いて得られる。
提案アルゴリズムの性能は, 制御されたテスト問題, 既存のベンチマーク問題, 産業問題で実証される。
2~500種類の問題の結果は、より困難で複雑な分類タスクに提案手法を適用するためのさらなる範囲を奨励し、開放している。
関連論文リスト
- Obtaining Explainable Classification Models using Distributionally
Robust Optimization [12.511155426574563]
特徴値規則の集合を用いて構築した一般化線形モデルについて検討する。
ルールセットの間隔と予測精度の間には、固有のトレードオフが存在する。
我々はこれらの競合する要因に同時に対処するルールセットの集合を学習するための新しい定式化を提案する。
論文 参考訳(メタデータ) (2023-11-03T15:45:34Z) - Efficient Link Prediction via GNN Layers Induced by Negative Sampling [92.05291395292537]
リンク予測のためのグラフニューラルネットワーク(GNN)は、緩やかに2つの広いカテゴリに分けられる。
まず、Emphnode-wiseアーキテクチャは各ノードの個別の埋め込みをプリコンパイルし、後に単純なデコーダで結合して予測を行う。
第二に、エンフェッジワイド法は、ペアワイド関係の表現を強化するために、エッジ固有のサブグラフ埋め込みの形成に依存している。
論文 参考訳(メタデータ) (2023-10-14T07:02:54Z) - One-step Bipartite Graph Cut: A Normalized Formulation and Its
Application to Scalable Subspace Clustering [56.81492360414741]
両部グラフの1ステップ正規化カットを、特に線形時間複雑性で実施する方法を示す。
本稿では、まず、正規化制約付き一段階二分グラフカット基準を特徴付けるとともに、そのトレース問題に対する等価性を理論的に証明する。
このカット基準を、適応アンカー学習、二部グラフ学習、一段階正規化二部グラフ分割を同時にモデル化するスケーラブルなサブスペースクラスタリングアプローチに拡張する。
論文 参考訳(メタデータ) (2023-05-12T11:27:20Z) - Regularized impurity reduction: Accurate decision trees with complexity
guarantees [20.170305081348328]
本稿では,木複雑性の対数近似を保証する木推論アルゴリズムを提案する。
改良されたアルゴリズムは予測精度と木の複雑さのバランスが良好である。
論文 参考訳(メタデータ) (2022-08-23T13:15:19Z) - Set-valued prediction in hierarchical classification with constrained
representation complexity [4.258263831866309]
階層的多クラス分類問題に焦点をあて、有効集合が階層の内部ノードに対応する。
我々は3つの手法を提案し、それらをベンチマークデータセット上で評価する。
論文 参考訳(メタデータ) (2022-03-13T15:13:19Z) - Multiple Classifiers Based Maximum Classifier Discrepancy for
Unsupervised Domain Adaptation [25.114533037440896]
本稿では、2つの分類器の構造を複数の分類器に拡張し、その性能をさらに向上することを提案する。
平均的に、3つの分類器の構造を採用すると、精度と効率のトレードオフとして最高の性能が得られることを示す。
論文 参考訳(メタデータ) (2021-08-02T03:00:13Z) - Efficient Methods for Structured Nonconvex-Nonconcave Min-Max
Optimization [98.0595480384208]
定常点に収束する一般化外空間を提案する。
このアルゴリズムは一般の$p$ノルド空間だけでなく、一般の$p$次元ベクトル空間にも適用される。
論文 参考訳(メタデータ) (2020-10-31T21:35:42Z) - An Integer Linear Programming Framework for Mining Constraints from Data [81.60135973848125]
データから制約をマイニングするための一般的なフレームワークを提案する。
特に、構造化された出力予測の推論を整数線形プログラミング(ILP)問題とみなす。
提案手法は,9×9のスドクパズルの解法を学習し,基礎となるルールを提供することなく,例からツリー問題を最小限に分散させることが可能であることを示す。
論文 参考訳(メタデータ) (2020-06-18T20:09:53Z) - Classifier-independent Lower-Bounds for Adversarial Robustness [13.247278149124757]
理論的には、テストタイムの逆数と雑音の分類例に対するロバスト性の限界を解析する。
最適輸送理論を用いて、与えられた分類問題に対して分類器ができるベイズ最適誤差の変分式を導出する。
一般的な距離ベース攻撃の場合,ベイズ最適誤差に対して明らかな下限を導出する。
論文 参考訳(メタデータ) (2020-06-17T16:46:39Z) - Ranking a set of objects: a graph based least-square approach [70.7866286425868]
同一労働者の群集によるノイズの多いペアワイズ比較から始まる$N$オブジェクトのランク付けの問題について考察する。
品質評価のために,最小二乗内在的最適化基準に依存する非適応的ランキングアルゴリズムのクラスを提案する。
論文 参考訳(メタデータ) (2020-02-26T16:19:09Z) - Optimal Clustering from Noisy Binary Feedback [75.17453757892152]
本稿では,二元的ユーザフィードバックから一組のアイテムをクラスタリングする問題について検討する。
最小クラスタ回復誤差率のアルゴリズムを考案する。
適応選択のために,情報理論的誤差下界の導出にインスパイアされたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2019-10-14T09:18:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。