#### 論文の概要: Discovering Classification Rules for Interpretable Learning with Linear Programming

• Date: Wed, 21 Apr 2021 20:31:28 GMT
• Title: Discovering Classification Rules for Interpretable Learning with Linear Programming
• Title（参考訳）: 線形プログラミングによる解釈可能な学習のための分類規則の発見
• Authors: M. Hakan Aky\"uz, \c{S}. \.Ilker Birbil
• Abstract要約: ルールは、データセット内のサンプルのサブセットを分類する1つ以上の条件を含むif-thenステートメントのセットを具現化する。 様々な応用において、このような分類規則は意思決定者によって解釈されると考えられる。 解釈と学習のための新しいアルゴリズムを2つ紹介する。
• Abstract: Rules embody a set of if-then statements which include one or more conditions to classify a subset of samples in a dataset. In various applications such classification rules are considered to be interpretable by the decision makers. We introduce two new algorithms for interpretability and learning. Both algorithms take advantage of linear programming, and hence, they are scalable to large data sets. The first algorithm extracts rules for interpretation of trained models that are based on tree/rule ensembles. The second algorithm generates a set of classification rules through a column generation approach. The proposed algorithms return a set of rules along with their optimal weights indicating the importance of each rule for classification. Moreover, our algorithms allow assigning cost coefficients, which could relate to different attributes of the rules, such as; rule lengths, estimator weights, number of false negatives, and so on. Thus, the decision makers can adjust these coefficients to divert the training process and obtain a set of rules that are more appealing for their needs. We have tested the performances of both algorithms on a collection of datasets and presented a case study to elaborate on optimal rule weights. Our results show that a good compromise between interpretability and accuracy can be obtained by the proposed algorithms.
• Abstract（参考訳）: ルールは、データセット内のサンプルのサブセットを分類する1つ以上の条件を含むif-thenステートメントのセットを具現化する。 様々な応用において、このような分類規則は意思決定者によって解釈されると考えられる。 解釈と学習のための新しいアルゴリズムを2つ紹介する。 どちらのアルゴリズムも線形プログラミングを利用するため、大規模なデータセットに対してスケーラブルである。 第1のアルゴリズムは、木/ルールアンサンブルに基づく訓練モデルの解釈規則を抽出する。 第2のアルゴリズムは列生成手法により分類規則の集合を生成する。 提案アルゴリズムは、各ルールの分類の重要性を示す最適な重みとともに一連のルールを返す。 さらに, ルール長, 推定器重み, 偽陰数など, ルールの異なる属性に関係のあるコスト係数を割り当てることも可能である。 したがって、意思決定者はこれらの係数を調整してトレーニングプロセスを分散させ、彼らのニーズによりアピールする一連のルールを得ることができる。 両アルゴリズムのパフォーマンスをデータセットの集合上で検証し、最適規則重みに関するケーススタディを提示した。 その結果,提案手法により解釈可能性と精度の妥協が得られた。

