論文の概要: Discovering Classification Rules for Interpretable Learning with Linear
Programming
- arxiv url: http://arxiv.org/abs/2104.10751v1
- Date: Wed, 21 Apr 2021 20:31:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-24 00:30:57.785336
- Title: Discovering Classification Rules for Interpretable Learning with Linear
Programming
- Title(参考訳): 線形プログラミングによる解釈可能な学習のための分類規則の発見
- Authors: M. Hakan Aky\"uz, \c{S}. \.Ilker Birbil
- Abstract要約: ルールは、データセット内のサンプルのサブセットを分類する1つ以上の条件を含むif-thenステートメントのセットを具現化する。
様々な応用において、このような分類規則は意思決定者によって解釈されると考えられる。
解釈と学習のための新しいアルゴリズムを2つ紹介する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Rules embody a set of if-then statements which include one or more conditions
to classify a subset of samples in a dataset. In various applications such
classification rules are considered to be interpretable by the decision makers.
We introduce two new algorithms for interpretability and learning. Both
algorithms take advantage of linear programming, and hence, they are scalable
to large data sets. The first algorithm extracts rules for interpretation of
trained models that are based on tree/rule ensembles. The second algorithm
generates a set of classification rules through a column generation approach.
The proposed algorithms return a set of rules along with their optimal weights
indicating the importance of each rule for classification. Moreover, our
algorithms allow assigning cost coefficients, which could relate to different
attributes of the rules, such as; rule lengths, estimator weights, number of
false negatives, and so on. Thus, the decision makers can adjust these
coefficients to divert the training process and obtain a set of rules that are
more appealing for their needs. We have tested the performances of both
algorithms on a collection of datasets and presented a case study to elaborate
on optimal rule weights. Our results show that a good compromise between
interpretability and accuracy can be obtained by the proposed algorithms.
- Abstract(参考訳): ルールは、データセット内のサンプルのサブセットを分類する1つ以上の条件を含むif-thenステートメントのセットを具現化する。
様々な応用において、このような分類規則は意思決定者によって解釈されると考えられる。
解釈と学習のための新しいアルゴリズムを2つ紹介する。
どちらのアルゴリズムも線形プログラミングを利用するため、大規模なデータセットに対してスケーラブルである。
第1のアルゴリズムは、木/ルールアンサンブルに基づく訓練モデルの解釈規則を抽出する。
第2のアルゴリズムは列生成手法により分類規則の集合を生成する。
提案アルゴリズムは、各ルールの分類の重要性を示す最適な重みとともに一連のルールを返す。
さらに, ルール長, 推定器重み, 偽陰数など, ルールの異なる属性に関係のあるコスト係数を割り当てることも可能である。
したがって、意思決定者はこれらの係数を調整してトレーニングプロセスを分散させ、彼らのニーズによりアピールする一連のルールを得ることができる。
両アルゴリズムのパフォーマンスをデータセットの集合上で検証し、最適規則重みに関するケーススタディを提示した。
その結果,提案手法により解釈可能性と精度の妥協が得られた。
関連論文リスト
- Optimal Baseline Corrections for Off-Policy Contextual Bandits [61.740094604552475]
オンライン報酬指標の偏りのないオフライン推定を最適化する意思決定ポリシーを学習することを目指している。
学習シナリオにおける同値性に基づく単一のフレームワークを提案する。
我々のフレームワークは、分散最適非バイアス推定器の特徴付けを可能にし、それに対する閉形式解を提供する。
論文 参考訳(メタデータ) (2024-05-09T12:52:22Z) - Likelihood Ratio Confidence Sets for Sequential Decision Making [51.66638486226482]
確率に基づく推論の原理を再検討し、確率比を用いて妥当な信頼シーケンスを構築することを提案する。
本手法は, 精度の高い問題に特に適している。
提案手法は,オンライン凸最適化への接続に光を当てることにより,推定器の最適シーケンスを確実に選択する方法を示す。
論文 参考訳(メタデータ) (2023-11-08T00:10:21Z) - Obtaining Explainable Classification Models using Distributionally
Robust Optimization [12.511155426574563]
特徴値規則の集合を用いて構築した一般化線形モデルについて検討する。
ルールセットの間隔と予測精度の間には、固有のトレードオフが存在する。
我々はこれらの競合する要因に同時に対処するルールセットの集合を学習するための新しい定式化を提案する。
論文 参考訳(メタデータ) (2023-11-03T15:45:34Z) - Post-hoc Bias Scoring Is Optimal For Fair Classification [12.897626117694317]
バイアススコアと呼ばれる新しいインスタンスレベルのバイアス尺度を導入し、修正規則は有限量のバイアススコアの上に単純な線形ルールである。
DPとEOpの制約の場合、修正規則は1つのバイアススコアをしきい値にし、EOの制約の場合、線形修正規則を2つのパラメータに適合させることが要求される。
論文 参考訳(メタデータ) (2023-10-09T13:54:08Z) - Boosting Fair Classifier Generalization through Adaptive Priority Reweighing [59.801444556074394]
より優れた一般化性を持つ性能向上フェアアルゴリズムが必要である。
本稿では,トレーニングデータとテストデータ間の分散シフトがモデル一般化性に与える影響を解消する適応的リライジング手法を提案する。
論文 参考訳(メタデータ) (2023-09-15T13:04:55Z) - On Regularization and Inference with Label Constraints [62.60903248392479]
機械学習パイプラインにおけるラベル制約を符号化するための2つの戦略、制約付き正規化、制約付き推論を比較した。
正規化については、制約に不整合なモデルを前置することで一般化ギャップを狭めることを示す。
制約付き推論では、モデルの違反を訂正することで人口リスクを低減し、それによってその違反を有利にすることを示す。
論文 参考訳(メタデータ) (2023-07-08T03:39:22Z) - Efficient Learning of Interpretable Classification Rules [34.27987659227838]
本稿では,命題論理で表現可能な分類規則に対して,最大満足度(MaxSAT)に基づく解釈可能な学習フレームワークIMLIを提案する。
我々の実験では,IMLIは予測精度,解釈可能性,スケーラビリティの最良のバランスを達成している。
論文 参考訳(メタデータ) (2022-05-14T00:36:38Z) - Interpretable and Fair Boolean Rule Sets via Column Generation [18.08486863429421]
整数プログラムは、規則単純性のために最適に分類精度を交換するように定式化される。
公平性の設定を考慮し、分類パリティの2つの異なる尺度に関する明示的な制約を含むように定式化を拡張した。
他の公正かつ解釈可能な分類器と比較して、我々の手法は、公正性のより厳密な概念に適合する規則セットを精度の低いトレードオフで見つけることができる。
論文 参考訳(メタデータ) (2021-11-16T13:40:28Z) - Fair Decision Rules for Binary Classification [0.0]
直交正規形式(DNF)におけるブール則集合構築の問題を考える。
この問題を2つの異なる分類パリティ尺度に対する明示的な制約で分類精度を最大化する整数プログラムとして定式化する。
他の公正かつ解釈可能な分類器と比較して、我々の手法は、公正性のより厳密な概念に適合する規則セットを精度の低いトレードオフで見つけることができる。
論文 参考訳(メタデータ) (2021-07-03T02:32:17Z) - Binary Classification from Multiple Unlabeled Datasets via Surrogate Set
Classification [94.55805516167369]
我々は m 個の U 集合を $mge2$ で二進分類する新しい手法を提案する。
我々のキーとなる考え方は、サロゲート集合分類(SSC)と呼ばれる補助的分類タスクを考えることである。
論文 参考訳(メタデータ) (2021-02-01T07:36:38Z) - An Integer Linear Programming Framework for Mining Constraints from Data [81.60135973848125]
データから制約をマイニングするための一般的なフレームワークを提案する。
特に、構造化された出力予測の推論を整数線形プログラミング(ILP)問題とみなす。
提案手法は,9×9のスドクパズルの解法を学習し,基礎となるルールを提供することなく,例からツリー問題を最小限に分散させることが可能であることを示す。
論文 参考訳(メタデータ) (2020-06-18T20:09:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。