論文の概要: Discovering Classification Rules for Interpretable Learning with Linear
Programming
- arxiv url: http://arxiv.org/abs/2104.10751v1
- Date: Wed, 21 Apr 2021 20:31:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-24 00:30:57.785336
- Title: Discovering Classification Rules for Interpretable Learning with Linear
Programming
- Title(参考訳): 線形プログラミングによる解釈可能な学習のための分類規則の発見
- Authors: M. Hakan Aky\"uz, \c{S}. \.Ilker Birbil
- Abstract要約: ルールは、データセット内のサンプルのサブセットを分類する1つ以上の条件を含むif-thenステートメントのセットを具現化する。
様々な応用において、このような分類規則は意思決定者によって解釈されると考えられる。
解釈と学習のための新しいアルゴリズムを2つ紹介する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Rules embody a set of if-then statements which include one or more conditions
to classify a subset of samples in a dataset. In various applications such
classification rules are considered to be interpretable by the decision makers.
We introduce two new algorithms for interpretability and learning. Both
algorithms take advantage of linear programming, and hence, they are scalable
to large data sets. The first algorithm extracts rules for interpretation of
trained models that are based on tree/rule ensembles. The second algorithm
generates a set of classification rules through a column generation approach.
The proposed algorithms return a set of rules along with their optimal weights
indicating the importance of each rule for classification. Moreover, our
algorithms allow assigning cost coefficients, which could relate to different
attributes of the rules, such as; rule lengths, estimator weights, number of
false negatives, and so on. Thus, the decision makers can adjust these
coefficients to divert the training process and obtain a set of rules that are
more appealing for their needs. We have tested the performances of both
algorithms on a collection of datasets and presented a case study to elaborate
on optimal rule weights. Our results show that a good compromise between
interpretability and accuracy can be obtained by the proposed algorithms.
- Abstract(参考訳): ルールは、データセット内のサンプルのサブセットを分類する1つ以上の条件を含むif-thenステートメントのセットを具現化する。
様々な応用において、このような分類規則は意思決定者によって解釈されると考えられる。
解釈と学習のための新しいアルゴリズムを2つ紹介する。
どちらのアルゴリズムも線形プログラミングを利用するため、大規模なデータセットに対してスケーラブルである。
第1のアルゴリズムは、木/ルールアンサンブルに基づく訓練モデルの解釈規則を抽出する。
第2のアルゴリズムは列生成手法により分類規則の集合を生成する。
提案アルゴリズムは、各ルールの分類の重要性を示す最適な重みとともに一連のルールを返す。
さらに, ルール長, 推定器重み, 偽陰数など, ルールの異なる属性に関係のあるコスト係数を割り当てることも可能である。
したがって、意思決定者はこれらの係数を調整してトレーニングプロセスを分散させ、彼らのニーズによりアピールする一連のルールを得ることができる。
両アルゴリズムのパフォーマンスをデータセットの集合上で検証し、最適規則重みに関するケーススタディを提示した。
その結果,提案手法により解釈可能性と精度の妥協が得られた。
関連論文リスト
- Efficient learning of large sets of locally optimal classification rules [0.0]
従来のルール学習アルゴリズムは、単純なルールの集合を見つけることを目的としており、各ルールは可能な限り多くの例をカバーする。
本稿では、この方法で発見されたルールは、それらがカバーする例のそれぞれに対して最適な説明ではないかもしれないと論じる。
本稿では,1つの特殊化ループと1つの一般化ループからなるグリーディ最適化において,各トレーニング例をカバーする最良のルールを見つけることを目的とした,効率的なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-01-24T11:40:28Z) - Machine Learning with Probabilistic Law Discovery: A Concise
Introduction [77.34726150561087]
Probabilistic Law Discovery (PLD) は、確率論的ルール学習の変種を実装した論理ベースの機械学習手法である。
PLDはDecision Tree/Random Forestメソッドに近いが、関連するルールの定義方法に大きく異なる。
本稿はPLDの主な原則を概説し、その利点と限界を強調し、いくつかのアプリケーションガイドラインを提供する。
論文 参考訳(メタデータ) (2022-12-22T17:40:13Z) - Bayes Point Rule Set Learning [5.065947993017157]
解釈可能性は、機械学習アルゴリズムの設計においてますます重要な役割を担っている。
可分正規形式は、規則の集合を表現する最も解釈可能な方法である。
本稿では、DNF型ルールセットを学習するために、FIND-Sアルゴリズムの効果的なボトムアップ拡張を提案する。
論文 参考訳(メタデータ) (2022-04-11T16:50:41Z) - Reinforcement Learning Based Query Vertex Ordering Model for Subgraph
Matching [58.39970828272366]
グラフマッチングアルゴリズムは、クエリグラフの埋め込みをデータグラフGに列挙する。
マッチング順序は、これらのバックトラックに基づくサブグラフマッチングアルゴリズムの時間効率において重要な役割を果たす。
本稿では,Reinforcement Learning (RL) と Graph Neural Networks (GNN) 技術を適用して,グラフマッチングアルゴリズムの高品質なマッチング順序を生成する。
論文 参考訳(メタデータ) (2022-01-25T00:10:03Z) - Interpretable and Fair Boolean Rule Sets via Column Generation [15.694930039900234]
本稿では,直交正規形 (DNF, OR-of-ANDs) と直交正規形 (CNF, AND-of-ORs) のいずれにおいてもブール規則の学習を解釈可能な分類モデルとして考察する。
整数プログラムは、規則単純性のために最適に分類精度を交換するように定式化される。
論文 参考訳(メタデータ) (2021-11-16T13:40:28Z) - Discovering Useful Compact Sets of Sequential Rules in a Long Sequence [57.684967309375274]
COSSUは、小さな、意味のある一連の規則をマイニングするアルゴリズムである。
COSSUは、長いシーケンスから、関連するクローズド・シーケンシャル・ルールの集合を検索できることを示す。
論文 参考訳(メタデータ) (2021-09-15T18:25:18Z) - Fair Decision Rules for Binary Classification [0.0]
直交正規形式(DNF)におけるブール則集合構築の問題を考える。
この問題を2つの異なる分類パリティ尺度に対する明示的な制約で分類精度を最大化する整数プログラムとして定式化する。
他の公正かつ解釈可能な分類器と比較して、我々の手法は、公正性のより厳密な概念に適合する規則セットを精度の低いトレードオフで見つけることができる。
論文 参考訳(メタデータ) (2021-07-03T02:32:17Z) - Estimating leverage scores via rank revealing methods and randomization [50.591267188664666]
任意のランクの正方形密度あるいはスパース行列の統計レバレッジスコアを推定するアルゴリズムについて検討した。
提案手法は,高密度およびスパースなランダム化次元性還元変換の合成と階調明細化法を組み合わせることに基づく。
論文 参考訳(メタデータ) (2021-05-23T19:21:55Z) - Rule Covering for Interpretation and Boosting [0.0]
木に基づくアンサンブル手法の解釈と促進のための2つのアルゴリズムを提案する。
第一のアルゴリズムは、訓練されたランダムな森林モデルから得られる決定木を収集する。
第2のアルゴリズムは、決定木を増強するためにルール生成スキームを使用する。
論文 参考訳(メタデータ) (2020-07-13T13:42:57Z) - Meta-learning with Stochastic Linear Bandits [120.43000970418939]
我々は、よく知られたOFULアルゴリズムの正規化バージョンを実装するバンディットアルゴリズムのクラスを考える。
我々は,タスク数の増加とタスク分散の分散が小さくなると,タスクを個別に学習する上で,我々の戦略が大きな優位性を持つことを理論的および実験的に示す。
論文 参考訳(メタデータ) (2020-05-18T08:41:39Z) - Extreme Algorithm Selection With Dyadic Feature Representation [78.13985819417974]
我々は,数千の候補アルゴリズムの固定セットを考慮に入れた,極端なアルゴリズム選択(XAS)の設定を提案する。
我々は、XAS設定に対する最先端のAS技術の適用性を評価し、Dyadic特徴表現を利用したアプローチを提案する。
論文 参考訳(メタデータ) (2020-01-29T09:40:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。