論文の概要: Interpretable and Fair Boolean Rule Sets via Column Generation
- arxiv url: http://arxiv.org/abs/2111.08466v1
- Date: Tue, 16 Nov 2021 13:40:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-17 14:05:26.349125
- Title: Interpretable and Fair Boolean Rule Sets via Column Generation
- Title(参考訳): 列生成による解釈可能かつ公正なブール規則セット
- Authors: Connor Lawless, Sanjeeb Dash, Oktay Gunluk, Dennis Wei
- Abstract要約: 本稿では,直交正規形 (DNF, OR-of-ANDs) と直交正規形 (CNF, AND-of-ORs) のいずれにおいてもブール規則の学習を解釈可能な分類モデルとして考察する。
整数プログラムは、規則単純性のために最適に分類精度を交換するように定式化される。
- 参考スコア(独自算出の注目度): 15.694930039900234
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper considers the learning of Boolean rules in either disjunctive
normal form (DNF, OR-of-ANDs, equivalent to decision rule sets) or conjunctive
normal form (CNF, AND-of-ORs) as an interpretable model for classification. An
integer program is formulated to optimally trade classification accuracy for
rule simplicity. We also consider the fairness setting and extend the
formulation to include explicit constraints on two different measures of
classification parity: equality of opportunity and equalized odds. Column
generation (CG) is used to efficiently search over an exponential number of
candidate clauses (conjunctions or disjunctions) without the need for heuristic
rule mining. This approach also bounds the gap between the selected rule set
and the best possible rule set on the training data. To handle large datasets,
we propose an approximate CG algorithm using randomization. Compared to three
recently proposed alternatives, the CG algorithm dominates the
accuracy-simplicity trade-off in 8 out of 16 datasets. When maximized for
accuracy, CG is competitive with rule learners designed for this purpose,
sometimes finding significantly simpler solutions that are no less accurate.
Compared to other fair and interpretable classifiers, our method is able to
find rule sets that meet stricter notions of fairness with a modest trade-off
in accuracy.
- Abstract(参考訳): 本稿では,解離正規形 (DNF, OR-of-ANDs, equivalent to decision rule set) と解離正規形 (CNF, AND-of-ORs) のいずれにおいてもブール規則の学習を解釈可能な分類モデルとして考察する。
整数プログラムは規則単純性のために最適に分類精度を交換する。
また,公平性の設定を検討し,その定式化を2つの異なる分類パリティ尺度(機会の平等と等化オッズ)に対する明示的な制約を含むように拡張する。
カラム生成(CG)は、ヒューリスティックなルールマイニングを必要とせずに、指数関数的な数の候補節(接続や接続)を効率的に探索するために用いられる。
このアプローチでは、選択されたルールセットとトレーニングデータに設定された最善のルールとのギャップも制限する。
大規模データセットを扱うために,ランダム化を用いた近似cgアルゴリズムを提案する。
最近提案された3つの代替手法と比較して、CGアルゴリズムは16のデータセットのうち8つの正確さと単純さのトレードオフを支配している。
精度を最大化する場合、CGはこの目的のために設計されたルール学習者と競合する。
他の公正かつ解釈可能な分類器と比較して、我々の手法は、公正性のより厳密な概念に適合する規則セットを精度の低いトレードオフで見つけることができる。
関連論文リスト
- Obtaining Explainable Classification Models using Distributionally
Robust Optimization [12.511155426574563]
特徴値規則の集合を用いて構築した一般化線形モデルについて検討する。
ルールセットの間隔と予測精度の間には、固有のトレードオフが存在する。
我々はこれらの競合する要因に同時に対処するルールセットの集合を学習するための新しい定式化を提案する。
論文 参考訳(メタデータ) (2023-11-03T15:45:34Z) - Boosting Fair Classifier Generalization through Adaptive Priority Reweighing [59.801444556074394]
より優れた一般化性を持つ性能向上フェアアルゴリズムが必要である。
本稿では,トレーニングデータとテストデータ間の分散シフトがモデル一般化性に与える影響を解消する適応的リライジング手法を提案する。
論文 参考訳(メタデータ) (2023-09-15T13:04:55Z) - Bipartite Ranking Fairness through a Model Agnostic Ordering Adjustment [54.179859639868646]
本稿では,二部類ランキングにおける公平性を実現するためのモデルに依存しない後処理フレームワークxOrderを提案する。
xOrderは、教師なしおよび教師なしの公正度メトリックを含む、さまざまな分類モデルとランキングフェアネスメトリクスと互換性がある。
提案アルゴリズムを,4つのベンチマークデータセットと2つの実世界の患者電子健康記録リポジトリ上で評価した。
論文 参考訳(メタデータ) (2023-07-27T07:42:44Z) - Efficient learning of large sets of locally optimal classification rules [0.0]
従来のルール学習アルゴリズムは、単純なルールの集合を見つけることを目的としており、各ルールは可能な限り多くの例をカバーする。
本稿では、この方法で発見されたルールは、それらがカバーする例のそれぞれに対して最適な説明ではないかもしれないと論じる。
本稿では,1つの特殊化ループと1つの一般化ループからなるグリーディ最適化において,各トレーニング例をカバーする最良のルールを見つけることを目的とした,効率的なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-01-24T11:40:28Z) - Bayes Point Rule Set Learning [5.065947993017157]
解釈可能性は、機械学習アルゴリズムの設計においてますます重要な役割を担っている。
可分正規形式は、規則の集合を表現する最も解釈可能な方法である。
本稿では、DNF型ルールセットを学習するために、FIND-Sアルゴリズムの効果的なボトムアップ拡張を提案する。
論文 参考訳(メタデータ) (2022-04-11T16:50:41Z) - Universal and data-adaptive algorithms for model selection in linear
contextual bandits [52.47796554359261]
モデル選択の最も単純な非自明な例を考える: 単純な多重武装バンディット問題と線形文脈バンディット問題とを区別する。
データ適応的な方法で探索する新しいアルゴリズムを導入し、$mathcalO(dalpha T1- alpha)$という形式の保証を提供する。
我々のアプローチは、いくつかの仮定の下で、ネストされた線形文脈包帯のモデル選択に拡張する。
論文 参考訳(メタデータ) (2021-11-08T18:05:35Z) - Discovering Useful Compact Sets of Sequential Rules in a Long Sequence [57.684967309375274]
COSSUは、小さな、意味のある一連の規則をマイニングするアルゴリズムである。
COSSUは、長いシーケンスから、関連するクローズド・シーケンシャル・ルールの集合を検索できることを示す。
論文 参考訳(メタデータ) (2021-09-15T18:25:18Z) - Fair Decision Rules for Binary Classification [0.0]
直交正規形式(DNF)におけるブール則集合構築の問題を考える。
この問題を2つの異なる分類パリティ尺度に対する明示的な制約で分類精度を最大化する整数プログラムとして定式化する。
他の公正かつ解釈可能な分類器と比較して、我々の手法は、公正性のより厳密な概念に適合する規則セットを精度の低いトレードオフで見つけることができる。
論文 参考訳(メタデータ) (2021-07-03T02:32:17Z) - Better Short than Greedy: Interpretable Models through Optimal Rule
Boosting [10.938624307941197]
ルールアンサンブルは、予測精度とモデル解釈可能性の間の有用なトレードオフを提供するように設計されている。
与えられたアンサンブルサイズに対して最大予測力の規則アンサンブルを適合させる新しい手法を提案する。
論文 参考訳(メタデータ) (2021-01-21T01:03:48Z) - Pre-training Is (Almost) All You Need: An Application to Commonsense
Reasoning [61.32992639292889]
事前学習されたトランスモデルの微調整は、一般的なNLPタスクを解決するための標準的なアプローチとなっている。
そこで本研究では,可視性ランキングタスクをフルテキスト形式でキャストする新たなスコアリング手法を提案する。
提案手法は, ランダム再起動にまたがって, より安定した学習段階を提供することを示す。
論文 参考訳(メタデータ) (2020-04-29T10:54:40Z) - Optimal Clustering from Noisy Binary Feedback [75.17453757892152]
本稿では,二元的ユーザフィードバックから一組のアイテムをクラスタリングする問題について検討する。
最小クラスタ回復誤差率のアルゴリズムを考案する。
適応選択のために,情報理論的誤差下界の導出にインスパイアされたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2019-10-14T09:18:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。