論文の概要: Interpretable and Fair Boolean Rule Sets via Column Generation
- arxiv url: http://arxiv.org/abs/2111.08466v2
- Date: Mon, 18 Sep 2023 16:36:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-20 02:24:25.386445
- Title: Interpretable and Fair Boolean Rule Sets via Column Generation
- Title(参考訳): 列生成による解釈可能かつ公正なブール規則セット
- Authors: Connor Lawless, Sanjeeb Dash, Oktay Gunluk, Dennis Wei
- Abstract要約: 整数プログラムは、規則単純性のために最適に分類精度を交換するように定式化される。
公平性の設定を考慮し、分類パリティの2つの異なる尺度に関する明示的な制約を含むように定式化を拡張した。
他の公正かつ解釈可能な分類器と比較して、我々の手法は、公正性のより厳密な概念に適合する規則セットを精度の低いトレードオフで見つけることができる。
- 参考スコア(独自算出の注目度): 18.08486863429421
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper considers the learning of Boolean rules in disjunctive normal form
(DNF, OR-of-ANDs, equivalent to decision rule sets) as an interpretable model
for classification. An integer program is formulated to optimally trade
classification accuracy for rule simplicity. We also consider the fairness
setting and extend the formulation to include explicit constraints on two
different measures of classification parity: equality of opportunity and
equalized odds. Column generation (CG) is used to efficiently search over an
exponential number of candidate rules without the need for heuristic rule
mining. To handle large data sets, we propose an approximate CG algorithm using
randomization. Compared to three recently proposed alternatives, the CG
algorithm dominates the accuracy-simplicity trade-off in 8 out of 16 data sets.
When maximized for accuracy, CG is competitive with rule learners designed for
this purpose, sometimes finding significantly simpler solutions that are no
less accurate. Compared to other fair and interpretable classifiers, our method
is able to find rule sets that meet stricter notions of fairness with a modest
trade-off in accuracy.
- Abstract(参考訳): 本稿では,解離正規形 (DNF, OR-of-ANDs, equivalent to decision rule set) におけるブール規則の学習を,分類の解釈可能なモデルとして考察する。
整数プログラムは規則単純性のために最適に分類精度を交換する。
また,公平性の設定を検討し,その定式化を2つの異なる分類パリティ尺度(機会の平等と等化オッズ)に対する明示的な制約を含むように拡張する。
カラム生成(CG)は、ヒューリスティックなルールマイニングを必要とせずに、指数関数的な数のルールを効率的に探索するために用いられる。
大規模データセットを扱うために,ランダム化を用いた近似cgアルゴリズムを提案する。
最近提案された3つの選択肢と比較して、CGアルゴリズムは16データセットのうち8つの精度と単純さのトレードオフを支配している。
精度を最大化する場合、CGはこの目的のために設計されたルール学習者と競合する。
他の公正かつ解釈可能な分類器と比較して、我々の手法は、公正性のより厳密な概念に適合する規則セットを精度の低いトレードオフで見つけることができる。
関連論文リスト
- Bipartite Ranking Fairness through a Model Agnostic Ordering Adjustment [54.179859639868646]
本稿では,二部類ランキングにおける公平性を実現するためのモデルに依存しない後処理フレームワークxOrderを提案する。
xOrderは、教師なしおよび教師なしの公正度メトリックを含む、さまざまな分類モデルとランキングフェアネスメトリクスと互換性がある。
提案アルゴリズムを,4つのベンチマークデータセットと2つの実世界の患者電子健康記録リポジトリ上で評価した。
論文 参考訳(メタデータ) (2023-07-27T07:42:44Z) - Learning Locally Interpretable Rule Ensemble [2.512827436728378]
ルールアンサンブルは重み付き規則の線形結合に基づく解釈可能なモデルである。
本稿では,正確かつ解釈可能なルールアンサンブルモデルを学習するための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-20T12:06:56Z) - ProTeCt: Prompt Tuning for Hierarchical Consistency [70.94769641675377]
CLIPのような大規模なビジュアル言語モデルは、一般化された表現を学び、有望なゼロショットのパフォーマンスを示している。
彼らは、葉のレベルでの推測が正しい場合でも、粗い分類学的階級レベルで誤ったラベルを推測する。
本稿では,モデル予測の階層的一貫性を校正するための即時チューニング手法を提案する。
論文 参考訳(メタデータ) (2023-06-04T02:55:25Z) - Efficient learning of large sets of locally optimal classification rules [0.0]
従来のルール学習アルゴリズムは、単純なルールの集合を見つけることを目的としており、各ルールは可能な限り多くの例をカバーする。
本稿では、この方法で発見されたルールは、それらがカバーする例のそれぞれに対して最適な説明ではないかもしれないと論じる。
本稿では,1つの特殊化ループと1つの一般化ループからなるグリーディ最適化において,各トレーニング例をカバーする最良のルールを見つけることを目的とした,効率的なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-01-24T11:40:28Z) - Bayes Point Rule Set Learning [5.065947993017157]
解釈可能性は、機械学習アルゴリズムの設計においてますます重要な役割を担っている。
可分正規形式は、規則の集合を表現する最も解釈可能な方法である。
本稿では、DNF型ルールセットを学習するために、FIND-Sアルゴリズムの効果的なボトムアップ拡張を提案する。
論文 参考訳(メタデータ) (2022-04-11T16:50:41Z) - Sequence Transduction with Graph-based Supervision [96.04967815520193]
ラベルのグラフ表現を受け入れるためにRNN-T損失を一般化するトランスデューサ目的関数を提案する。
CTC型格子を用いたトランスデューサベースのASRは,標準RNN-Tよりも優れた結果が得られることを示す。
論文 参考訳(メタデータ) (2021-11-01T21:51:42Z) - Discovering Useful Compact Sets of Sequential Rules in a Long Sequence [57.684967309375274]
COSSUは、小さな、意味のある一連の規則をマイニングするアルゴリズムである。
COSSUは、長いシーケンスから、関連するクローズド・シーケンシャル・ルールの集合を検索できることを示す。
論文 参考訳(メタデータ) (2021-09-15T18:25:18Z) - Fair Decision Rules for Binary Classification [0.0]
直交正規形式(DNF)におけるブール則集合構築の問題を考える。
この問題を2つの異なる分類パリティ尺度に対する明示的な制約で分類精度を最大化する整数プログラムとして定式化する。
他の公正かつ解釈可能な分類器と比較して、我々の手法は、公正性のより厳密な概念に適合する規則セットを精度の低いトレードオフで見つけることができる。
論文 参考訳(メタデータ) (2021-07-03T02:32:17Z) - Better Short than Greedy: Interpretable Models through Optimal Rule
Boosting [10.938624307941197]
ルールアンサンブルは、予測精度とモデル解釈可能性の間の有用なトレードオフを提供するように設計されている。
与えられたアンサンブルサイズに対して最大予測力の規則アンサンブルを適合させる新しい手法を提案する。
論文 参考訳(メタデータ) (2021-01-21T01:03:48Z) - Autoregressive Score Matching [113.4502004812927]
自動回帰条件スコアモデル(AR-CSM)を提案する。
AR-CSMモデルでは、このデータ分布とモデル分布のばらつきを効率的に計算し、最適化することができ、高価なサンプリングや対向訓練を必要としない。
本研究では,合成データに対する密度推定,画像生成,画像復調,暗黙エンコーダを用いた潜在変数モデルの訓練に応用できることを示す。
論文 参考訳(メタデータ) (2020-10-24T07:01:24Z) - Pre-training Is (Almost) All You Need: An Application to Commonsense
Reasoning [61.32992639292889]
事前学習されたトランスモデルの微調整は、一般的なNLPタスクを解決するための標準的なアプローチとなっている。
そこで本研究では,可視性ランキングタスクをフルテキスト形式でキャストする新たなスコアリング手法を提案する。
提案手法は, ランダム再起動にまたがって, より安定した学習段階を提供することを示す。
論文 参考訳(メタデータ) (2020-04-29T10:54:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。