論文の概要: Concise and interpretable multi-label rule sets
- arxiv url: http://arxiv.org/abs/2210.01533v1
- Date: Tue, 4 Oct 2022 11:23:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-05 14:50:58.238796
- Title: Concise and interpretable multi-label rule sets
- Title(参考訳): 簡潔かつ解釈可能な多段規則集合
- Authors: Martino Ciaperoni, Han Xiao, and Aristides Gionis
- Abstract要約: 簡単な「if-then」ルールの簡潔な集合として表現できるマルチラベル分類器を開発した。
提案手法は, 正確なマルチラベル分類に繋がる, 関連パターンの小さな集合を見つけることができる。
- 参考スコア(独自算出の注目度): 13.416159628299779
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Multi-label classification is becoming increasingly ubiquitous, but not much
attention has been paid to interpretability. In this paper, we develop a
multi-label classifier that can be represented as a concise set of simple
"if-then" rules, and thus, it offers better interpretability compared to
black-box models. Notably, our method is able to find a small set of relevant
patterns that lead to accurate multi-label classification, while existing
rule-based classifiers are myopic and wasteful in searching rules,requiring a
large number of rules to achieve high accuracy. In particular, we formulate the
problem of choosing multi-label rules to maximize a target function, which
considers not only discrimination ability with respect to labels, but also
diversity. Accounting for diversity helps to avoid redundancy, and thus, to
control the number of rules in the solution set. To tackle the said
maximization problem we propose a 2-approximation algorithm, which relies on a
novel technique to sample high-quality rules. In addition to our theoretical
analysis, we provide a thorough experimental evaluation, which indicates that
our approach offers a trade-off between predictive performance and
interpretability that is unmatched in previous work.
- Abstract(参考訳): マルチラベル分類はますます普及しているが、解釈可能性にはあまり注目されていない。
本稿では,単純な「if-then」ルールの簡潔な集合として表現できるマルチラベル分類器を開発し,ブラックボックスモデルと比較して高い解釈性を提供する。
特に,既存のルールベース分類器は検索規則に明快で無駄であり,高い精度を達成するために多数のルールが必要となるのに対し,本手法は正確なマルチラベル分類につながる少数の関連パターンを見出すことができる。
特に,ラベルに対する識別能力だけでなく多様性も考慮し,対象関数を最大化するためにマルチラベルルールを選択するという問題を定式化する。
多様性の会計は冗長性を回避し、それゆえ、ソリューションセットのルール数を制御するのに役立つ。
このような最大化問題に対処するために,新しい手法を用いて高品質なルールをサンプリングする2近似アルゴリズムを提案する。
理論解析に加えて,本手法が予測性能と解釈可能性とのトレードオフを提供し,先行研究では一致しないことを示す,徹底的な実験評価を行う。
関連論文リスト
- Dynamic Correlation Learning and Regularization for Multi-Label Confidence Calibration [60.95748658638956]
本稿では,多ラベルシナリオにおける信頼度を適切に評価することを目的としたマルチラベル信頼性タスクを提案する。
既存のシングルラベルキャリブレーション手法では、セマンティックな混乱に対処するために欠かせないカテゴリ相関を考慮できない。
本稿では,多粒度セマンティック相関を利用した動的相関学習と正規化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-07-09T13:26:21Z) - Probabilistic Truly Unordered Rule Sets [4.169915659794567]
真に順序のない規則集合に対するTURSを提案する。
我々はルールセットの確率的特性を利用して、類似した確率的出力を持つ場合のみ規則が重複することを許すという直観を生かしている。
我々は,幅広いルールベースの手法に対してベンチマークを行い,モデルの複雑さを低くし,高い競争力のある予測性能を持つルールセットを学習できることを実証した。
論文 参考訳(メタデータ) (2024-01-18T12:03:19Z) - Understanding and Mitigating Classification Errors Through Interpretable
Token Patterns [58.91023283103762]
容易に解釈可能な用語でエラーを特徴付けることは、分類器が体系的なエラーを起こす傾向にあるかどうかを洞察する。
正しい予測と誤予測を区別するトークンのパターンを発見することを提案する。
提案手法であるPremiseが実際によく動作することを示す。
論文 参考訳(メタデータ) (2023-11-18T00:24:26Z) - Class-Distribution-Aware Pseudo Labeling for Semi-Supervised Multi-Label
Learning [97.88458953075205]
Pseudo-labelingは、ラベルなしデータを利用するための人気で効果的なアプローチとして登場した。
本稿では,クラスアウェアの擬似ラベル処理を行うCAP(Class-Aware Pseudo-Labeling)という新しい手法を提案する。
論文 参考訳(メタデータ) (2023-05-04T12:52:18Z) - Multi-Label Quantification [78.83284164605473]
定量化とは、教師なしデータサンプルにおいて、興味あるクラスの相対周波数の予測子を生成する教師付き学習課題である。
本研究では,その相対頻度をより正確に予測するために,興味あるクラス間の依存関係を活用しようとするクラス有病率値の推定手法を提案する。
論文 参考訳(メタデータ) (2022-11-15T11:29:59Z) - Rethinking Clustering-Based Pseudo-Labeling for Unsupervised
Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。
このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。
このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文 参考訳(メタデータ) (2022-09-27T19:04:36Z) - Interpretable and Fair Boolean Rule Sets via Column Generation [18.08486863429421]
整数プログラムは、規則単純性のために最適に分類精度を交換するように定式化される。
公平性の設定を考慮し、分類パリティの2つの異なる尺度に関する明示的な制約を含むように定式化を拡張した。
他の公正かつ解釈可能な分類器と比較して、我々の手法は、公正性のより厳密な概念に適合する規則セットを精度の低いトレードオフで見つけることができる。
論文 参考訳(メタデータ) (2021-11-16T13:40:28Z) - Fair Decision Rules for Binary Classification [0.0]
直交正規形式(DNF)におけるブール則集合構築の問題を考える。
この問題を2つの異なる分類パリティ尺度に対する明示的な制約で分類精度を最大化する整数プログラムとして定式化する。
他の公正かつ解釈可能な分類器と比較して、我々の手法は、公正性のより厳密な概念に適合する規則セットを精度の低いトレードオフで見つけることができる。
論文 参考訳(メタデータ) (2021-07-03T02:32:17Z) - Minimax Active Learning [61.729667575374606]
アクティブラーニングは、人間のアノテーションによってラベル付けされる最も代表的なサンプルをクエリすることによって、ラベル効率の高いアルゴリズムを開発することを目指している。
現在のアクティブラーニング技術は、最も不確実なサンプルを選択するためにモデルの不確実性に頼るか、クラスタリングを使うか、最も多様なラベルのないサンプルを選択するために再構築する。
我々は,不確実性と多様性を両立させる半教師付きミニマックスエントロピーに基づく能動学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-12-18T19:03:40Z) - Learning Gradient Boosted Multi-label Classification Rules [4.842945656927122]
本稿では,分解不能な損失関数だけでなく,分解不能な損失関数を最小化できる多ラベル分類規則の学習アルゴリズムを提案する。
我々は,合成データに対するアプローチの能力と限界を分析し,その予測性能をマルチラベルベンチマークで評価する。
論文 参考訳(メタデータ) (2020-06-23T21:39:23Z) - Diverse Rule Sets [20.170305081348328]
ルールベースのシステムは、直感的なif-then表現のためにルネッサンスを経験しています。
本稿では,ルール間の重なり合いを最適化することで,多様なルールセットを推定する新しい手法を提案する。
次に、高い差別性を持ち、重複が少ない規則をサンプリングする効率的なランダム化アルゴリズムを考案する。
論文 参考訳(メタデータ) (2020-06-17T14:15:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。