論文の概要: A Nested Genetic Algorithm for Explaining Classification Data Sets with
Decision Rules
- arxiv url: http://arxiv.org/abs/2209.07575v1
- Date: Tue, 23 Aug 2022 11:42:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-25 17:58:46.536854
- Title: A Nested Genetic Algorithm for Explaining Classification Data Sets with
Decision Rules
- Title(参考訳): 決定規則を用いた分類データセットの説明のためのネスト型遺伝的アルゴリズム
- Authors: Paul-Amaury Matt, Rosina Ziegler, Danilo Brajovic, Marco Roth and
Marco F. Huber
- Abstract要約: 我々は、分類データセットを最もよく説明する一連の決定ルール(ルールセット)を自動的に抽出することを目指している。
まず、データセットでトレーニングされた一連の決定ツリーから、大規模な決定ルールを抽出する。
ルールセットは簡潔で正確で、最大カバレッジと最小数の矛盾を持つべきである。
- 参考スコア(独自算出の注目度): 3.8271082752302137
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Our goal in this paper is to automatically extract a set of decision rules
(rule set) that best explains a classification data set. First, a large set of
decision rules is extracted from a set of decision trees trained on the data
set. The rule set should be concise, accurate, have a maximum coverage and
minimum number of inconsistencies. This problem can be formalized as a modified
version of the weighted budgeted maximum coverage problem, known to be NP-hard.
To solve the combinatorial optimization problem efficiently, we introduce a
nested genetic algorithm which we then use to derive explanations for ten
public data sets.
- Abstract(参考訳): 本論文の目標は,分類データセットを最もよく説明する一連の決定規則(ルール集合)を自動的に抽出することである。
まず、データセットでトレーニングされた一連の決定ツリーから、大規模な決定ルールを抽出する。
ルールセットは簡潔で正確で、最大カバレッジと最小数の不一致を持つべきである。
この問題はNPハードとして知られる重み付き最大カバレッジ問題の修正版として定式化することができる。
組合せ最適化問題を効率的に解くために,10個の公開データセットに対する説明を導出するネスト付き遺伝的アルゴリズムを導入する。
関連論文リスト
- Combinatorial Stochastic-Greedy Bandit [79.1700188160944]
我々は,選択した$n$のアームセットのジョイント報酬以外の余分な情報が観測されない場合に,マルチアームのバンディット問題に対する新規グリーディ・バンディット(SGB)アルゴリズムを提案する。
SGBは最適化された拡張型コミットアプローチを採用しており、ベースアームの大きなセットを持つシナリオ用に特別に設計されている。
論文 参考訳(メタデータ) (2023-12-13T11:08:25Z) - Concomitant Group Testing [49.50984893039441]
肯定的なテストが複数種類の項目の組み合わせを必要とするという考え方を捉えたグループテストの問題のバリエーションを紹介した。
目標は、可能な限り少数のテストを使用して、半欠陥セットをすべて確実に識別することである。
我々のアルゴリズムは、(i)決定性(ゼロエラー)かランダム化(小エラー)か、(ii)非適応性(非適応性)、完全適応性(完全適応性)、あるいは限定適応性(限定適応性)かによって区別される。
論文 参考訳(メタデータ) (2023-09-08T09:11:12Z) - FIRE: An Optimization Approach for Fast Interpretable Rule Extraction [7.538482310185135]
本稿では,ツリーアンサンブルから少数の決定ルールを抽出する最適化ベースのフレームワークであるFIRE(Fast Interpretable Rule extract)を提案する。
我々の実験では、FIREはスパースルールセットを構築する際に最先端のアンサンブルアルゴリズムより優れており、既存の手法よりも解釈可能なモデルを提供できることを示した。
論文 参考訳(メタデータ) (2023-06-12T21:27:39Z) - Efficient learning of large sets of locally optimal classification rules [0.0]
従来のルール学習アルゴリズムは、単純なルールの集合を見つけることを目的としており、各ルールは可能な限り多くの例をカバーする。
本稿では、この方法で発見されたルールは、それらがカバーする例のそれぞれに対して最適な説明ではないかもしれないと論じる。
本稿では,1つの特殊化ループと1つの一般化ループからなるグリーディ最適化において,各トレーニング例をカバーする最良のルールを見つけることを目的とした,効率的なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-01-24T11:40:28Z) - Fast Feature Selection with Fairness Constraints [49.142308856826396]
モデル構築における最適特徴の選択に関する基礎的問題について検討する。
この問題は、greedyアルゴリズムの変種を使用しても、大規模なデータセットで計算的に困難である。
適応クエリモデルは,最近提案された非モジュラー関数に対する直交整合探索のより高速なパラダイムに拡張する。
提案アルゴリズムは、適応型クエリモデルにおいて指数関数的に高速な並列実行を実現する。
論文 参考訳(メタデータ) (2022-02-28T12:26:47Z) - Interpretable and Fair Boolean Rule Sets via Column Generation [18.08486863429421]
整数プログラムは、規則単純性のために最適に分類精度を交換するように定式化される。
公平性の設定を考慮し、分類パリティの2つの異なる尺度に関する明示的な制約を含むように定式化を拡張した。
他の公正かつ解釈可能な分類器と比較して、我々の手法は、公正性のより厳密な概念に適合する規則セットを精度の低いトレードオフで見つけることができる。
論文 参考訳(メタデータ) (2021-11-16T13:40:28Z) - Certifiably Polynomial Algorithm for Best Group Subset Selection [0.9667631210393929]
ベストグループサブセットの選択は、応答変数の最良の解釈可能性を達成するために重複しないグループの小さな部分を選択することを目的としている。
有効群を反復的に検出し,無力群を除外するグループスプライシングアルゴリズムを提案する。
提案手法の効率と精度を,合成データセットと実世界のデータセットを比較して検証する。
論文 参考訳(メタデータ) (2021-04-23T03:05:11Z) - An Integer Linear Programming Framework for Mining Constraints from Data [81.60135973848125]
データから制約をマイニングするための一般的なフレームワークを提案する。
特に、構造化された出力予測の推論を整数線形プログラミング(ILP)問題とみなす。
提案手法は,9×9のスドクパズルの解法を学習し,基礎となるルールを提供することなく,例からツリー問題を最小限に分散させることが可能であることを示す。
論文 参考訳(メタデータ) (2020-06-18T20:09:53Z) - Extreme Algorithm Selection With Dyadic Feature Representation [78.13985819417974]
我々は,数千の候補アルゴリズムの固定セットを考慮に入れた,極端なアルゴリズム選択(XAS)の設定を提案する。
我々は、XAS設定に対する最先端のAS技術の適用性を評価し、Dyadic特徴表現を利用したアプローチを提案する。
論文 参考訳(メタデータ) (2020-01-29T09:40:58Z) - Optimal Clustering from Noisy Binary Feedback [75.17453757892152]
本稿では,二元的ユーザフィードバックから一組のアイテムをクラスタリングする問題について検討する。
最小クラスタ回復誤差率のアルゴリズムを考案する。
適応選択のために,情報理論的誤差下界の導出にインスパイアされたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2019-10-14T09:18:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。