論文の概要: Rule Covering for Interpretation and Boosting
- arxiv url: http://arxiv.org/abs/2007.06379v2
- Date: Sat, 19 Sep 2020 13:56:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-10 22:56:08.511457
- Title: Rule Covering for Interpretation and Boosting
- Title(参考訳): 解釈及び促進のための規則被覆
- Authors: S. Ilker Birbil, Mert Edali, Birol Yuceoglu
- Abstract要約: 木に基づくアンサンブル手法の解釈と促進のための2つのアルゴリズムを提案する。
第一のアルゴリズムは、訓練されたランダムな森林モデルから得られる決定木を収集する。
第2のアルゴリズムは、決定木を増強するためにルール生成スキームを使用する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose two algorithms for interpretation and boosting of tree-based
ensemble methods. Both algorithms make use of mathematical programming models
that are constructed with a set of rules extracted from an ensemble of decision
trees. The objective is to obtain the minimum total impurity with the least
number of rules that cover all the samples. The first algorithm uses the
collection of decision trees obtained from a trained random forest model. Our
numerical results show that the proposed rule covering approach selects only a
few rules that could be used for interpreting the random forest model.
Moreover, the resulting set of rules closely matches the accuracy level of the
random forest model. Inspired by the column generation algorithm in linear
programming, our second algorithm uses a rule generation scheme for boosting
decision trees. We use the dual optimal solutions of the linear programming
models as sample weights to obtain only those rules that would improve the
accuracy. With a computational study, we observe that our second algorithm
performs competitively with the other well-known boosting methods. Our
implementations also demonstrate that both algorithms can be trivially coupled
with the existing random forest and decision tree packages.
- Abstract(参考訳): 木に基づくアンサンブル手法の解釈と促進のための2つのアルゴリズムを提案する。
どちらのアルゴリズムも、決定木の集合から抽出された一連の規則で構築された数学的プログラミングモデルを利用する。
目的は、すべてのサンプルをカバーする最小限のルールで最小限の総不純物を得ることである。
最初のアルゴリズムは、訓練されたランダムな森林モデルから得られる決定木を収集する。
その結果,提案手法はランダム林モデル解釈に使用可能なルールをほんの数個だけ選択できることがわかった。
さらに、結果のルールセットはランダム森林モデルの精度レベルと密接に一致している。
線形プログラミングにおける列生成アルゴリズムに着想を得た第2のアルゴリズムは,ルール生成方式を用いて決定木を増強する。
線形プログラミングモデルの双対最適解を標本重みとして用いて、精度を向上させるような規則のみを得る。
計算研究により,2番目のアルゴリズムは,他のよく知られたブースティング手法と競合して動作することがわかった。
我々の実装はまた、両方のアルゴリズムが既存のランダムフォレストと決定木パッケージと自明に結合可能であることも示している。
関連論文リスト
- Bregman-divergence-based Arimoto-Blahut algorithm [53.64687146666141]
本稿では,Arimoto-BlahutアルゴリズムをBregman-Diversergenceシステム上で定義された一般関数に一般化する。
本稿では,古典的および量子速度歪み理論に適用可能な凸最適化自由アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-08-10T06:16:24Z) - A Unified Approach to Extract Interpretable Rules from Tree Ensembles via Integer Programming [2.1408617023874443]
木アンサンブル法は、教師付き分類と回帰タスクにおいて有効であることが知られている。
我々の研究は、訓練された木アンサンブルから最適化されたルールのリストを抽出することを目的としており、利用者に凝縮された解釈可能なモデルを提供する。
論文 参考訳(メタデータ) (2024-06-30T22:33:47Z) - Learning Decision Trees and Forests with Algorithmic Recourse [11.401006371457436]
Algorithmic Recourse(AR)は、モデルによって与えられる望ましくない予測結果を変更するためのリコースアクションを提供することを目的としている。
我々は、できるだけ多くの事例に対して合理的な行動の存在を保証するという制約の下で、正確な分類木を学習するタスクを定式化する。
論文 参考訳(メタデータ) (2024-06-03T08:33:42Z) - Optimal estimation of Gaussian (poly)trees [25.02920605955238]
分布学習(KL距離)と構造学習(正確な回復)の両問題を考察する。
最初のアプローチはChow-Liuアルゴリズムに基づいており、最適な木構造分布を効率的に学習する。
第2のアプローチは、制約に基づく構造学習のための条件付き独立試験器として部分相関を用いたポリツリーに対するPCアルゴリズムの修正である。
論文 参考訳(メタデータ) (2024-02-09T12:58:36Z) - On Universally Optimal Algorithms for A/B Testing [49.429419538826444]
ベルヌーイ報奨を伴う多腕バンディットにおける固定予算によるベストアーム識別の問題について検討する。
A/Bテスト問題としても知られる2つのアームの問題に対して,各アームを等しくサンプリングするアルゴリズムが存在しないことを証明した。
論文 参考訳(メタデータ) (2023-08-23T08:38:53Z) - Learning the Positions in CountSketch [49.57951567374372]
本稿では,まずランダムなスケッチ行列に乗じてデータを圧縮し,最適化問題を高速に解くスケッチアルゴリズムについて検討する。
本研究では,ゼロでないエントリの位置を最適化する学習ベースアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-06-11T07:28:35Z) - Explaining random forest prediction through diverse rulesets [0.0]
Local Tree eXtractor (LTreeX)は、与えられたテストインスタンスのフォレスト予測を、いくつかの異なるルールで説明することができる。
提案手法は予測性能の点で他の説明可能な手法よりも大幅に優れていることを示す。
論文 参考訳(メタデータ) (2022-03-29T12:54:57Z) - E2E-FS: An End-to-End Feature Selection Method for Neural Networks [0.3222802562733786]
EndtoEnd Feature Selection (E2FS) と呼ばれる新しい選択アルゴリズムを提案する。
アルゴリズムは,ラッソ法と同様,勾配降下法を用いて解く。
厳しい制約はあるものの、実験結果は、このアルゴリズムがどんな学習モデルでも利用できることを示している。
論文 参考訳(メタデータ) (2020-12-14T16:19:25Z) - Efficient Computation of Expectations under Spanning Tree Distributions [67.71280539312536]
本稿では,エッジファクター,非プロジェクティブ・スパンニングツリーモデルにおいて,一階期待と二階期待の重要なケースに対する統一アルゴリズムを提案する。
我々のアルゴリズムは勾配と期待の基本的な関係を利用しており、効率的なアルゴリズムを導出することができる。
論文 参考訳(メタデータ) (2020-08-29T14:58:26Z) - MurTree: Optimal Classification Trees via Dynamic Programming and Search [61.817059565926336]
動的プログラミングと探索に基づいて最適な分類木を学習するための新しいアルゴリズムを提案する。
当社のアプローチでは,最先端技術が必要とする時間のごく一部しか使用せず,数万のインスタンスでデータセットを処理することが可能です。
論文 参考訳(メタデータ) (2020-07-24T17:06:55Z) - Model Selection in Contextual Stochastic Bandit Problems [51.94632035240787]
基本アルゴリズムを選択できるメタアルゴリズムを開発した。
基本アルゴリズムの1つが$O(sqrtT)$後悔している場合でも、一般的には$Omega(sqrtT)$後悔よりも良いものを得ることはできません。
論文 参考訳(メタデータ) (2020-03-03T18:46:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。