論文の概要: Forest-ORE: Mining Optimal Rule Ensemble to interpret Random Forest models
- arxiv url: http://arxiv.org/abs/2403.17588v1
- Date: Tue, 26 Mar 2024 10:54:07 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-27 15:47:16.907479
- Title: Forest-ORE: Mining Optimal Rule Ensemble to interpret Random Forest models
- Title(参考訳): forest-ORE: Mining Optimal Rule Ensemble to Interpret Random Forest Model
- Authors: Haddouchi Maissae, Berrado Abdelaziz,
- Abstract要約: 本研究では,局所的およびグローバル的解釈のための最適化されたルールアンサンブル(ORE)を用いて,ランダムフォレスト(RF)を解釈可能にする手法であるフォレスト-OREを提案する。
良く知られた手法の比較分析は、フォレスト-OREが予測性能、解釈可能性カバレッジ、モデルサイズの間の優れたトレードオフを提供することを示している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Random Forest (RF) is well-known as an efficient ensemble learning method in terms of predictive performance. It is also considered a Black Box because of its hundreds of deep decision trees. This lack of interpretability can be a real drawback for acceptance of RF models in several real-world applications, especially those affecting one's lives, such as in healthcare, security, and law. In this work, we present Forest-ORE, a method that makes RF interpretable via an optimized rule ensemble (ORE) for local and global interpretation. Unlike other rule-based approaches aiming at interpreting the RF model, this method simultaneously considers several parameters that influence the choice of an interpretable rule ensemble. Existing methods often prioritize predictive performance over interpretability coverage and do not provide information about existing overlaps or interactions between rules. Forest-ORE uses a mixed-integer optimization program to build an ORE that considers the trade-off between predictive performance, interpretability coverage, and model size (size of the rule ensemble, rule lengths, and rule overlaps). In addition to providing an ORE competitive in predictive performance with RF, this method enriches the ORE through other rules that afford complementary information. It also enables monitoring of the rule selection process and delivers various metrics that can be used to generate a graphical representation of the final model. This framework is illustrated through an example, and its robustness is assessed through 36 benchmark datasets. A comparative analysis of well-known methods shows that Forest-ORE provides an excellent trade-off between predictive performance, interpretability coverage, and model size.
- Abstract(参考訳): ランダムフォレスト(RF)は,予測性能の観点から,効率的なアンサンブル学習法としてよく知られている。
また、何百本もの深い決定木があるため、ブラックボックスと見なされている。
このような解釈可能性の欠如は、いくつかの現実のアプリケーション、特に医療、セキュリティ、法律などの生活に影響を及ぼすものにおいて、RFモデルを受け入れる真の欠点となる可能性がある。
本研究では、局所的およびグローバルな解釈のために最適化されたルールアンサンブル(ORE)を介してRFを解釈する手法であるフォレスト-OREを提案する。
RFモデルの解釈を目的とした他のルールベースアプローチとは異なり、この手法は解釈可能なルールアンサンブルの選択に影響を与えるいくつかのパラメータを同時に検討する。
既存の方法は、解釈可能性のカバレッジよりも予測性能を優先し、既存の重複やルール間の相互作用に関する情報を提供しないことが多い。
Forest-OREは混合整数最適化プログラムを使用して、予測性能、解釈可能性カバレッジ、モデルサイズ(ルールアンサンブルのサイズ、ルールの長さ、ルールオーバーラップ)のトレードオフを考慮したOREを構築する。
RFの予測性能に競争力のあるOREを提供するのに加えて、この方法は相補的な情報を提供する他のルールを通じてOREを豊かにする。
また、ルール選択プロセスの監視を可能にし、最終モデルのグラフィカルな表現を生成するために使用できる様々なメトリクスを提供する。
このフレームワークは例によって説明され、その堅牢性は36のベンチマークデータセットを通じて評価される。
良く知られた手法の比較分析は、フォレスト-OREが予測性能、解釈可能性カバレッジ、モデルサイズの間の優れたトレードオフを提供することを示している。
関連論文リスト
- A survey and taxonomy of methods interpreting random forest models [0.0]
ランダムフォレスト(RF)モデルの解釈可能性は、機械学習(ML)コミュニティへの関心が高まりつつある研究トピックである。
RF生成モデルは、多くの深い決定木のために「ブラックボックス」と見なされている。
本論文は、RF結果モデルの解釈に文献で使用される手法について、広範囲にレビューすることを目的とする。
論文 参考訳(メタデータ) (2024-07-17T17:33:32Z) - A Unified Approach to Extract Interpretable Rules from Tree Ensembles via Integer Programming [2.1408617023874443]
木アンサンブル法は、教師付き分類と回帰タスクにおいて有効であることが知られている。
我々の研究は、訓練された木アンサンブルから最適化されたルールのリストを抽出することを目的としており、利用者に凝縮された解釈可能なモデルを提供する。
論文 参考訳(メタデータ) (2024-06-30T22:33:47Z) - Likelihood Ratio Confidence Sets for Sequential Decision Making [51.66638486226482]
確率に基づく推論の原理を再検討し、確率比を用いて妥当な信頼シーケンスを構築することを提案する。
本手法は, 精度の高い問題に特に適している。
提案手法は,オンライン凸最適化への接続に光を当てることにより,推定器の最適シーケンスを確実に選択する方法を示す。
論文 参考訳(メタデータ) (2023-11-08T00:10:21Z) - Obtaining Explainable Classification Models using Distributionally
Robust Optimization [12.511155426574563]
特徴値規則の集合を用いて構築した一般化線形モデルについて検討する。
ルールセットの間隔と予測精度の間には、固有のトレードオフが存在する。
我々はこれらの競合する要因に同時に対処するルールセットの集合を学習するための新しい定式化を提案する。
論文 参考訳(メタデータ) (2023-11-03T15:45:34Z) - Faithful Explanations of Black-box NLP Models Using LLM-generated
Counterfactuals [67.64770842323966]
NLPシステムの予測に関する因果的説明は、安全性を確保し、信頼を確立するために不可欠である。
既存の手法は、しばしばモデル予測を効果的または効率的に説明できない。
本稿では, 対物近似(CF)の2つの手法を提案する。
論文 参考訳(メタデータ) (2023-10-01T07:31:04Z) - Training and Inference on Any-Order Autoregressive Models the Right Way [97.39464776373902]
Any-Order Autoregressive Models (AO-ARMs) のファミリは、任意の条件付きタスクにおいてブレークスルーのパフォーマンスを示している。
我々は、AO-ARMの以前の定式化に対して行うべき重要な改善について確認する。
本手法はトラクタビリティを損なうことなく性能を向上する。
論文 参考訳(メタデータ) (2022-05-26T18:00:02Z) - Better Short than Greedy: Interpretable Models through Optimal Rule
Boosting [10.938624307941197]
ルールアンサンブルは、予測精度とモデル解釈可能性の間の有用なトレードオフを提供するように設計されている。
与えられたアンサンブルサイズに対して最大予測力の規則アンサンブルを適合させる新しい手法を提案する。
論文 参考訳(メタデータ) (2021-01-21T01:03:48Z) - Autoregressive Score Matching [113.4502004812927]
自動回帰条件スコアモデル(AR-CSM)を提案する。
AR-CSMモデルでは、このデータ分布とモデル分布のばらつきを効率的に計算し、最適化することができ、高価なサンプリングや対向訓練を必要としない。
本研究では,合成データに対する密度推定,画像生成,画像復調,暗黙エンコーダを用いた潜在変数モデルの訓練に応用できることを示す。
論文 参考訳(メタデータ) (2020-10-24T07:01:24Z) - Interpretation and Simplification of Deep Forest [4.576379639081977]
完全訓練深部RFの特徴量と周波数を決定規則の形で定量化することを検討する。
モデルの単純化は、機能のコントリビューションを測定することによって不要なルールを排除することで達成される。
実験結果から,ブラックボックスモデルでは,ルールセットを定量的に解釈するために,機能コントリビューション分析を分解できることが確認された。
論文 参考訳(メタデータ) (2020-01-14T11:30:26Z) - Adaptive Correlated Monte Carlo for Contextual Categorical Sequence
Generation [77.7420231319632]
我々は,モンテカルロ (MC) ロールアウトの集合を分散制御のために評価する政策勾配推定器に,カテゴリー列の文脈的生成を適用する。
また,二分木ソフトマックスモデルに相関したMCロールアウトを用いることで,大語彙シナリオにおける高生成コストを低減できることを示す。
論文 参考訳(メタデータ) (2019-12-31T03:01:55Z) - Polynomial-Time Exact MAP Inference on Discrete Models with Global
Dependencies [83.05591911173332]
ジャンクションツリーアルゴリズムは、実行時の保証と正確なMAP推論のための最も一般的な解である。
本稿では,ノードのクローン化による新たなグラフ変換手法を提案する。
論文 参考訳(メタデータ) (2019-12-27T13:30:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。