論文の概要: On Explaining Random Forests with SAT
- arxiv url: http://arxiv.org/abs/2105.10278v1
- Date: Fri, 21 May 2021 11:05:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-25 07:59:19.371174
- Title: On Explaining Random Forests with SAT
- Title(参考訳): SATを用いたランダム林の解説
- Authors: Yacine Izza and Joao Marques-Silva
- Abstract要約: ランダムフォレスト(RF)は機械学習(ML)分類器として最も広く使われている。
RFは解釈できないが、RFの説明を計算するための専門的な非ヒューリスティックなアプローチは存在しない。
本稿では,RFの計算説明のコントラスト化のための命題符号化を提案し,SATソルバによるPI説明の発見を可能にする。
- 参考スコア(独自算出の注目度): 3.5408022972081685
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Random Forest (RFs) are among the most widely used Machine Learning (ML)
classifiers. Even though RFs are not interpretable, there are no dedicated
non-heuristic approaches for computing explanations of RFs. Moreover, there is
recent work on polynomial algorithms for explaining ML models, including naive
Bayes classifiers. Hence, one question is whether finding explanations of RFs
can be solved in polynomial time. This paper answers this question negatively,
by proving that computing one PI-explanation of an RF is D^P-complete.
Furthermore, the paper proposes a propositional encoding for computing
explanations of RFs, thus enabling finding PI-explanations with a SAT solver.
This contrasts with earlier work on explaining boosted trees (BTs) and neural
networks (NNs), which requires encodings based on SMT/MILP. Experimental
results, obtained on a wide range of publicly available datasets, demontrate
that the proposed SAT-based approach scales to RFs of sizes common in practical
applications. Perhaps more importantly, the experimental results demonstrate
that, for the vast majority of examples considered, the SAT-based approach
proposed in this paper significantly outperforms existing heuristic approaches.
- Abstract(参考訳): ランダムフォレスト(RF)は最も広く使われている機械学習(ML)分類器の一つである。
RFは解釈できないが、RFの説明を計算するための専門的な非ヒューリスティックなアプローチは存在しない。
さらに,直交ベイズ分類器を含むMLモデルを記述するための多項式アルゴリズムの研究も最近行われている。
したがって、RFの説明が多項式時間で解けるかどうかが問題となる。
本稿では、RFの1つのPI展開がD^P完全であることを証明して、この疑問に否定的に答える。
さらに,RFの計算説明のための命題符号化を提案し,SATソルバによるPI説明の発見を可能にした。
これは、STT/MILPに基づくエンコーディングを必要とする強化木(BT)とニューラルネットワーク(NN)を説明する以前の研究とは対照的である。
広く公開されているデータセットから得られた実験結果は、SATベースのアプローチが実用的な応用に共通するサイズのRFにスケールすることを実証している。
さらに重要なのは,本論文で提案するsatベースのアプローチが,既存のヒューリスティックアプローチを大きく上回っていることを示す実験結果である。
関連論文リスト
- A survey and taxonomy of methods interpreting random forest models [0.0]
ランダムフォレスト(RF)モデルの解釈可能性は、機械学習(ML)コミュニティへの関心が高まりつつある研究トピックである。
RF生成モデルは、多くの深い決定木のために「ブラックボックス」と見なされている。
本論文は、RF結果モデルの解釈に文献で使用される手法について、広範囲にレビューすることを目的とする。
論文 参考訳(メタデータ) (2024-07-17T17:33:32Z) - VQ-T: RNN Transducers using Vector-Quantized Prediction Network States [52.48566999668521]
本稿では,RNNトランスデューサの予測ネットワークにおけるベクトル量子化長短期記憶単位を提案する。
ASRネットワークと協調して離散表現を訓練することにより、格子生成のために仮説を積極的にマージすることができる。
提案するVQ RNNトランスデューサは,通常の予測ネットワークを持つトランスデューサよりもASR性能が向上することを示す。
論文 参考訳(メタデータ) (2022-08-03T02:45:52Z) - Linear Temporal Logic Modulo Theories over Finite Traces (Extended
Version) [72.38188258853155]
有限トレース(LTLf)上の線形時間論理について検討する。
命題の文字は任意の理論で解釈された一階述語式に置き換えられる。
Satisfiability Modulo Theories (LTLfMT) と呼ばれる結果の論理は半決定可能である。
論文 参考訳(メタデータ) (2022-04-28T17:57:33Z) - A Generalizable Model-and-Data Driven Approach for Open-Set RFF
Authentication [74.63333951647581]
高周波指紋(RFF)は、低コストな物理層認証を実現するための有望な解決策である。
RFF抽出と識別のために機械学習に基づく手法が提案されている。
生受信信号からRFFを抽出するエンド・ツー・エンドのディープラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2021-08-10T03:59:37Z) - On Efficiently Explaining Graph-Based Classifiers [16.199563506727316]
本稿では,決定木 (DT) が解釈可能であるだけでなく,DT の 1 つのPI-Explanation を計算するためのリアルタイムアルゴリズムを提案する。
さらに,1つの対照的な説明を計算するためのリアルタイムアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-06-02T17:55:41Z) - Efficient semidefinite-programming-based inference for binary and
multi-class MRFs [83.09715052229782]
分割関数やMAP推定をペアワイズMRFで効率的に計算する手法を提案する。
一般のバイナリMRFから完全多クラス設定への半定緩和を拡張し、解法を用いて再び効率的に解けるようなコンパクトな半定緩和を開発する。
論文 参考訳(メタデータ) (2020-12-04T15:36:29Z) - AIN: Fast and Accurate Sequence Labeling with Approximate Inference
Network [75.44925576268052]
線形鎖条件ランダム場(CRF)モデルは最も広く使われているニューラルネットワークラベリング手法の1つである。
厳密な確率的推論アルゴリズムは典型的にはCRFモデルの訓練と予測段階に適用される。
CRFモデルに対して並列化可能な近似変分推論アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-09-17T12:18:43Z) - Learning Reasoning Strategies in End-to-End Differentiable Proving [50.9791149533921]
条件付き定理プローバーは勾配に基づく最適化により最適規則選択戦略を学習する。
条件付き定理プローサは拡張性があり、CLUTRRデータセット上で最先端の結果が得られることを示す。
論文 参考訳(メタデータ) (2020-07-13T16:22:14Z) - Random Partitioning Forest for Point-Wise and Collective Anomaly
Detection -- Application to Intrusion Detection [9.74672460306765]
DiFF-RFはランダムな分割二分木で構成されるアンサンブルアプローチであり、異常を検出する。
実験の結果,DiFF-RFはアイソレーション・フォレスト(IF)アルゴリズムをほぼ体系的に上回っていることがわかった。
我々の経験から,DiFF-RFは小規模な学習データの存在下では有効であることがわかった。
論文 参考訳(メタデータ) (2020-06-29T10:44:08Z) - Interpretation and Simplification of Deep Forest [4.576379639081977]
完全訓練深部RFの特徴量と周波数を決定規則の形で定量化することを検討する。
モデルの単純化は、機能のコントリビューションを測定することによって不要なルールを排除することで達成される。
実験結果から,ブラックボックスモデルでは,ルールセットを定量的に解釈するために,機能コントリビューション分析を分解できることが確認された。
論文 参考訳(メタデータ) (2020-01-14T11:30:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。