論文の概要: Feature Importance Measurement based on Decision Tree Sampling
- arxiv url: http://arxiv.org/abs/2307.13333v1
- Date: Tue, 25 Jul 2023 08:45:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-26 17:56:05.296374
- Title: Feature Importance Measurement based on Decision Tree Sampling
- Title(参考訳): 決定木サンプリングに基づく特徴重要度測定
- Authors: Chao Huang, Diptesh Das, Koji Tsuda
- Abstract要約: 本研究では,木質モデルにおける特徴量測定のためのSAT法DT-Samplerを提案する。
提案手法は, ランダム林よりも少ないパラメータを持ち, 実世界の問題に対して高い解釈性と安定性を提供する。
- 参考スコア(独自算出の注目度): 6.560897050479657
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Random forest is effective for prediction tasks but the randomness of tree
generation hinders interpretability in feature importance analysis. To address
this, we proposed DT-Sampler, a SAT-based method for measuring feature
importance in tree-based model. Our method has fewer parameters than random
forest and provides higher interpretability and stability for the analysis in
real-world problems. An implementation of DT-Sampler is available at
https://github.com/tsudalab/DT-sampler.
- Abstract(参考訳): ランダム林は予測作業に有効であるが,木生成のランダム性は特徴重要度解析における解釈可能性を妨げる。
そこで我々は,木質モデルにおける特徴量を測定するSATベース手法DT-Samplerを提案する。
本手法はランダムフォレストよりもパラメータが少なく,実世界問題の解析に高い解釈性と安定性をもたらす。
dt-samplerの実装はhttps://github.com/tsudalab/dt-samplerで利用可能である。
関連論文リスト
- Balancing Diversity and Risk in LLM Sampling: How to Select Your Method and Parameter for Open-Ended Text Generation [60.493180081319785]
本稿では,各復号工程における多様性とリスクのトレードオフを考慮し,トラクションサンプリング手法の本質的な能力を推定する体系的手法を提案する。
本研究は,既存のトラクションサンプリング手法の総合的な比較と,ユーザのガイドラインとして推奨されるパラメータについて紹介する。
論文 参考訳(メタデータ) (2024-08-24T14:14:32Z) - Embedding Trajectory for Out-of-Distribution Detection in Mathematical Reasoning [50.84938730450622]
数理推論におけるOOD検出にトラジェクトリボラティリティを用いたトラジェクトリベースのTVスコアを提案する。
本手法は, 数学的推論シナリオ下でのGLM上での従来のアルゴリズムよりも優れる。
提案手法は,複数選択質問などの出力空間における高密度特徴を持つアプリケーションに拡張することができる。
論文 参考訳(メタデータ) (2024-05-22T22:22:25Z) - Inference with Mondrian Random Forests [6.97762648094816]
我々は、モンドリアンのランダムな森林回帰推定器に対して、ベリー・エッセイン型中央極限定理とともに、正確なバイアスと分散特性を与える。
未知回帰関数に対する有効な統計的推測法を提案する。
効率的で実装可能なアルゴリズムは、バッチとオンラインの学習設定の両方に考案されている。
論文 参考訳(メタデータ) (2023-10-15T01:41:42Z) - Prediction intervals for neural network models using weighted asymmetric
loss functions [0.3093890460224435]
本稿では,近似および予測された傾向に対する予測区間(PI)を簡便かつ効率的に生成する手法を提案する。
本手法は、重み付き非対称損失関数を利用して、PIの上下境界を推定する。
パラメトリド関数のPIを導出するためにどのように拡張できるかを示し、深層ニューラルネットワークのトレーニングにおいてその有効性について議論する。
論文 参考訳(メタデータ) (2022-10-09T18:58:24Z) - To tree or not to tree? Assessing the impact of smoothing the decision
boundaries [4.286327408435937]
自然にそのような解を見つけるアルゴリズムによって生成される「厳密な」決定境界が、どの程度緩和されて性能改善を得るべきかを定量化する。
この2つの尺度が,モデル選択によってさらに探索する前に,モデルがいかに表現的であるべきかをユーザが判断する上で,どのように役立つかを示す。
論文 参考訳(メタデータ) (2022-10-07T16:27:13Z) - FACT: High-Dimensional Random Forests Inference [4.941630596191806]
ランダム森林学習における個々の特徴の有用性の定量化は、その解釈可能性を大幅に向上させる。
既存の研究では、ランダム森林の特徴的重要度尺度が偏見の問題に悩まされていることが示されている。
本研究では, 自己正規化特徴-残留相関テスト(FACT)の枠組みを提案する。
論文 参考訳(メタデータ) (2022-07-04T19:05:08Z) - On Variance Estimation of Random Forests [0.0]
本稿では,不完全U-統計量に基づく不偏分散推定器を開発する。
我々は,計算コストを増大させることなく,より低いバイアスとより正確な信頼区間のカバレッジを評価できることを示した。
論文 参考訳(メタデータ) (2022-02-18T03:35:47Z) - NUQ: Nonparametric Uncertainty Quantification for Deterministic Neural
Networks [151.03112356092575]
本研究では,Nadaraya-Watson の条件付きラベル分布の非パラメトリック推定に基づく分類器の予測の不確かさの測定方法を示す。
種々の実世界の画像データセットにおける不確実性推定タスクにおいて,本手法の強い性能を示す。
論文 参考訳(メタデータ) (2022-02-07T12:30:45Z) - Sampling-free Variational Inference for Neural Networks with
Multiplicative Activation Noise [51.080620762639434]
サンプリングフリー変動推論のための後方近似のより効率的なパラメータ化を提案する。
提案手法は,標準回帰問題に対する競合的な結果をもたらし,大規模画像分類タスクに適している。
論文 参考訳(メタデータ) (2021-03-15T16:16:18Z) - Balance-Subsampled Stable Prediction [55.13512328954456]
本稿では, 分数分解設計理論に基づく新しいバランスサブサンプル安定予測法を提案する。
設計理論解析により,提案手法は分布シフトによって誘導される予測器間の共起効果を低減できることを示した。
合成および実世界の両方のデータセットに関する数値実験により、BSSPアルゴリズムは未知のテストデータ間で安定した予測を行うためのベースライン法を著しく上回っていることが示された。
論文 参考訳(メタデータ) (2020-06-08T07:01:38Z) - Uncertainty Estimation Using a Single Deep Deterministic Neural Network [66.26231423824089]
本稿では,1回のフォワードパスで,テスト時に分布データポイントの発見と拒否が可能な決定論的ディープモデルを訓練する手法を提案する。
我々は,新しい損失関数とセントロイド更新方式を用いて,これらをスケールトレーニングし,ソフトマックスモデルの精度に適合させる。
論文 参考訳(メタデータ) (2020-03-04T12:27:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。