論文の概要: Tree Ensemble Explainability through the Hoeffding Functional Decomposition and TreeHFD Algorithm
- arxiv url: http://arxiv.org/abs/2510.24815v1
- Date: Tue, 28 Oct 2025 09:49:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-30 15:50:44.594268
- Title: Tree Ensemble Explainability through the Hoeffding Functional Decomposition and TreeHFD Algorithm
- Title(参考訳): Hoeffding関数分解とTreeHFDアルゴリズムによるツリーアンサンブル説明可能性
- Authors: Clément Bénard,
- Abstract要約: データサンプルからツリーアンサンブルのHoeffding分解を推定するために、TreeHFDアルゴリズムを導入する。
TreeHFDの高性能化は、シミュレーションデータと実データの両方の実験を通して実証される。
- 参考スコア(独自算出の注目度): 2.242085086643166
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tree ensembles have demonstrated state-of-the-art predictive performance across a wide range of problems involving tabular data. Nevertheless, the black-box nature of tree ensembles is a strong limitation, especially for applications with critical decisions at stake. The Hoeffding or ANOVA functional decomposition is a powerful explainability method, as it breaks down black-box models into a unique sum of lower-dimensional functions, provided that input variables are independent. In standard learning settings, input variables are often dependent, and the Hoeffding decomposition is generalized through hierarchical orthogonality constraints. Such generalization leads to unique and sparse decompositions with well-defined main effects and interactions. However, the practical estimation of this decomposition from a data sample is still an open problem. Therefore, we introduce the TreeHFD algorithm to estimate the Hoeffding decomposition of a tree ensemble from a data sample. We show the convergence of TreeHFD, along with the main properties of orthogonality, sparsity, and causal variable selection. The high performance of TreeHFD is demonstrated through experiments on both simulated and real data, using our treehfd Python package (https://github.com/ThalesGroup/treehfd). Besides, we empirically show that the widely used TreeSHAP method, based on Shapley values, is strongly connected to the Hoeffding decomposition.
- Abstract(参考訳): 木アンサンブルは、表型データに関わる幅広い問題にまたがって最先端の予測性能を示す。
それでも、木アンサンブルのブラックボックスの性質は、特に重要な決定を下すアプリケーションにとって、強い制限である。
Hoeffding あるいは ANOVA 関数分解は、入力変数が独立であることから、ブラックボックスモデルを低次元関数のユニークな和に分解する強力な説明可能性法である。
標準的な学習環境では、入力変数はしばしば依存しており、Hoeffding分解は階層的直交制約によって一般化される。
このような一般化は、明確に定義された主効果と相互作用を持つ特異かつスパースな分解をもたらす。
しかし、データサンプルからこの分解を実際に見積もるのは、まだ未解決の問題である。
そこで本研究では,データサンプルからツリーアンサンブルのHoeffding分解を推定するために,TreeHFDアルゴリズムを提案する。
木HFDの収束と直交性、空間性、因果変数選択の主特性を示す。
TreeHFDのハイパフォーマンスは、シミュレーションと実データの両方の実験を通じて、treehfd Pythonパッケージ(https://github.com/ThalesGroup/treehfd)を使って実証されます。
さらに、Shapley値に基づいて広く使われているTreeSHAP法が、Hoeffding分解と強く結びついていることを実証的に示す。
関連論文リスト
- Hierarchical Quantized Diffusion Based Tree Generation Method for Hierarchical Representation and Lineage Analysis [49.00783841494125]
HDTreeは階層的潜在空間内の木関係を、統一的な階層的コードブックと量子化拡散プロセスを用いてキャプチャする。
HDTreeの有効性は、汎用データセットと単一セルデータセットの比較によって示される。
これらの貢献は階層的な系統解析のための新しいツールを提供し、より正確で効率的な細胞分化経路のモデリングを可能にする。
論文 参考訳(メタデータ) (2025-06-29T15:19:13Z) - Learning Decision Trees as Amortized Structure Inference [59.65621207449269]
本稿では,予測決定木アンサンブルを学習するためのハイブリッドアモータイズされた構造推論手法を提案する。
提案手法であるDT-GFNは,標準分類ベンチマークにおける最先端決定木やディープラーニング手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-03-10T07:05:07Z) - Explainable Clustering Beyond Worst-Case Guarantees [5.65604054654671]
Moshkovitz, Dasgupta, Rashtchian, Frost (ICML 2020) による説明可能なクラスタリング問題について検討した。
説明可能なクラスタリングの目標は、軸に沿った決定木に$K$のリーフと最小のクラスタリングコスト(すべてのリーフがクラスタである)を適合させることだ。
論文 参考訳(メタデータ) (2024-11-03T14:00:20Z) - A Unified Approach to Extract Interpretable Rules from Tree Ensembles via Integer Programming [2.1408617023874443]
ツリーアンサンブルは非常に人気のある機械学習モデルであり、教師付き分類と回帰タスクの有効性で知られている。
我々の研究は、訓練された木アンサンブルから最適化されたルールのリストを抽出することを目的としており、ユーザーは完全なモデルの予測力をほとんど保持する凝縮された解釈可能なモデルを提供する。
我々の広範な計算実験は,木アンサンブルに対する予測性能と忠実度の観点から,本手法が他のルール抽出法と競合することを示す統計的に有意な証拠を提供する。
論文 参考訳(メタデータ) (2024-06-30T22:33:47Z) - Policy Gradient with Tree Expansion [72.10002936187388]
政策勾配法は、大きなばらつきと高いサンプルの複雑さを持つことで有名である。
我々は、計画を採用するソフトマックスの一般化であるSoftTreeMaxを紹介します。
我々は、SoftTreeMaxが勾配のばらつきを3桁に減らすことを示す。
論文 参考訳(メタデータ) (2023-01-30T19:03:14Z) - Unifying local and global model explanations by functional decomposition
of low dimensional structures [0.0]
回帰関数や分類関数のグローバルな説明を主成分と相互作用成分の和に分解して考える。
ここで、qは分解に存在する相互作用の最高位を表す。
論文 参考訳(メタデータ) (2022-08-12T07:38:53Z) - Hierarchical Shrinkage: improving the accuracy and interpretability of
tree-based methods [10.289846887751079]
木構造を改変しないポストホックアルゴリズムである階層収縮(Hierarchical Shrinkage, HS)を導入する。
HSは、他の正規化技術と併用しても、決定木の予測性能を大幅に向上させる。
すべてのコードとモデルはGithubにある本格的なパッケージでリリースされている。
論文 参考訳(メタデータ) (2022-02-02T02:43:23Z) - Partial Counterfactual Identification from Observational and
Experimental Data [83.798237968683]
観測データと実験データの任意の組み合わせから最適境界を近似する有効なモンテカルロアルゴリズムを開発した。
我々のアルゴリズムは、合成および実世界のデータセットに基づいて広範囲に検証されている。
論文 参考訳(メタデータ) (2021-10-12T02:21:30Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Convex Polytope Trees [57.56078843831244]
コンベックスポリトープ木(CPT)は、決定境界の解釈可能な一般化によって決定木の系統を拡張するために提案される。
木構造が与えられたとき,木パラメータに対するCPTおよび拡張性のあるエンドツーエンドトレーニングアルゴリズムを効率的に構築する。
論文 参考訳(メタデータ) (2020-10-21T19:38:57Z) - FREEtree: A Tree-based Approach for High Dimensional Longitudinal Data
With Correlated Features [2.00191482700544]
FREEtreeは高次元長手データと相関する特徴を持つ木に基づく手法である。
重み付き相関ネットワーク分析を用いて、まずそれらをクラスタリングすることで、特徴のネットワーク構造を利用する。
次に、各機能のクラスタ内でスクリーニングステップを実行し、残る機能の中から選択ステップを実行します。
論文 参考訳(メタデータ) (2020-06-17T07:28:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。