論文の概要: Decision-Path Patterns as Tree Reliability Signals: Path-based Adaptive Weighting for Random Forest Classification
- arxiv url: http://arxiv.org/abs/2605.20716v4
- Date: Wed, 27 May 2026 14:18:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:54.789463
- Title: Decision-Path Patterns as Tree Reliability Signals: Path-based Adaptive Weighting for Random Forest Classification
- Title(参考訳): 樹木信頼性信号としての決定パスパターン:ランダム森林分類のための経路ベース適応重み付け
- Authors: Youngjoon Park,
- Abstract要約: ランダムフォレストは、特徴空間の異なるランダム化された表現で各木を構築する。
彼らの一様投票は、誤った表現を持つ木が正しいものより多い地域では誤りを訂正できない。
本稿では,各木の決定経路の構造パターンをサンプルごとの信頼性信号として用いることを提案する。
- 参考スコア(独自算出の注目度): 0.9607593117607193
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Random forests construct each tree with a different, randomised representation of the feature space. Their uniform voting cannot correct errors in regions where trees with incorrect representations probabilistically outnumber correct ones, even when the ensemble collectively holds enough correct information -- a reducible error that this paper addresses. We propose using the structural pattern of each tree's decision path as a per-sample reliability signal to identify and differentially weight the more reliable trees. At inference, a random forest reaches its prediction through the root-to-leaf path the sample traverses in each tree, so path-level reliability offers a finer granularity than tree-level weighting can access. We show that this reliability varies meaningfully across path patterns in the boundary region identified by the forest itself, and that using this signal yields a statistically significant accuracy improvement over RF on 36 binary classification benchmarks (Wilcoxon p < 0.0001). We further devise a way to quantify the reducible error accessible to the method from the fitted RF alone; this estimate correlates strongly with per-dataset gain (Pearson r = +0.840, p < 0.0001), and on the qualifying group it identifies, the method delivers a mean +0.99 pp accuracy improvement with strict wins on every dataset (7/0/0). Class-recall regression -- the typical failure mode of RF correction methods -- is measured: zero minority-recall regressions and a single majority-recall regression at the 0.2 pp threshold, indicating that the correction operates in the direction of bias reduction rather than class trade-off. Our work suggests that the structural information of decision paths, previously overlooked in random forest research, can contribute to RF performance improvement.
- Abstract(参考訳): ランダムフォレストは、特徴空間の異なるランダム化された表現で各木を構築する。
アンサンブルが十分な正確な情報を持っている場合でも、不正確な表現を持つ木が確率的に正しいものより多い地域では、均一な投票で誤りを訂正することはできない。
本研究では,各木の決定経路の構造パターンをサンプルごとの信頼性信号として用いて,より信頼性の高い木を識別・重み付けする。
推定において、ランダムな森林は、各木の根から葉までの経路を通してその予測に達するので、経路レベルの信頼性は、木レベルでの重み付けがアクセス可能なものよりも細かい粒度を提供する。
この信頼性は、森林自体が特定した境界領域の経路パターンによって有意に変化し、この信号を用いることで、36のバイナリ分類ベンチマーク(Wilcoxon p < 0.0001)上でのRFよりも統計的に有意な精度向上が得られることを示す。
さらに、この推定法は、各データセットの利得(ピアソン r = +0.840, p < 0.0001)と強く相関し、評価群上では、各データセット(7/0/0)に厳密な勝利を伴って平均+0.99ppの精度向上をもたらす。
RF補正手法の典型的な障害モードであるクラスリコール回帰は、0.2ppの閾値でゼロの少数リコール回帰と1つの多数リコール回帰を計測し、その補正がクラストレードオフよりもバイアス低減の方向に動作していることを示す。
本研究は、以前森林調査で見落とされた決定経路の構造情報が、RF性能向上に寄与することを示唆している。
関連論文リスト
- Decision Tree Embedding by Leaf-Means [11.318593165494724]
決定木埋め込み(Decision Tree Embedding, DTE)は、訓練された分類木の葉の分割を利用して解釈可能な特徴表現を構築する、迅速かつ効果的な方法である。
各葉領域内のサンプル手段をアンカーポイントとして使用することにより、DTEは木の分割構造によって定義された埋め込み空間に入力をマップする。
軽度条件下での条件密度の保存を含む,DTEの個体群レベルの理論的特性を確立した。
論文 参考訳(メタデータ) (2025-12-01T15:57:33Z) - TreePO: Bridging the Gap of Policy Optimization and Efficacy and Inference Efficiency with Heuristic Tree-based Modeling [65.46347858249295]
TreePOは自己誘導型ロールアウトアルゴリズムで、シーケンス生成を木構造検索プロセスとして見る。
TreePOは基本的に、探索の多様性を保存または強化しながら、更新毎の計算負担を削減します。
論文 参考訳(メタデータ) (2025-08-24T16:52:37Z) - Diversity Conscious Refined Random Forest [0.0]
ランダムフォレスト(Random Forest、RF)は、広く使われているアンサンブル学習技術である。
RFは何百本もの木と全ての入力機能に依存しており、高いコストとモデルの冗長性をもたらす。
本研究では,情報的特徴のみに木を生長させ,無関係な木を集成・維持することで最大多様性を発揮できる改良ランダムフォレストを提案する。
論文 参考訳(メタデータ) (2025-07-01T06:28:15Z) - A Powerful Random Forest Featuring Linear Extensions (RaFFLE) [1.2233362977312945]
RaFFLEは、ランダムな森林アンサンブル内でPILOTツリーをベースラーナーとして統合する新しいフレームワークである。
PILOT木は、従来の決定木の計算効率と線形モデル木の柔軟性を組み合わせたものである。
RaFFLEは様々な回帰問題に対処するための汎用ツールであることが証明されている。
論文 参考訳(メタデータ) (2025-02-14T14:22:51Z) - Learning Deep Tree-based Retriever for Efficient Recommendation: Theory and Method [76.31185707649227]
効率的なレコメンデーションのために,Deep Tree-based Retriever (DTR)を提案する。
DTRは、トレーニングタスクを、同じレベルでツリーノード上のソフトマックスベースのマルチクラス分類としてフレーム化している。
非リーフノードのラベル付けによって引き起こされる準最適性を緩和するため、損失関数の補正法を提案する。
論文 参考訳(メタデータ) (2024-08-21T05:09:53Z) - Learning a Decision Tree Algorithm with Transformers [75.96920867382859]
メタ学習によってトレーニングされたトランスフォーマーベースのモデルであるMetaTreeを導入し、強力な決定木を直接生成する。
我々は、多くのデータセットに欲求決定木とグローバルに最適化された決定木の両方を適合させ、MetaTreeを訓練して、強力な一般化性能を実現する木のみを生成する。
論文 参考訳(メタデータ) (2024-02-06T07:40:53Z) - Optimal randomized classification trees [0.0]
分類と回帰木(英: Classification and Regression Trees、CART)は、現代の統計学と機械学習における既成の技術である。
CARTはgreedyプロシージャによって構築され、分割予測変数と関連するしきい値を逐次決定する。
この強欲なアプローチは、木を非常に高速に木に分類するが、その性質上、それらの分類精度は他の最先端の手順と競合しないかもしれない。
論文 参考訳(メタデータ) (2021-10-19T11:41:12Z) - Growing Deep Forests Efficiently with Soft Routing and Learned
Connectivity [79.83903179393164]
この論文は、いくつかの重要な側面で深い森林のアイデアをさらに拡張します。
我々は、ノードがハードバイナリ決定ではなく、確率的ルーティング決定、すなわちソフトルーティングを行う確率的ツリーを採用する。
MNISTデータセットの実験は、私たちの力のある深部森林が[1]、[3]よりも優れたまたは匹敵するパフォーマンスを達成できることを示しています。
論文 参考訳(メタデータ) (2020-12-29T18:05:05Z) - An Efficient Adversarial Attack for Tree Ensembles [91.05779257472675]
傾斜促進決定木(DT)や無作為林(RF)などの木に基づくアンサンブルに対する敵対的攻撃
提案手法は,従来のMILP (Mixed-integer linear programming) よりも数千倍高速であることを示す。
私たちのコードはhttps://chong-z/tree-ensemble- attackで利用可能です。
論文 参考訳(メタデータ) (2020-10-22T10:59:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。