論文の概要: Decision-Path Patterns as Tree Reliability Signals: Path-based Adaptive Weighting for Random Forest Classification
- arxiv url: http://arxiv.org/abs/2605.20716v3
- Date: Mon, 25 May 2026 15:35:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 16:32:37.850482
- Title: Decision-Path Patterns as Tree Reliability Signals: Path-based Adaptive Weighting for Random Forest Classification
- Title(参考訳): 樹木信頼性信号としての決定パスパターン:ランダム森林分類のための経路ベース適応重み付け
- Authors: Youngjoon Park,
- Abstract要約: ランダムな森林は、各木の根から葉までの経路を通じて予測に達する。
本研究では,森林そのものが特定した境界領域の経路パターンによって信頼性が有意に変化することを示す。
本研究は、以前森林調査で見落とされた決定経路の構造情報が、RF性能向上に寄与することを示唆している。
- 参考スコア(独自算出の注目度): 0.9607593117607193
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The global uniform aggregation of random forests leaves conditional bias along the decision boundary uncorrected. To correct this locally, we propose exploiting the structural pattern of each tree's decision path. At inference, a random forest reaches its prediction through the root-to-leaf path the sample traverses in each tree, so path-level reliability offers a finer granularity than tree-level weighting can access. We show that reliability varies meaningfully across path patterns in the boundary region identified by the forest itself, and that using this signal yields a statistically significant accuracy improvement over RF on 36 binary classification benchmarks (Wilcoxon p < 0.0001). We further devise a way to measure the sufficiency of residual information in the fitted RF's decision boundary, providing an estimate of the expected gain before the method is applied; on the qualifying group identified this way, the method delivers a mean +0.99 pp accuracy improvement with strict wins on every dataset (7/0/0). Class-recall regression -- the typical failure mode of RF correction methods -- is measured: zero minority-recall regressions and a single majority-recall regression at the 0.2 pp threshold, indicating that the correction operates in the direction of bias reduction rather than class trade-off. Our work suggests that the structural information of decision paths, previously overlooked in random forest research, can contribute to RF performance improvement.
- Abstract(参考訳): ランダムな森林のグローバルな均一な集積は、決定境界に沿った条件バイアスを未修正のまま残している。
これを局所的に補正するために,各木の決定経路の構造パターンを利用する手法を提案する。
推定において、ランダムな森林は、各木の根から葉までの経路を通してその予測に達するので、経路レベルの信頼性は、木レベルでの重み付けがアクセス可能なものよりもきめ細かな粒度を提供する。
この信号を用いて,36のバイナリ分類ベンチマーク(Wilcoxon p < 0.0001)において,RFに対する統計的に有意な精度向上が得られた。
さらに, 本手法が適用される前に期待される利得を推定し, 各データセット(7/0/0)に対して平均+0.99ppの精度向上を達成できることを示す。
RF補正手法の典型的な障害モードであるクラスリコール回帰は、0.2ppの閾値でゼロの少数リコール回帰と1つの多数リコール回帰を計測し、その補正がクラストレードオフよりもバイアス低減の方向に動作していることを示す。
本研究は、以前森林調査で見落とされた決定経路の構造情報が、RF性能向上に寄与することを示唆している。
関連論文リスト
- Decision Tree Embedding by Leaf-Means [11.318593165494724]
決定木埋め込み(Decision Tree Embedding, DTE)は、訓練された分類木の葉の分割を利用して解釈可能な特徴表現を構築する、迅速かつ効果的な方法である。
各葉領域内のサンプル手段をアンカーポイントとして使用することにより、DTEは木の分割構造によって定義された埋め込み空間に入力をマップする。
軽度条件下での条件密度の保存を含む,DTEの個体群レベルの理論的特性を確立した。
論文 参考訳(メタデータ) (2025-12-01T15:57:33Z) - TreePO: Bridging the Gap of Policy Optimization and Efficacy and Inference Efficiency with Heuristic Tree-based Modeling [65.46347858249295]
TreePOは自己誘導型ロールアウトアルゴリズムで、シーケンス生成を木構造検索プロセスとして見る。
TreePOは基本的に、探索の多様性を保存または強化しながら、更新毎の計算負担を削減します。
論文 参考訳(メタデータ) (2025-08-24T16:52:37Z) - Diversity Conscious Refined Random Forest [0.0]
ランダムフォレスト(Random Forest、RF)は、広く使われているアンサンブル学習技術である。
RFは何百本もの木と全ての入力機能に依存しており、高いコストとモデルの冗長性をもたらす。
本研究では,情報的特徴のみに木を生長させ,無関係な木を集成・維持することで最大多様性を発揮できる改良ランダムフォレストを提案する。
論文 参考訳(メタデータ) (2025-07-01T06:28:15Z) - A Powerful Random Forest Featuring Linear Extensions (RaFFLE) [1.2233362977312945]
RaFFLEは、ランダムな森林アンサンブル内でPILOTツリーをベースラーナーとして統合する新しいフレームワークである。
PILOT木は、従来の決定木の計算効率と線形モデル木の柔軟性を組み合わせたものである。
RaFFLEは様々な回帰問題に対処するための汎用ツールであることが証明されている。
論文 参考訳(メタデータ) (2025-02-14T14:22:51Z) - Learning Deep Tree-based Retriever for Efficient Recommendation: Theory and Method [76.31185707649227]
効率的なレコメンデーションのために,Deep Tree-based Retriever (DTR)を提案する。
DTRは、トレーニングタスクを、同じレベルでツリーノード上のソフトマックスベースのマルチクラス分類としてフレーム化している。
非リーフノードのラベル付けによって引き起こされる準最適性を緩和するため、損失関数の補正法を提案する。
論文 参考訳(メタデータ) (2024-08-21T05:09:53Z) - Learning a Decision Tree Algorithm with Transformers [75.96920867382859]
メタ学習によってトレーニングされたトランスフォーマーベースのモデルであるMetaTreeを導入し、強力な決定木を直接生成する。
我々は、多くのデータセットに欲求決定木とグローバルに最適化された決定木の両方を適合させ、MetaTreeを訓練して、強力な一般化性能を実現する木のみを生成する。
論文 参考訳(メタデータ) (2024-02-06T07:40:53Z) - Optimal randomized classification trees [0.0]
分類と回帰木(英: Classification and Regression Trees、CART)は、現代の統計学と機械学習における既成の技術である。
CARTはgreedyプロシージャによって構築され、分割予測変数と関連するしきい値を逐次決定する。
この強欲なアプローチは、木を非常に高速に木に分類するが、その性質上、それらの分類精度は他の最先端の手順と競合しないかもしれない。
論文 参考訳(メタデータ) (2021-10-19T11:41:12Z) - Growing Deep Forests Efficiently with Soft Routing and Learned
Connectivity [79.83903179393164]
この論文は、いくつかの重要な側面で深い森林のアイデアをさらに拡張します。
我々は、ノードがハードバイナリ決定ではなく、確率的ルーティング決定、すなわちソフトルーティングを行う確率的ツリーを採用する。
MNISTデータセットの実験は、私たちの力のある深部森林が[1]、[3]よりも優れたまたは匹敵するパフォーマンスを達成できることを示しています。
論文 参考訳(メタデータ) (2020-12-29T18:05:05Z) - An Efficient Adversarial Attack for Tree Ensembles [91.05779257472675]
傾斜促進決定木(DT)や無作為林(RF)などの木に基づくアンサンブルに対する敵対的攻撃
提案手法は,従来のMILP (Mixed-integer linear programming) よりも数千倍高速であることを示す。
私たちのコードはhttps://chong-z/tree-ensemble- attackで利用可能です。
論文 参考訳(メタデータ) (2020-10-22T10:59:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。