論文の概要: Decision-Path Patterns as Tree Reliability Signals: Path-based Adaptive Weighting for Random Forest Classification
- arxiv url: http://arxiv.org/abs/2605.20716v1
- Date: Wed, 20 May 2026 05:15:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.485527
- Title: Decision-Path Patterns as Tree Reliability Signals: Path-based Adaptive Weighting for Random Forest Classification
- Title(参考訳): 樹木信頼性信号としての決定パスパターン:ランダム森林分類のための経路ベース適応重み付け
- Authors: Youngjoon Park,
- Abstract要約: ランダム・フォレストは単純な多数派で木々の票を集めている。
本研究では,各木の根to-leaf決定経路に沿ったトポロジカルパターンが木信頼性のシグナルを伝達していることを観察する。
本稿では,構成によって期待されるクラスバイアスをゼロにするクラス条件比重み付けを提案する。
- 参考スコア(独自算出の注目度): 0.9607593117607193
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Random forests aggregate tree votes by simple majority, treating all trees as equally informative. We observe that the topological pattern along each tree's root-to-leaf decision path -- where and how often the dominant class label flips along it -- carries a signal of tree reliability that is exploitable for per-sample reweighting. The naive use of this signal is structurally confounded with the predicted class, so we propose a class-conditional ratio weighting that guarantees zero expected class bias by construction. On 30 binary classification benchmarks under a shared-forest, shared-split protocol with 30 repeats, the proposed method is the only one among four compared schemes -- RF, weighted RF, KNORA-Eliminate, KNORA-Union -- to yield a statistically significant accuracy improvement over RF (Wilcoxon p = 0.018), while the three alternatives all fail to do so (p > 0.5). It is also the only scheme without majority-recall regressions, with minority-recall regressions limited to 3/30 datasets -- a one-sided loss to which classical dynamic ensemble selection methods are susceptible. The gain is robust across forest sizes from 100 to 1000 trees.
- Abstract(参考訳): ランダム・フォレストは単純な多数派で木を採決し、全ての木を等しく情報的扱いする。
我々は,各木の根から葉までの決定経路に沿ったトポロジ的パターン – 支配的なクラスラベルがどの程度の頻度で回転するか – が,サンプルごとの再重み付けに活用可能なツリー信頼性の信号を持っていることを観察する。
この信号の単純利用は予測されたクラスと構造的に整合しているので、構成によって期待されるクラスバイアスをゼロにするクラス条件比重み付けを提案する。
提案手法は, RF, 重み付きRF, KNORA-Eliminate, KNORA-Unionの4つの比較スキームのうち, RFよりも統計的に有意な精度向上(Wilcoxon p = 0.018)を達成できるのに対し, 3つの代替案はいずれも失敗する(p > 0.5)。
マイノリティリコールレグレッションは3/30データセットに限定されており、古典的な動的アンサンブル選択メソッドが影響を受けやすい一方的な損失である。
樹高は100本から1000本までの森林で安定している。
関連論文リスト
- Decision Tree Embedding by Leaf-Means [11.318593165494724]
決定木埋め込み(Decision Tree Embedding, DTE)は、訓練された分類木の葉の分割を利用して解釈可能な特徴表現を構築する、迅速かつ効果的な方法である。
各葉領域内のサンプル手段をアンカーポイントとして使用することにより、DTEは木の分割構造によって定義された埋め込み空間に入力をマップする。
軽度条件下での条件密度の保存を含む,DTEの個体群レベルの理論的特性を確立した。
論文 参考訳(メタデータ) (2025-12-01T15:57:33Z) - TreePO: Bridging the Gap of Policy Optimization and Efficacy and Inference Efficiency with Heuristic Tree-based Modeling [65.46347858249295]
TreePOは自己誘導型ロールアウトアルゴリズムで、シーケンス生成を木構造検索プロセスとして見る。
TreePOは基本的に、探索の多様性を保存または強化しながら、更新毎の計算負担を削減します。
論文 参考訳(メタデータ) (2025-08-24T16:52:37Z) - Diversity Conscious Refined Random Forest [0.0]
ランダムフォレスト(Random Forest、RF)は、広く使われているアンサンブル学習技術である。
RFは何百本もの木と全ての入力機能に依存しており、高いコストとモデルの冗長性をもたらす。
本研究では,情報的特徴のみに木を生長させ,無関係な木を集成・維持することで最大多様性を発揮できる改良ランダムフォレストを提案する。
論文 参考訳(メタデータ) (2025-07-01T06:28:15Z) - A Powerful Random Forest Featuring Linear Extensions (RaFFLE) [1.2233362977312945]
RaFFLEは、ランダムな森林アンサンブル内でPILOTツリーをベースラーナーとして統合する新しいフレームワークである。
PILOT木は、従来の決定木の計算効率と線形モデル木の柔軟性を組み合わせたものである。
RaFFLEは様々な回帰問題に対処するための汎用ツールであることが証明されている。
論文 参考訳(メタデータ) (2025-02-14T14:22:51Z) - Learning Deep Tree-based Retriever for Efficient Recommendation: Theory and Method [76.31185707649227]
効率的なレコメンデーションのために,Deep Tree-based Retriever (DTR)を提案する。
DTRは、トレーニングタスクを、同じレベルでツリーノード上のソフトマックスベースのマルチクラス分類としてフレーム化している。
非リーフノードのラベル付けによって引き起こされる準最適性を緩和するため、損失関数の補正法を提案する。
論文 参考訳(メタデータ) (2024-08-21T05:09:53Z) - Learning a Decision Tree Algorithm with Transformers [75.96920867382859]
メタ学習によってトレーニングされたトランスフォーマーベースのモデルであるMetaTreeを導入し、強力な決定木を直接生成する。
我々は、多くのデータセットに欲求決定木とグローバルに最適化された決定木の両方を適合させ、MetaTreeを訓練して、強力な一般化性能を実現する木のみを生成する。
論文 参考訳(メタデータ) (2024-02-06T07:40:53Z) - Optimal randomized classification trees [0.0]
分類と回帰木(英: Classification and Regression Trees、CART)は、現代の統計学と機械学習における既成の技術である。
CARTはgreedyプロシージャによって構築され、分割予測変数と関連するしきい値を逐次決定する。
この強欲なアプローチは、木を非常に高速に木に分類するが、その性質上、それらの分類精度は他の最先端の手順と競合しないかもしれない。
論文 参考訳(メタデータ) (2021-10-19T11:41:12Z) - Growing Deep Forests Efficiently with Soft Routing and Learned
Connectivity [79.83903179393164]
この論文は、いくつかの重要な側面で深い森林のアイデアをさらに拡張します。
我々は、ノードがハードバイナリ決定ではなく、確率的ルーティング決定、すなわちソフトルーティングを行う確率的ツリーを採用する。
MNISTデータセットの実験は、私たちの力のある深部森林が[1]、[3]よりも優れたまたは匹敵するパフォーマンスを達成できることを示しています。
論文 参考訳(メタデータ) (2020-12-29T18:05:05Z) - An Efficient Adversarial Attack for Tree Ensembles [91.05779257472675]
傾斜促進決定木(DT)や無作為林(RF)などの木に基づくアンサンブルに対する敵対的攻撃
提案手法は,従来のMILP (Mixed-integer linear programming) よりも数千倍高速であることを示す。
私たちのコードはhttps://chong-z/tree-ensemble- attackで利用可能です。
論文 参考訳(メタデータ) (2020-10-22T10:59:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。