論文の概要: Unity Forests: Improving Interaction Modelling and Interpretability in Random Forests
- arxiv url: http://arxiv.org/abs/2601.07003v1
- Date: Sun, 11 Jan 2026 17:36:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-13 19:08:01.109765
- Title: Unity Forests: Improving Interaction Modelling and Interpretability in Random Forests
- Title(参考訳): 単葉林:ランダム林における相互作用モデルの改善と解釈可能性
- Authors: Roman Hornung, Alexander Hapfelmeier,
- Abstract要約: ランダム・フォレスト(RF)は、予測と変動重要度分析に広く利用されている。
UFOでは、各木の最初のいくつかの分割を共同で最適化する。
UFOは標準的なRFよりも高い識別精度と予測精度を達成した。
- 参考スコア(独自算出の注目度): 45.88028371034407
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Random forests (RFs) are widely used for prediction and variable importance analysis and are often believed to capture any types of interactions via recursive splitting. However, since the splits are chosen locally, interactions are only reliably captured when at least one involved covariate has a marginal effect. We introduce unity forests (UFOs), an RF variant designed to better exploit interactions involving covariates without marginal effects. In UFOs, the first few splits of each tree are optimized jointly across a random covariate subset to form a "tree root" capturing such interactions; the remainder is grown conventionally. We further propose the unity variable importance measure (VIM), which is based on out-of-bag split criterion values from the tree roots. Here, only a small fraction of tree root splits with the highest in-bag criterion values are considered per covariate, reflecting that covariates with purely interaction-based effects are discriminative only if a split in an interacting covariate occurred earlier in the tree. Finally, we introduce covariate-representative tree roots (CRTRs), which select representative tree roots per covariate and provide interpretable insight into the conditions - marginal or interactive - under which each covariate has its strongest effects. In a simulation study, the unity VIM reliably identified interacting covariates without marginal effects, unlike conventional RF-based VIMs. In a large-scale real-data comparison, UFOs achieved higher discrimination and predictive accuracy than standard RFs, with comparable calibration. The CRTRs reproduced the covariates' true effect types reliably in simulated data and provided interesting insights in a real data analysis.
- Abstract(参考訳): ランダム・フォレスト(RF)は、予測や変数の重要度分析に広く用いられ、再帰的な分割を通じてあらゆる種類の相互作用を捉えていると考えられている。
しかし、分割は局所的に選択されるため、少なくとも1つの共変体が限界効果を持つ場合、相互作用は確実に捕捉される。
我々は,コバリアイトを含む相互作用をより効果的に活用するためのRF変種であるユニティ・フォレスト(UFO)を導入した。
UFOでは、各木の最初の数個の分割はランダムな共変部分集合に共同で最適化され、そのような相互作用をキャプチャする「ツリールート」を形成し、残りは伝統的に成長する。
さらに,木根の分割基準値に基づく単位変数重要度尺度(VIM)を提案する。
ここでは、接尾辞の基準値が最も高い木根分裂のごく一部しかコヴァリテートごとに考慮されず、相互作用に基づく純粋に相互作用に基づく影響を持つ共変体が、木の中で相互作用する共変体における分裂が発生した場合にのみ識別可能であることを反映している。
最後に,covariate-representative tree roots (CRTRs)を導入し,各covariateに最も強い影響がある条件として,covariate/representative tree roots(CRTRs)を選択した。
シミュレーション研究において、単体VIMは従来のRFベースのVIMとは異なり、境界効果のない相互作用する共変体を確実に同定した。
大規模な実データ比較では、UFOは標準的なRFよりも高い識別精度と予測精度を達成し、キャリブレーションは同等であった。
CRTRは、共変量の影響型をシミュレーションデータで確実に再現し、実データ解析において興味深い洞察を与えた。
関連論文リスト
- Diversity Conscious Refined Random Forest [0.0]
ランダムフォレスト(Random Forest、RF)は、広く使われているアンサンブル学習技術である。
RFは何百本もの木と全ての入力機能に依存しており、高いコストとモデルの冗長性をもたらす。
本研究では,情報的特徴のみに木を生長させ,無関係な木を集成・維持することで最大多様性を発揮できる改良ランダムフォレストを提案する。
論文 参考訳(メタデータ) (2025-07-01T06:28:15Z) - Collaborative Value Function Estimation Under Model Mismatch: A Federated Temporal Difference Analysis [55.13545823385091]
フェデレーション強化学習(FedRL)は、エージェント間のデータ交換を防止し、データのプライバシを維持しながら協調学習を可能にする。
現実世界のアプリケーションでは、各エージェントは若干異なる遷移ダイナミクスを経験し、固有のモデルミスマッチを引き起こす。
情報共有の適度なレベルでさえ、環境固有のエラーを著しく軽減することを示す。
論文 参考訳(メタデータ) (2025-03-21T18:06:28Z) - Heterogeneous Random Forest [2.0646127669654835]
不均一ランダムフォレスト(HRF)は、木多様性を有意義な方法で向上させるように設計されている。
HRFは、ほとんどのデータセットの精度において、他のアンサンブル手法よりも一貫して優れていた。
論文 参考訳(メタデータ) (2024-10-24T09:18:55Z) - Multi forests: Variable importance for multi-class outcomes [49.1574468325115]
マルチフォレスト(MuFs)と呼ばれる新しいRF変種に基づく新しい変数重要度尺度(VIM)を導入する。
従来のRFと比較して, MuF の予測性能はわずかに低かった。
しかし、これはアルゴリズムの主要な目的であるマルチクラスVIMを計算することを考えると、制限要因ではない。
論文 参考訳(メタデータ) (2024-09-13T15:40:29Z) - Pure interaction effects unseen by Random Forests [0.3749861135832073]
ランダムフォレストは相互作用をうまく捉えていると広く主張されている。
いくつかの単純な例は、それらは特定の純粋な相互作用の存在下では不十分であることを示している。
木の成長過程で用いられる単純な代替パーティショニングスキームは、これらの相互作用の同定を強化することができると論じられている。
論文 参考訳(メタデータ) (2024-06-19T12:07:22Z) - Examining and Combating Spurious Features under Distribution Shift [94.31956965507085]
我々は、最小限の統計量という情報理論の概念を用いて、ロバストで刺激的な表現を定義し、分析する。
入力分布のバイアスしか持たない場合でも、モデルはトレーニングデータから急激な特徴を拾い上げることができることを証明しています。
分析から着想を得た結果,グループDROは,グループ同士の相関関係を直接考慮しない場合に失敗する可能性が示唆された。
論文 参考訳(メタデータ) (2021-06-14T05:39:09Z) - Forest R-CNN: Large-Vocabulary Long-Tailed Object Detection and Instance
Segmentation [75.93960390191262]
我々は、オブジェクトカテゴリ間の関係に関する事前知識を利用して、きめ細かいクラスを粗い親クラスにクラスタリングする。
そこで本研究では,NMS再サンプリング法を提案する。
提案手法はフォレストR-CNNと呼ばれ,ほとんどのオブジェクト認識モデルに適用可能なプラグイン・アンド・プレイモジュールとして機能する。
論文 参考訳(メタデータ) (2020-08-13T03:52:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。