論文の概要: Provable Recovery of Locally Important Signed Features and Interactions from Random Forest
- arxiv url: http://arxiv.org/abs/2512.11081v1
- Date: Thu, 11 Dec 2025 19:53:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-15 15:48:11.552112
- Title: Provable Recovery of Locally Important Signed Features and Interactions from Random Forest
- Title(参考訳): ランダム林から重要な特徴と相互作用の確率的回復
- Authors: Kata Vuk, Nicolas Alexander Ihlo, Merle Behr,
- Abstract要約: パーソナライズドメディカルなどの多くの領域では、個々の予測に対する局所的な解釈が必要とされることが多い。
決定経路に沿った特徴の頻繁な共起を識別する,局所的,モデル特異的なFII手法を提案する。
提案手法は局所スパイクスパース(LSS)モデルの下で,真の局所信号特徴とその相互作用を常に回復することを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Feature and Interaction Importance (FII) methods are essential in supervised learning for assessing the relevance of input variables and their interactions in complex prediction models. In many domains, such as personalized medicine, local interpretations for individual predictions are often required, rather than global scores summarizing overall feature importance. Random Forests (RFs) are widely used in these settings, and existing interpretability methods typically exploit tree structures and split statistics to provide model-specific insights. However, theoretical understanding of local FII methods for RF remains limited, making it unclear how to interpret high importance scores for individual predictions. We propose a novel, local, model-specific FII method that identifies frequent co-occurrences of features along decision paths, combining global patterns with those observed on paths specific to a given test point. We prove that our method consistently recovers the true local signal features and their interactions under a Locally Spike Sparse (LSS) model and also identifies whether large or small feature values drive a prediction. We illustrate the usefulness of our method and theoretical results through simulation studies and a real-world data example.
- Abstract(参考訳): 複雑な予測モデルにおける入力変数とその相互作用の関連性を評価するために,FII法は教師あり学習において不可欠である。
パーソナライズドメディカルのような多くのドメインでは、全体的な特徴の重要性を要約するグローバルスコアよりも、個々の予測に対する局所的な解釈が必要であることが多い。
ランダムフォレスト(RF)はこれらの設定で広く使われており、既存の解釈可能性手法は通常、木の構造と分割統計を利用してモデル固有の洞察を提供する。
しかし、RFの局所的なFII法の理論的理解は限定的であり、個々の予測に対して高い重要性のスコアをどう解釈するかは不明である。
そこで本研究では,決定経路に沿った特徴の頻繁な共起を同定する,局所的なFII手法を提案する。
提案手法は, 局所スパイクスパース(LSS)モデルの下で, 真の局所信号特徴とその相互作用を常に回復し, かつ, 大小の特徴値が予測を駆動するかどうかを同定する。
本稿では,シミュレーション研究と実世界のデータ例を通して,本手法の有用性と理論的結果について述べる。
関連論文リスト
- Interpretable Network-assisted Random Forest+ [2.776181981917578]
我々はランダム森林(RF+)の一般化に基づくフレキシブルネットワーク支援モデル群を開発する。
我々は,グローバルおよびローカルな重要度と,所定の観測の影響を評価するためのサンプル影響度の両方を提供する。
このツールスイートは、高インパクト問題に対するネットワーク支援機械学習のスコープと適用性を広げる。
論文 参考訳(メタデータ) (2025-09-19T05:22:06Z) - Testing Generalizability in Causal Inference [3.547529079746247]
機械学習アルゴリズムの一般化性を統計的に評価するための公式な手続きは存在しない。
本研究では,高次元因果推論モデルの一般化可能性を統計的に評価するための体系的枠組みを提案する。
論文 参考訳(メタデータ) (2024-11-05T11:44:00Z) - Adaptive Global-Local Representation Learning and Selection for
Cross-Domain Facial Expression Recognition [54.334773598942775]
ドメインシフトは、クロスドメイン顔表情認識(CD-FER)において重要な課題となる
適応的グローバルローカル表現学習・選択フレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-20T02:21:41Z) - Think Twice Before Selection: Federated Evidential Active Learning for Medical Image Analysis with Domain Shifts [11.562953837452126]
多様なドメインから得られたローカルデータの情報性を評価するための最初の試みを行う。
本稿では,ドメインシフト下でのデータ評価を校正する新しい手法であるFederated Evidential Active Learning(FEAL)を提案する。
論文 参考訳(メタデータ) (2023-12-05T08:32:27Z) - Numerically assisted determination of local models in network scenarios [55.2480439325792]
統計的振る舞いを再現する明示的な局所モデルを見つけるための数値ツールを開発する。
グリーンベルガー・ホルン・ザイリンガー(GHZ)およびW分布の臨界振動性に関する予想を提供する。
開発されたコードとドキュメントは、281.com/mariofilho/localmodelsで公開されている。
論文 参考訳(メタデータ) (2023-03-17T13:24:04Z) - Monitoring Shortcut Learning using Mutual Information [16.17600110257266]
ショートカット学習は、素早い相関を含まない実世界のデータに基づいて評価される。
実験により、MIはメートル法ネットワークのショートカットネットワークとして使用できることが示された。
論文 参考訳(メタデータ) (2022-06-27T03:55:23Z) - DRFLM: Distributionally Robust Federated Learning with Inter-client
Noise via Local Mixup [58.894901088797376]
連合学習は、生データをリークすることなく、複数の組織のデータを使用してグローバルモデルをトレーニングするための有望なアプローチとして登場した。
上記の2つの課題を同時に解決するための一般的な枠組みを提案する。
我々は、ロバストネス解析、収束解析、一般化能力を含む包括的理論的解析を提供する。
論文 参考訳(メタデータ) (2022-04-16T08:08:29Z) - Federated and Generalized Person Re-identification through Domain and
Feature Hallucinating [88.77196261300699]
人物再識別(re-ID)におけるフェデレーションドメイン一般化(FedDG)の問題について検討する。
一般化された局所的・グローバルなモデルを学ぶための多様な特徴を創出する手法として,DFH (Domain and Feature Hallucinating) を提案する。
提案手法は4つの大規模re-IDベンチマークにおいてFedDGの最先端性能を実現する。
論文 参考訳(メタデータ) (2022-03-05T09:15:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。