論文の概要: xplainfi: Feature Importance and Statistical Inference for Machine Learning in R
- arxiv url: http://arxiv.org/abs/2603.15306v1
- Date: Mon, 16 Mar 2026 14:04:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-17 18:28:58.413416
- Title: xplainfi: Feature Importance and Statistical Inference for Machine Learning in R
- Title(参考訳): xplainfi: Rでの機械学習における特徴の重要性と統計的推論
- Authors: Lukas Burk, Fiona Katharina Ewald, Giuseppe Casalicchio, Marvin N. Wright, Bernd Bischl,
- Abstract要約: 我々はmlr3エコシステム上に構築されたRパッケージであるxplainfiを紹介した。
xplainfiは、複数のシミュレーション設定と学習者タイプにまたがる既存の実装と一致した重要なスコアを生成する。
- 参考スコア(独自算出の注目度): 12.35431733807122
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce xplainfi, an R package built on top of the mlr3 ecosystem for global, loss-based feature importance methods for machine learning models. Various feature importance methods exist in R, but significant gaps remain, particularly regarding conditional importance methods and associated statistical inference procedures. The package implements permutation feature importance, conditional feature importance, relative feature importance, leave-one-covariate-out, and generalizations thereof, and both marginal and conditional Shapley additive global importance methods. It provides a modular conditional sampling architecture based on Gaussian distributions, adversarial random forests, conditional inference trees, and knockoff-based samplers, which enable conditional importance analysis for continuous and mixed data. Statistical inference is available through multiple approaches, including variance-corrected confidence intervals and the conditional predictive impact framework. We demonstrate that xplainfi produces importance scores consistent with existing implementations across multiple simulation settings and learner types, while offering competitive runtime performance. The package is available on CRAN and provides researchers and practitioners with a comprehensive toolkit for feature importance analysis and model interpretation in R.
- Abstract(参考訳): 我々はmlr3エコシステム上に構築されたRパッケージであるxplainfiを紹介した。
Rには様々な特徴的重要度法が存在するが、特に条件的重要度法と関連する統計的推測法に関して重要なギャップが残っている。
本パッケージは、置換特徴重要度、条件付き特徴重要度、相対的特徴重要度、残余共変量アウト及びそれらの一般化を具備し、辺縁および条件付きシャプリー付加的グローバル重要度方法の両方を具備する。
ガウス分布、逆乱林、条件推論木、ノックオフに基づくサンプル解析に基づくモジュラー・コンディショナル・サンプリングアーキテクチャを提供し、連続データと混合データのコンディショナル・プライオリティ分析を可能にする。
統計的推論は、分散補正された信頼区間や条件付き予測影響フレームワークなど、複数のアプローチで利用可能である。
我々は、xplainfiが、複数のシミュレーション設定や学習者タイプにまたがる既存の実装と矛盾する重要なスコアを生成しながら、競合するランタイム性能を提供することを示した。
このパッケージはCRANで利用可能であり、研究者や実践者たちにRの機能重要度分析とモデル解釈のための包括的なツールキットを提供する。
関連論文リスト
- Provable Recovery of Locally Important Signed Features and Interactions from Random Forest [0.0]
パーソナライズドメディカルなどの多くの領域では、個々の予測に対する局所的な解釈が必要とされることが多い。
決定経路に沿った特徴の頻繁な共起を識別する,局所的,モデル特異的なFII手法を提案する。
提案手法は局所スパイクスパース(LSS)モデルの下で,真の局所信号特徴とその相互作用を常に回復することを示す。
論文 参考訳(メタデータ) (2025-12-11T19:53:15Z) - Interpretable Feature Interaction via Statistical Self-supervised Learning on Tabular Data [22.20955211690874]
Spofeは、統計的厳密さによる明確な解釈可能性を達成するために、原則化された表現をキャプチャする、新しい自己教師型機械学習パイプラインである。
このアプローチの基盤となるのは、正確なエラー境界と厳密な偽発見率(FDR)制御を提供する、堅牢な理論フレームワークです。
さまざまな実世界のデータセットの実験は、Spotfeの有効性を実証している。
論文 参考訳(メタデータ) (2025-03-23T12:27:42Z) - Meta-Statistical Learning: Supervised Learning of Statistical Inference [59.463430294611626]
この研究は、大きな言語モデル(LLM)の成功を駆動するツールと原則が、分散レベルのタスクに取り組むために再利用可能であることを実証している。
本稿では,統計的推論タスクを教師付き学習問題として再構成するマルチインスタンス学習に触発されたメタ統計学習を提案する。
論文 参考訳(メタデータ) (2025-02-17T18:04:39Z) - Conditional Feature Importance for Mixed Data [1.6114012813668934]
ノックオフサンプリングを用いた条件付き予測インパクト(CPI)フレームワークを開発した。
提案するワークフローは,I型エラーを制御し,高い出力を達成し,他の条件FI測定結果と一致していることを示す。
本研究は,混合データに対して,統計的に適切な,専門的な手法を開発することの必要性を強調した。
論文 参考訳(メタデータ) (2022-10-06T16:52:38Z) - BCDAG: An R package for Bayesian structure and Causal learning of
Gaussian DAGs [77.34726150561087]
観測データから因果関係の発見と因果関係を推定するためのRパッケージを提案する。
我々の実装は、観測回数とともに効率的にスケールし、DAGが十分にスパースであるたびに、データセット内の変数の数を削減します。
次に、実際のデータセットとシミュレーションデータセットの両方で、主な機能とアルゴリズムを説明します。
論文 参考訳(メタデータ) (2022-01-28T09:30:32Z) - Accuracy on the Line: On the Strong Correlation Between
Out-of-Distribution and In-Distribution Generalization [89.73665256847858]
分布外性能は,広範囲なモデルと分布シフトに対する分布内性能と強く相関していることを示す。
具体的には,CIFAR-10 と ImageNet の変種に対する分布内分布と分布外分布性能の強い相関関係を示す。
また,CIFAR-10-Cと組織分類データセットCamelyon17-WILDSの合成分布の変化など,相関が弱いケースについても検討した。
論文 参考訳(メタデータ) (2021-07-09T19:48:23Z) - Towards a More Reliable Interpretation of Machine Learning Outputs for
Safety-Critical Systems using Feature Importance Fusion [0.0]
我々は新しい融合距離を導入し、それを最先端技術と比較する。
我々のアプローチは、地上の真実が知られている合成データで検証される。
その結果、我々の機能重要度アンサンブルフレームワークは、既存の方法に比べて、機能重要度エラーが15%少ないことがわかった。
論文 参考訳(メタデータ) (2020-09-11T15:51:52Z) - Estimating Structural Target Functions using Machine Learning and
Influence Functions [103.47897241856603]
統計モデルから特定可能な関数として生じる対象関数の統計的機械学習のための新しい枠組みを提案する。
このフレームワークは問題とモデルに依存しないものであり、応用統計学における幅広い対象パラメータを推定するのに使用できる。
我々は、部分的に観測されていない情報を持つランダム/二重ロバストな問題において、いわゆる粗大化に特に焦点をあてた。
論文 参考訳(メタデータ) (2020-08-14T16:48:29Z) - Relative Feature Importance [1.4474137122906163]
相対的特徴重要度(RFI)は、置換特徴重要度(PFI)と条件的特徴重要度(CFI)の一般化である。
RFIは、PFI対CFI二分法を超えて、より微妙な特徴重要度計算を可能にする。
相対的特徴関連性の意味の詳細な理論的解析に基づいて、RFIの一般的な解釈規則を導出する。
論文 参考訳(メタデータ) (2020-07-16T12:20:22Z) - Learning to Learn Kernels with Variational Random Features [118.09565227041844]
メタラーニングフレームワークにランダムなフーリエ機能を持つカーネルを導入し、その強力な数ショット学習能力を活用する。
変分推論問題としてメタVRFの最適化を定式化する。
MetaVRFは、既存のメタ学習方法に比べて、はるかに優れた、少なくとも競争力のあるパフォーマンスを提供します。
論文 参考訳(メタデータ) (2020-06-11T18:05:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。