論文の概要: Comparing Model-agnostic Feature Selection Methods through Relative Efficiency
- arxiv url: http://arxiv.org/abs/2508.14268v1
- Date: Tue, 19 Aug 2025 20:55:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-21 16:52:41.270265
- Title: Comparing Model-agnostic Feature Selection Methods through Relative Efficiency
- Title(参考訳): 相対効率によるモデルに依存しない特徴選択法の比較
- Authors: Chenghui Zheng, Garvesh Raskutti,
- Abstract要約: 本稿では,線形モデル,非線形加法モデル,単層ニューラルネットワークを模倣する単一インデックスモデルという3つのモデル設定の下で理論的比較を行う。
実験結果と合わせて, GCM関連手法が適切な規則性条件下でのLOCOよりも優れていたことが示唆された。
我々のシミュレーションと実データ分析には、ニューラルネットワークや勾配木などの機械学習手法が広く使われている。
- 参考スコア(独自算出の注目度): 8.870380386952993
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Feature selection and importance estimation in a model-agnostic setting is an ongoing challenge of significant interest. Wrapper methods are commonly used because they are typically model-agnostic, even though they are computationally intensive. In this paper, we focus on feature selection methods related to the Generalized Covariance Measure (GCM) and Leave-One-Covariate-Out (LOCO) estimation, and provide a comparison based on relative efficiency. In particular, we present a theoretical comparison under three model settings: linear models, non-linear additive models, and single index models that mimic a single-layer neural network. We complement this with extensive simulations and real data examples. Our theoretical results, along with empirical findings, demonstrate that GCM-related methods generally outperform LOCO under suitable regularity conditions. Furthermore, we quantify the asymptotic relative efficiency of these approaches. Our simulations and real data analysis include widely used machine learning methods such as neural networks and gradient boosting trees.
- Abstract(参考訳): モデルに依存しない設定における特徴の選択と重要性の推定は、重要な関心事の継続的な課題である。
ワッパー法は通常、計算集約型であるにもかかわらず、モデルに依存しないため、一般的に用いられる。
本稿では,GCM(Generalized Covariance Measure)およびLOCO(Leave-One-Covariate-Out)推定に関連する特徴選択手法に着目し,相対効率に基づく比較を行った。
特に、線形モデル、非線形加法モデル、単層ニューラルネットワークを模倣する単層インデックスモデルという3つのモデル設定に基づく理論的比較を示す。
我々はこれを広範なシミュレーションと実データ例で補完する。
実験結果と合わせて, GCM関連手法が適切な規則性条件下でのLOCOよりも優れていたことが示唆された。
さらに,これらの手法の漸近的相対効率を定量化する。
我々のシミュレーションと実データ分析には、ニューラルネットワークや勾配木などの機械学習手法が広く使われている。
関連論文リスト
- Covariate-dependent Graphical Model Estimation via Neural Networks with Statistical Guarantees [18.106204331704156]
グラフ構造が共依存する設定を検討し、それを推定するためのディープニューラルネットワークベースのアプローチを検討する。
経験的リスク最小化フレームワークで一般的に用いられる仮定の下で,PAC保証による理論的結果が確立される。
提案手法の性能をいくつかの合成データ設定で評価し,既存手法と比較した。
論文 参考訳(メタデータ) (2025-04-23T02:13:36Z) - Statistical Inference for Generative Model Comparison [6.653749938600871]
本稿では,2つの生成モデルと統計的信頼度を比較する手法を提案する。
理論的には、我々の推定器はパラメトリック収束率を達成し、正規性を認め、有効な推論を可能にする。
論文 参考訳(メタデータ) (2025-01-31T05:31:05Z) - Predictive Analytics of Varieties of Potatoes [2.336821989135698]
本研究では, 育種試験におけるサツマイモクローンの選択プロセスの向上を目的とした, 機械学習アルゴリズムの適用について検討する。
本研究は, 高収率, 耐病性, 耐気候性ポテト品種を効率的に同定することの課題に対処する。
論文 参考訳(メタデータ) (2024-04-04T00:49:05Z) - Online Variational Sequential Monte Carlo [49.97673761305336]
我々は,計算効率が高く正確なモデルパラメータ推定とベイジアン潜在状態推定を提供する変分連続モンテカルロ法(VSMC)を構築した。
オンラインVSMCは、パラメータ推定と粒子提案適応の両方を効率よく、完全にオンザフライで実行することができる。
論文 参考訳(メタデータ) (2023-12-19T21:45:38Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - MACE: An Efficient Model-Agnostic Framework for Counterfactual
Explanation [132.77005365032468]
MACE(Model-Agnostic Counterfactual Explanation)の新たな枠組みを提案する。
MACE法では, 優れた反実例を見つけるための新しいRL法と, 近接性向上のための勾配のない降下法を提案する。
公開データセットの実験は、有効性、空間性、近接性を向上して検証する。
論文 参考訳(メタデータ) (2022-05-31T04:57:06Z) - Nonparametric Functional Analysis of Generalized Linear Models Under
Nonlinear Constraints [0.0]
本稿では、一般化線形モデルのための新しい非パラメトリック方法論を紹介する。
これは二項回帰の強さとカテゴリーデータに対する潜在変数の定式化の強さを組み合わせたものである。
これは最近公開された方法論のパラメトリックバージョンを拡張し、一般化する。
論文 参考訳(メタデータ) (2021-10-11T04:49:59Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - Amortized Bayesian model comparison with evidential deep learning [0.12314765641075436]
本稿では,専門的なディープラーニングアーキテクチャを用いたベイズモデルの比較手法を提案する。
提案手法は純粋にシミュレーションベースであり,観測された各データセットに対して,すべての代替モデルを明示的に適合させるステップを回避している。
提案手法は,本研究で検討した事例に対して,精度,キャリブレーション,効率の点で優れた結果が得られることを示す。
論文 参考訳(メタデータ) (2020-04-22T15:15:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。