論文の概要: Variable Selection Using Relative Importance Rankings
- arxiv url: http://arxiv.org/abs/2509.10853v1
- Date: Sat, 13 Sep 2025 15:21:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-16 17:26:22.818085
- Title: Variable Selection Using Relative Importance Rankings
- Title(参考訳): 相対的重要度ランキングを用いた変数選択
- Authors: Tien-En Chang, Argon Chen,
- Abstract要約: 本稿では,モデル作成前における可変ランク付けとフィルタに基づく選択の可能性について検討する。
具体的には、予測器の直接効果と組み合わせ効果の両方が組み込まれているため、RI測度から強い性能を期待する。
これらのランキングに基づいて構築された予測モデルは競争力が高く、しばしばラッソや緩やかなラッソのような最先端の手法よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Although conceptually related, variable selection and relative importance (RI) analysis have been treated quite differently in the literature. While RI is typically used for post-hoc model explanation, this paper explores its potential for variable ranking and filter-based selection before model creation. Specifically, we anticipate strong performance from the RI measures because they incorporate both direct and combined effects of predictors, addressing a key limitation of marginal correlation that ignores dependencies among predictors. We implement and evaluate the RI-based variable selection methods using general dominance (GD), comprehensive relative importance (CRI), and a newly proposed, computationally efficient variant termed CRI.Z. We first demonstrate how the RI measures more accurately rank the variables than the marginal correlation, especially when there are suppressed or weak predictors. We then show that predictive models built on these rankings are highly competitive, often outperforming state-of-the-art methods such as the lasso and relaxed lasso. The proposed RI-based methods are particularly effective in challenging cases involving clusters of highly correlated predictors, a setting known to cause failures in many benchmark methods. Although lasso methods have dominated the recent literature on variable selection, our study reveals that the RI-based method is a powerful and competitive alternative. We believe these underutilized tools deserve greater attention in statistics and machine learning communities. The code is available at: https://github.com/tien-endotchang/RI-variable-selection.
- Abstract(参考訳): 概念的関連性はあるものの,変数選択と相対的重要性 (RI) 分析は文献ではかなり異なる扱いがなされている。
RIは一般的にポストホックモデル説明に使用されるが,本論文ではモデル作成前の変動ランク付けとフィルタに基づく選択の可能性について検討する。
具体的には、予測器の直接効果と組み合わせ効果の両方を取り入れ、予測器間の依存関係を無視する限界相関の鍵となる制限に対処するため、RI測度から強い性能を期待する。
我々は、一般支配(GD)、包括的相対的重要性(CRI)、新たに提案された計算効率の良い変種であるCRI.Zを用いて、RIに基づく変数選択手法を実装し、評価する。
まず、RI測度が差分相関よりも正確に、特に抑制あるいは弱い予測子が存在する場合、どのようにして変数をランク付けするかを示す。
そして、これらのランキングに基づいて構築された予測モデルは、非常に競争力があり、しばしばラッソや緩やかなラッソのような最先端の手法よりも優れていることを示す。
提案手法は,多くのベンチマーク手法で障害を引き起こすことが知られている,非常に相関性の高い予測器のクラスタを含む課題に対して,特に有効である。
ラッソ法は変数選択に関する最近の文献を支配しているが,本研究はRI法が強力で競争力のある方法であることを示す。
これらの未使用のツールは、統計や機械学習のコミュニティでもっと注目に値すると信じています。
コードは以下の通り。 https://github.com/tien-endotchang/RI-variable-selection。
関連論文リスト
- Optimizing Feature Selection in Causal Inference: A Three-Stage Computational Framework for Unbiased Estimation [13.198582304877513]
本稿では,変数の所望のサブセットを選択する際の大幅な改善を示す3段階フレームワークを提案する。
提案手法は,様々な環境にまたがる最先端の合成データを用いて評価し,実現可能な時間内に優れた性能を示す。
論文 参考訳(メタデータ) (2025-02-01T17:47:28Z) - Controlling Risk of Retrieval-augmented Generation: A Counterfactual Prompting Framework [77.45983464131977]
我々は、RAGモデルの予測が誤りであり、現実のアプリケーションにおいて制御不能なリスクをもたらす可能性がどの程度あるかに焦点を当てる。
本研究は,RAGの予測に影響を及ぼす2つの重要な潜伏要因を明らかにする。
我々は,これらの要因をモデルに誘導し,その応答に与える影響を解析する,反実的プロンプトフレームワークを開発した。
論文 参考訳(メタデータ) (2024-09-24T14:52:14Z) - Gower's similarity coefficients with automatic weight selection [0.0]
混合型変数に対する最も一般的な相似性は、ゴーワーの類似性係数の1つを補うものとして導かれる。
重み付けスキームに関する議論は、しばしば非重み付けの「標準」設定が全体の相似性に対する単一の変数の不均衡な寄与を隠すことを無視するので、誤解を招くことがある。
この欠点は、各寄与相違性と結果の重み付け相違との相関関係を最小化する重み付けスキームを導入するという最近の考え方に倣って解決される。
論文 参考訳(メタデータ) (2024-01-30T14:21:56Z) - Variable Importance in High-Dimensional Settings Requires Grouping [19.095605415846187]
Conditional Permutation Importance (CPI)は、そのような場合のPIの制限をバイパスする。
クラスタリングまたはいくつかの事前知識を介して統計的に変数をグループ化すると、ある程度のパワーバックが得られる。
重み付けにより拡張された手法は,高相関なグループであっても,型Iエラーを制御可能であることを示す。
論文 参考訳(メタデータ) (2023-12-18T00:21:47Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - In Search of Insights, Not Magic Bullets: Towards Demystification of the
Model Selection Dilemma in Heterogeneous Treatment Effect Estimation [92.51773744318119]
本稿では,異なるモデル選択基準の長所と短所を実験的に検討する。
選択戦略,候補推定器,比較に用いるデータの間には,複雑な相互作用があることを強調した。
論文 参考訳(メタデータ) (2023-02-06T16:55:37Z) - ER: Equivariance Regularizer for Knowledge Graph Completion [107.51609402963072]
我々は、新しい正規化器、すなわち等分散正規化器(ER)を提案する。
ERは、頭と尾のエンティティ間の意味的等価性を利用することで、モデルの一般化能力を高めることができる。
実験結果から,最先端関係予測法よりも明確かつ実質的な改善が示された。
論文 参考訳(メタデータ) (2022-06-24T08:18:05Z) - Distributionally Robust Models with Parametric Likelihood Ratios [123.05074253513935]
3つの単純なアイデアにより、より広いパラメトリックな確率比のクラスを用いてDROでモデルを訓練することができる。
パラメトリック逆数を用いてトレーニングしたモデルは、他のDROアプローチと比較して、サブポピュレーションシフトに対して一貫して頑健であることがわかった。
論文 参考訳(メタデータ) (2022-04-13T12:43:12Z) - Continuous Mean-Covariance Bandits [39.820490484375156]
本稿では,選択肢相関を考慮した連続平均共分散帯域モデルを提案する。
CMCBでは、与えられた選択肢の重みベクトルを逐次選択し、決定に従ってランダムなフィードバックを観察する学習者がいる。
最適な後悔(対数的因子を含む)を伴う新しいアルゴリズムを提案し、それらの最適性を検証するために一致した下界を提供する。
論文 参考訳(メタデータ) (2021-02-24T06:37:05Z) - PCPL: Predicate-Correlation Perception Learning for Unbiased Scene Graph
Generation [58.98802062945709]
本稿では,適切な損失重みを適応的に求めるための新しい述語相関知覚学習手法を提案する。
我々のPCPLフレームワークは、文脈特徴をよりよく抽出するグラフエンコーダモジュールも備えています。
論文 参考訳(メタデータ) (2020-09-02T08:30:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。