論文の概要: Causally-Guided Diffusion for Stable Feature Selection
- arxiv url: http://arxiv.org/abs/2603.20930v1
- Date: Sat, 21 Mar 2026 20:14:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:39.156093
- Title: Causally-Guided Diffusion for Stable Feature Selection
- Title(参考訳): 安定な特徴選択のための因果誘導拡散法
- Authors: Arun Vignesh Malarkkan, Xinyuan Wang, Kunpeng Liu, Denghui Zhang, Yanjie Fu,
- Abstract要約: 安定性の観点から特徴選択について検討し,安定な特徴選択のための因果拡散を導入する。
CGDFSでは,特徴部分集合に対する近似後部推論として特徴選択を定式化した。
分散シフトを示すオープンソース実世界のデータセット上でCGDFSを評価する。
- 参考スコア(独自算出の注目度): 29.398494058613124
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Feature selection is fundamental to robust data-centric AI, but most existing methods optimize predictive performance under a single data distribution. This often selects spurious features that fail under distribution shifts. Motivated by principles from causal invariance, we study feature selection from a stability perspective and introduce Causally-Guided Diffusion for Stable Feature Selection (CGDFS). In CGDFS, we formalized feature selection as approximate posterior inference over feature subsets, whose posterior mass favors low prediction error and low cross-environment variance. Our framework combines three key insights: First, we formulate feature selection as stability-aware posterior sampling. Here, causal invariance serves as a soft inductive bias rather than explicit causal discovery. Second, we train a diffusion model as a learned prior over plausible continuous selection masks, combined with a stability-aware likelihood that rewards invariance across environments. This diffusion prior captures structural dependencies among features and enables scalable exploration of the combinatorially large selection space. Third, we perform guided annealed Langevin sampling that combines the diffusion prior with the stability objective, which yields a tractable, uncertainty-aware posterior inference that avoids discrete optimization and produces robust feature selections. We evaluate CGDFS on open-source real-world datasets exhibiting distribution shifts. Across both classification and regression tasks, CGDFS consistently selects more stable and transferable feature subsets, which leads to improved out-of-distribution performance and greater selection robustness compared to sparsity-based, tree-based, and stability-selection baselines.
- Abstract(参考訳): 特徴選択はロバストなデータ中心AIの基本であるが、既存のほとんどの手法は単一のデータ分散下での予測性能を最適化している。
これはしばしば、分散シフトで失敗する急激な機能を選択する。
因果的不変性から得られた原理により,安定性の観点から特徴選択を考察し,安定特徴選択のための因果的誘導拡散(CGDFS)を導入する。
CGDFSでは,後部質量が低予測誤差と低環境変動を好む特徴部分集合に対する近似後部推定として特徴選択を定式化した。
まず、安定性を考慮した後続サンプリングとして特徴選択を定式化します。
ここで、因果的不変性は明示的な因果的発見よりも、ソフトな帰納的バイアスとして機能する。
第二に、プラウチブルな連続選択マスクよりも先に学習した拡散モデルを訓練し、環境間の分散に報いる安定性を意識した確率と組み合わせる。
この拡散は、特徴間の構造的依存関係を捕捉し、組合せ的に大きな選択空間のスケーラブルな探索を可能にする。
第3に、拡散前の拡散と安定性の目標を組み合わせ、離散最適化を回避し、ロバストな特徴選択を生成する、トラクタブルで不確実性を考慮した後部推論を導出するガイド付き焼鈍ランゲヴィンサンプリングを行う。
分散シフトを示すオープンソース実世界のデータセット上でCGDFSを評価する。
分類タスクと回帰タスクの両方において、CGDFSは安定的で転送可能な機能サブセットを一貫して選択する。
関連論文リスト
- Not All Preferences Are Created Equal: Stability-Aware and Gradient-Efficient Alignment for Reasoning Models [52.48582333951919]
ポリシー更新の信号対雑音比を最大化することにより、アライメントの信頼性を高めるために設計された動的フレームワークを提案する。
SAGE(Stability-Aware Gradient Efficiency)は、モデル能力に基づいて候補プールをリフレッシュする粗いきめ細かいカリキュラムメカニズムを統合する。
複数の数学的推論ベンチマークの実験により、SAGEは収束を著しく加速し、静的ベースラインを上回っていることが示された。
論文 参考訳(メタデータ) (2026-02-01T12:56:10Z) - Decoupling the Effect of Chain-of-Thought Reasoning: A Human Label Variation Perspective [60.45433515408158]
長いチェーン・オブ・ソート(CoT)がトップオプションの決定的決定要因となるが、あいまいなタスクの粒度分布キャリブレータとして機能しないことを示す。
CoTは分布アライメントを改善するが、CoTの内容によって最終的な精度が決定される。
論文 参考訳(メタデータ) (2026-01-06T16:26:40Z) - Latent Variable Causal Discovery under Selection Bias [31.127374830119454]
条件付き独立制約への一般化として、線形ガウスモデルにおける共分散部分行列のランクを利用するランク制約について検討する。
選択は結合分布を著しく複雑にすることができるが、偏りのある共分散行列のランクは因果構造と選択機構の両方について有意義な情報を保持する。
このツールを用いて、古典的な潜在変数モデルである1要素モデルが選択バイアスの下で同定できることを実証する。
論文 参考訳(メタデータ) (2025-12-12T02:00:01Z) - TangledFeatures: Robust Feature Selection in Highly Correlated Spaces [0.0]
我々はTangledFeaturesを紹介した。TangledFeaturesは、相関した特徴空間における特徴選択のためのフレームワークである。
絡み合った予測器のグループから代表的特徴を識別し、説明力を維持しながら冗長性を低下させる。
選択された特徴は、背骨のねじれ角の変化を説明する構造的に意味のある原子内距離に対応している。
論文 参考訳(メタデータ) (2025-10-16T05:54:04Z) - Diffusion-Driven High-Dimensional Variable Selection [6.993247097440294]
本稿では,高忠実度合成データを生成する拡散モデルの能力を生かした再サンプル集約フレームワークを提案する。
提案手法は軽微な仮定の下で一貫した選択であることを示す。
本手法は,変数選択手法を改良し,統計的に厳密な解析を行うためのツールキットを拡充する。
論文 参考訳(メタデータ) (2025-08-19T14:54:20Z) - Advancing Reliable Test-Time Adaptation of Vision-Language Models under Visual Variations [67.35596444651037]
視覚言語モデル(VLM)は、素晴らしいゼロショット機能を示すが、ラベル付きデータが利用できない場合、下流タスクの分散シフトに苦慮する。
本稿では,信頼性を両面から高めるReliable Test-Time Adaptation (ReTA)法を提案する。
論文 参考訳(メタデータ) (2025-07-13T05:37:33Z) - Feature-Based Instance Neighbor Discovery: Advanced Stable Test-Time Adaptation in Dynamic World [7.9346432903946535]
深層ニューラルネットワークは、トレーニングとテストドメイン間の分散シフトによって、依然としてパフォーマンスが低下している。
本稿では,FIND(Feature-based Instance Neighbor Discovery)を提案する。FIND(Feature-wise Feature Disentanglement),FABN(Feature Aware Batch Normalization),Selective FABN(S-FABN)の3つの主要コンポーネントからなる。
実験では、FINDは既存の手法を著しく上回り、動的シナリオにおいて30%の精度向上を実現している。
論文 参考訳(メタデータ) (2025-06-07T12:45:49Z) - Stable Neighbor Denoising for Source-free Domain Adaptive Segmentation [91.83820250747935]
擬似ラベルノイズは主に不安定なサンプルに含まれており、ほとんどのピクセルの予測は自己学習中に大きく変化する。
我々は, 安定・不安定な試料を効果的に発見する, SND(Stable Neighbor Denoising)アプローチを導入する。
SNDは、様々なSFUDAセマンティックセグメンテーション設定における最先端メソッドよりも一貫して優れている。
論文 参考訳(メタデータ) (2024-06-10T21:44:52Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - Loss-guided Stability Selection [0.0]
LassoやBoostingのようなモデル選択手順は、実際のデータに過度に適合する傾向があることはよく知られている。
標準安定選択は、グローバルな基準、すなわち家族ごとのエラー率に基づいている。
選択された損失関数を付加的な検証ステップで尊重する安定性選択変種を提案する。
論文 参考訳(メタデータ) (2022-02-10T11:20:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。