論文の概要: 2D Stability Selection: Design Jittering for Doubly Stable Feature Selection
- arxiv url: http://arxiv.org/abs/2605.02205v1
- Date: Mon, 04 May 2026 04:09:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.134663
- Title: 2D Stability Selection: Design Jittering for Doubly Stable Feature Selection
- Title(参考訳): 2次元安定性の選択:2重安定な特徴選択のための設計ジッタリング
- Authors: Mahdi Nouraie, Houying Zhu, Samuel Muller,
- Abstract要約: 本研究では,2つの異なる不安定な条件下での高次元回帰における特徴選択について検討した。
乱数化と設計ノイズの増大の両面において、包摂性が安定な特徴を対象とする摂動・集約フレームワークである二重安定特徴選択を導入する。
- 参考スコア(独自算出の注目度): 0.3568466510804538
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study feature selection in high-dimensional regression under two distinct sources of instability: sampling variability and measurement error in the design matrix. Stability Selection addresses the former through sub-sampling and aggregation, but does not explicitly stress-test robustness to noisy predictors. We introduce doubly stable feature selection, a perturb-and-aggregate framework that targets features whose inclusion is stable both across randomization and across increasing levels of design noise. The method injects controlled additive noise into the design matrix, fits a fixed base selector such as the Lasso on the perturbed data, and aggregates selection frequencies. Sweeping over a grid of noise levels yields a stability path that summarizes robustness to measurement error while using the full sample size and isolating the effect of design perturbations. On the theory side, we show that classical model-selection conditions are preserved under sufficiently small perturbations, with a high-probability extension for Gaussian noise. Empirically, experiments on synthetic and real datasets show improved robustness compared with Stability Selection and standard base selectors.
- Abstract(参考訳): 本研究では,2つの異なる不安定な条件下での高次元回帰における特徴選択について検討した。
安定性の選択は、サブサンプリングとアグリゲーションを通じて前者に対処するが、ノイズの多い予測子に対するストレステストの堅牢性は明確には示さない。
乱数化と設計ノイズの増大の両面において、包摂性が安定な特徴を対象とする摂動・集約フレームワークである二重安定特徴選択を導入する。
この方法は、制御された付加雑音を設計行列に注入し、摂動データにラッソのような固定ベースセレクタに適合させ、選択周波数を集約する。
ノイズレベルのグリッドをスワイプすると、完全なサンプルサイズを使用しながら測定誤差に頑健さを要約し、設計摂動の効果を分離する安定性パスが得られる。
理論面では、古典的モデル選択条件はガウス雑音に対する高確率拡張を伴う十分小さな摂動の下で保存されていることを示す。
経験的に、合成データセットと実データセットの実験は、安定性の選択や標準ベースセレクタと比較して堅牢性が改善された。
関連論文リスト
- Causally-Guided Diffusion for Stable Feature Selection [29.398494058613124]
安定性の観点から特徴選択について検討し,安定な特徴選択のための因果拡散を導入する。
CGDFSでは,特徴部分集合に対する近似後部推論として特徴選択を定式化した。
分散シフトを示すオープンソース実世界のデータセット上でCGDFSを評価する。
論文 参考訳(メタデータ) (2026-03-21T20:14:00Z) - From Calibration to Refinement: Seeking Certainty via Probabilistic Evidence Propagation for Noisy-Label Person Re-Identification [40.73759251488672]
既存のノイズロスのある人物Re-ID法は、ソフトマックス出力を用いた損失補正やサンプル選択方式に依存している。
本稿では,キャリブレーションからリファインメントへ伝播する確率的証拠を通じて確実性を求める2段階フレームワークであるCARE法を提案する。
精製段階では, クリーン試料とノイズ試料をより正確に識別できるエビデンス伝搬精製法(EPR)を設計する。
論文 参考訳(メタデータ) (2026-02-26T15:50:15Z) - Noise-Robust Tiny Object Localization with Flows [63.60972031108944]
フレキシブルなエラーモデリングと不確実性誘導最適化に正規化フローを活用するノイズローバストローカライゼーションフレームワークを提案する。
本手法は,フローベース誤差モデルを用いて,複雑な非ガウス予測分布を抽出し,ノイズの多い監視下で頑健な学習を可能にする。
不確実性を考慮した勾配変調機構は、トレーニングを安定化しながら過度な適合を緩和し、高不確実でノイズの強いサンプルからの学習をさらに抑制する。
論文 参考訳(メタデータ) (2026-01-02T09:16:55Z) - Diffusion-Driven High-Dimensional Variable Selection [6.993247097440294]
本稿では,高忠実度合成データを生成する拡散モデルの能力を生かした再サンプル集約フレームワークを提案する。
提案手法は軽微な仮定の下で一貫した選択であることを示す。
本手法は,変数選択手法を改良し,統計的に厳密な解析を行うためのツールキットを拡充する。
論文 参考訳(メタデータ) (2025-08-19T14:54:20Z) - Noise Conditional Variational Score Distillation [60.38982038894823]
騒音条件変化スコア蒸留(NCVSD)は, 予混合拡散モデルから生成消音剤を蒸留する新しい方法である。
この知見を変分スコア蒸留フレームワークに組み込むことで、生成的デノイザのスケーラブルな学習を可能にする。
論文 参考訳(メタデータ) (2025-06-11T06:01:39Z) - A Hybrid Framework for Statistical Feature Selection and Image-Based Noise-Defect Detection [55.2480439325792]
本稿では,統計的特徴選択と分類技術を統合し,欠陥検出精度を向上させるハイブリッドフレームワークを提案する。
工業画像から抽出した55個の特徴を統計的手法を用いて解析した。
これらの手法をフレキシブルな機械学習アプリケーションに統合することにより、検出精度を改善し、偽陽性や誤分類を減らす。
論文 参考訳(メタデータ) (2024-12-11T22:12:21Z) - Stable Neighbor Denoising for Source-free Domain Adaptive Segmentation [91.83820250747935]
擬似ラベルノイズは主に不安定なサンプルに含まれており、ほとんどのピクセルの予測は自己学習中に大きく変化する。
我々は, 安定・不安定な試料を効果的に発見する, SND(Stable Neighbor Denoising)アプローチを導入する。
SNDは、様々なSFUDAセマンティックセグメンテーション設定における最先端メソッドよりも一貫して優れている。
論文 参考訳(メタデータ) (2024-06-10T21:44:52Z) - Risk-Sensitive Diffusion: Robustly Optimizing Diffusion Models with Noisy Samples [58.68233326265417]
非画像データは実際のアプリケーションで広く使われており、ノイズが多い傾向にある。
リスク感受性SDEは、リスクベクトルによってパラメータ化された微分方程式(SDE)の一種である。
我々はガウス雑音分布と非ガウス雑音分布の両方について系統的研究を行う。
論文 参考訳(メタデータ) (2024-02-03T08:41:51Z) - Negative Pre-aware for Noisy Cross-modal Matching [46.5591267410225]
雑音対応は認識と修正が難しいため,クロスモーダルノイズロバスト学習は難しい課題である。
本稿では,雑音の多い下流タスクに対する大規模視覚言語モデルファインタニングのための,否定的事前認識型クロスモーダルマッチングソリューションを提案する。
論文 参考訳(メタデータ) (2023-12-10T05:52:36Z) - Doubly Stochastic Models: Learning with Unbiased Label Noises and
Inference Stability [85.1044381834036]
勾配降下のミニバッチサンプリング設定におけるラベル雑音の暗黙的正則化効果について検討した。
そのような暗黙的正則化器は、パラメータの摂動に対してモデル出力を安定化できる収束点を好んでいる。
我々の研究は、SGDをオルンシュタイン-ウレンベック類似の過程とはみなせず、近似の収束によってより一般的な結果を得る。
論文 参考訳(メタデータ) (2023-04-01T14:09:07Z) - Loss-guided Stability Selection [0.0]
LassoやBoostingのようなモデル選択手順は、実際のデータに過度に適合する傾向があることはよく知られている。
標準安定選択は、グローバルな基準、すなわち家族ごとのエラー率に基づいている。
選択された損失関数を付加的な検証ステップで尊重する安定性選択変種を提案する。
論文 参考訳(メタデータ) (2022-02-10T11:20:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。