論文の概要: Statistical Inference for Sequential Feature Selection after Domain Adaptation
- arxiv url: http://arxiv.org/abs/2501.09933v1
- Date: Fri, 17 Jan 2025 03:14:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-20 14:00:47.695403
- Title: Statistical Inference for Sequential Feature Selection after Domain Adaptation
- Title(参考訳): 領域適応後の時系列特徴選択の統計的推測
- Authors: Duong Tan Loc, Nguyen Thang Loi, Vo Nguyen Le Duy,
- Abstract要約: 本稿では,SeqFS-DA が選択した特徴をテストするための新しい手法を提案する。
提案手法の主な利点は、価値レベル$alpha$(例えば0.05)以下の偽陽性率(FPR)を制御する能力である。
提案手法を,AIC,BIC,調整R-squaredを含むモデル選択基準でSeqFSに拡張する。
- 参考スコア(独自算出の注目度): 7.10052009802944
- License:
- Abstract: In high-dimensional regression, feature selection methods, such as sequential feature selection (SeqFS), are commonly used to identify relevant features. When data is limited, domain adaptation (DA) becomes crucial for transferring knowledge from a related source domain to a target domain, improving generalization performance. Although SeqFS after DA is an important task in machine learning, none of the existing methods can guarantee the reliability of its results. In this paper, we propose a novel method for testing the features selected by SeqFS-DA. The main advantage of the proposed method is its capability to control the false positive rate (FPR) below a significance level $\alpha$ (e.g., 0.05). Additionally, a strategic approach is introduced to enhance the statistical power of the test. Furthermore, we provide extensions of the proposed method to SeqFS with model selection criteria including AIC, BIC, and adjusted R-squared. Extensive experiments are conducted on both synthetic and real-world datasets to validate the theoretical results and demonstrate the proposed method's superior performance.
- Abstract(参考訳): 高次元回帰では、シーケンシャル特徴選択(SeqFS)のような特徴選択法が、関連する特徴を特定するために一般的に使用される。
データが制限された場合、ドメイン適応(DA)は、関連するソースドメインから対象ドメインへの知識の転送に不可欠となり、一般化性能が向上する。
DA後のSeqFSは機械学習において重要なタスクであるが、既存の手法ではその結果の信頼性を保証することはできない。
本稿では,SeqFS-DAが選択した特徴を検証するための新しい手法を提案する。
提案手法の主な利点は, 有意度$\alpha$ (e g , 0.05)以下の偽陽性率(FPR)を制御できることである。
さらに,テストの統計力を高めるための戦略的アプローチも導入されている。
さらに,提案手法を,AIC,BIC,調整R-squaredを含むモデル選択基準でSeqFSに拡張する。
理論的結果の検証と,提案手法の優れた性能を示すため, 合成データセットと実世界のデータセットの両方で大規模な実験を行った。
関連論文リスト
- "FRAME: Forward Recursive Adaptive Model Extraction -- A Technique for Advance Feature Selection" [0.0]
本研究では,新しいハイブリッド手法であるフォワード再帰適応モデル抽出手法(FRAME)を提案する。
FRAMEは、フォワード選択と再帰的特徴除去を組み合わせて、さまざまなデータセットにおける機能選択を強化する。
その結果、FRAMEは下流の機械学習評価指標に基づいて、常に優れた予測性能を提供することが示された。
論文 参考訳(メタデータ) (2025-01-21T08:34:10Z) - Statistical Inference for Temporal Difference Learning with Linear Function Approximation [62.69448336714418]
The consistency properties of TD learning with Polyak-Ruppert averaging and linear function approximation。
まず、分散に明示的に依存し、弱い条件下で保持する新しい高次元確率収束保証を導出する。
さらに、文献よりも高速な速度を保証する凸集合のクラスに対して、洗練された高次元ベリー-エッセイン境界を確立する。
論文 参考訳(メタデータ) (2024-10-21T15:34:44Z) - Statistical Inference for Feature Selection after Optimal Transport-based Domain Adaptation [7.10052009802944]
ドメイン適応(DA)に基づく特徴選択(FS)は、機械学習において重要な課題である。
そこで我々は,SFS-DA と呼ばれる DA の下で FS 信頼性を統計的に検証するための新しい統計手法を提案する。
論文 参考訳(メタデータ) (2024-10-19T07:35:23Z) - Test-Time Domain Generalization for Face Anti-Spoofing [60.94384914275116]
Face Anti-Spoofing (FAS) は、顔認識システムをプレゼンテーション攻撃から保護するために重要である。
本稿では,テストデータを活用してモデルの一般化性を高める新しいテスト時間領域一般化フレームワークについて紹介する。
テスト時間スタイル投影 (TTSP) とディバーススタイルシフトシミュレーション (DSSS) によって構成された本手法は, 目に見えないデータを領域空間に効果的に投影する。
論文 参考訳(メタデータ) (2024-03-28T11:50:23Z) - Consistency Regularization for Generalizable Source-free Domain
Adaptation [62.654883736925456]
ソースフリードメイン適応(source-free domain adapt, SFDA)は、ソースデータセットにアクセスすることなく、十分にトレーニングされたソースモデルを未学習のターゲットドメインに適応することを目的としている。
既存のSFDAメソッドは、ターゲットのトレーニングセット上で適用されたモデルを評価し、目に見えないが同一の分散テストセットからデータを無視する。
より一般化可能なSFDA法を開発するための整合正則化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-03T07:45:53Z) - FAStEN: An Efficient Adaptive Method for Feature Selection and Estimation in High-Dimensional Functional Regressions [7.674715791336311]
本稿では,スパース関数オン・ファンクション回帰問題において特徴選択を行うための,新しい,柔軟な,超効率的なアプローチを提案する。
我々はそれをスカラー・オン・ファンクション・フレームワークに拡張する方法を示す。
AOMIC PIOP1による脳MRIデータへの応用について述べる。
論文 参考訳(メタデータ) (2023-03-26T19:41:17Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Listen, Adapt, Better WER: Source-free Single-utterance Test-time
Adaptation for Automatic Speech Recognition [65.84978547406753]
Test-time Adaptationは、ソースドメインでトレーニングされたモデルに適応して、テストサンプルの予測を改善することを目的としている。
単一発話テスト時間適応 (SUTA) は音声領域における最初のTTA研究である。
論文 参考訳(メタデータ) (2022-03-27T06:38:39Z) - Sparsity-based Feature Selection for Anomalous Subgroup Discovery [5.960402015658508]
異常パターン検出は、正常性からの逸脱が明らかであり、ドメイン間で広く適用可能なインスタンスを特定することを目的としている。
効率的な発見のための原則的かつスケーラブルな特徴選択方法が欠如している点が一般的である。
本稿では,機能駆動オッズ比の分散化によるシステム結果のずれをエンコードする,疎度に基づく自動特徴選択フレームワークを提案する。
論文 参考訳(メタデータ) (2022-01-06T10:56:43Z) - More Powerful Conditional Selective Inference for Generalized Lasso by
Parametric Programming [20.309302270008146]
条件付き選択的推論(si)は、データ駆動仮説の新しい統計推論フレームワークとして研究されてきた。
二次パラメトリックプログラミングに変換可能な問題のクラスに対して,より強力で一般的な条件付きSI法を提案する。
論文 参考訳(メタデータ) (2021-05-11T10:12:00Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。