論文の概要: Statistical Inference for Sequential Feature Selection after Domain Adaptation
- arxiv url: http://arxiv.org/abs/2501.09933v1
- Date: Fri, 17 Jan 2025 03:14:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-20 14:00:47.695403
- Title: Statistical Inference for Sequential Feature Selection after Domain Adaptation
- Title(参考訳): 領域適応後の時系列特徴選択の統計的推測
- Authors: Duong Tan Loc, Nguyen Thang Loi, Vo Nguyen Le Duy,
- Abstract要約: 本稿では,SeqFS-DA が選択した特徴をテストするための新しい手法を提案する。
提案手法の主な利点は、価値レベル$alpha$(例えば0.05)以下の偽陽性率(FPR)を制御する能力である。
提案手法を,AIC,BIC,調整R-squaredを含むモデル選択基準でSeqFSに拡張する。
- 参考スコア(独自算出の注目度): 7.10052009802944
- License:
- Abstract: In high-dimensional regression, feature selection methods, such as sequential feature selection (SeqFS), are commonly used to identify relevant features. When data is limited, domain adaptation (DA) becomes crucial for transferring knowledge from a related source domain to a target domain, improving generalization performance. Although SeqFS after DA is an important task in machine learning, none of the existing methods can guarantee the reliability of its results. In this paper, we propose a novel method for testing the features selected by SeqFS-DA. The main advantage of the proposed method is its capability to control the false positive rate (FPR) below a significance level $\alpha$ (e.g., 0.05). Additionally, a strategic approach is introduced to enhance the statistical power of the test. Furthermore, we provide extensions of the proposed method to SeqFS with model selection criteria including AIC, BIC, and adjusted R-squared. Extensive experiments are conducted on both synthetic and real-world datasets to validate the theoretical results and demonstrate the proposed method's superior performance.
- Abstract(参考訳): 高次元回帰では、シーケンシャル特徴選択(SeqFS)のような特徴選択法が、関連する特徴を特定するために一般的に使用される。
データが制限された場合、ドメイン適応(DA)は、関連するソースドメインから対象ドメインへの知識の転送に不可欠となり、一般化性能が向上する。
DA後のSeqFSは機械学習において重要なタスクであるが、既存の手法ではその結果の信頼性を保証することはできない。
本稿では,SeqFS-DAが選択した特徴を検証するための新しい手法を提案する。
提案手法の主な利点は, 有意度$\alpha$ (e g , 0.05)以下の偽陽性率(FPR)を制御できることである。
さらに,テストの統計力を高めるための戦略的アプローチも導入されている。
さらに,提案手法を,AIC,BIC,調整R-squaredを含むモデル選択基準でSeqFSに拡張する。
理論的結果の検証と,提案手法の優れた性能を示すため, 合成データセットと実世界のデータセットの両方で大規模な実験を行った。
関連論文リスト
- Statistical Inference for Temporal Difference Learning with Linear Function Approximation [62.69448336714418]
時間差差(TD)学習は、おそらく政策評価に最も広く使用されるものであり、この目的の自然な枠組みとして機能する。
本稿では,Polyak-Ruppert平均化と線形関数近似によるTD学習の整合性について検討し,既存の結果よりも3つの重要な改善点を得た。
論文 参考訳(メタデータ) (2024-10-21T15:34:44Z) - Statistical Inference for Feature Selection after Optimal Transport-based Domain Adaptation [7.10052009802944]
ドメイン適応(DA)に基づく特徴選択(FS)は、機械学習において重要な課題である。
そこで我々は,SFS-DA と呼ばれる DA の下で FS 信頼性を統計的に検証するための新しい統計手法を提案する。
論文 参考訳(メタデータ) (2024-10-19T07:35:23Z) - SKADA-Bench: Benchmarking Unsupervised Domain Adaptation Methods with Realistic Validation [55.87169702896249]
Unsupervised Domain Adaptation (DA) は、ラベル付きソースドメインでトレーニングされたモデルを適用して、ラベルなしのターゲットドメインでデータ分散シフトをうまく実行する。
本稿では,DA手法の評価と,再重み付け,マッピング,部分空間アライメントなど,既存の浅層アルゴリズムの公平な評価を行うフレームワークを提案する。
本ベンチマークでは,現実的な検証の重要性を強調し,現実的なアプリケーションに対する実践的なガイダンスを提供する。
論文 参考訳(メタデータ) (2024-07-16T12:52:29Z) - Consistency Regularization for Generalizable Source-free Domain
Adaptation [62.654883736925456]
ソースフリードメイン適応(source-free domain adapt, SFDA)は、ソースデータセットにアクセスすることなく、十分にトレーニングされたソースモデルを未学習のターゲットドメインに適応することを目的としている。
既存のSFDAメソッドは、ターゲットのトレーニングセット上で適用されたモデルを評価し、目に見えないが同一の分散テストセットからデータを無視する。
より一般化可能なSFDA法を開発するための整合正則化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-03T07:45:53Z) - FAStEN: An Efficient Adaptive Method for Feature Selection and Estimation in High-Dimensional Functional Regressions [7.674715791336311]
本稿では,スパース関数オン・ファンクション回帰問題において特徴選択を行うための,新しい,柔軟な,超効率的なアプローチを提案する。
我々はそれをスカラー・オン・ファンクション・フレームワークに拡張する方法を示す。
AOMIC PIOP1による脳MRIデータへの応用について述べる。
論文 参考訳(メタデータ) (2023-03-26T19:41:17Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Listen, Adapt, Better WER: Source-free Single-utterance Test-time
Adaptation for Automatic Speech Recognition [65.84978547406753]
Test-time Adaptationは、ソースドメインでトレーニングされたモデルに適応して、テストサンプルの予測を改善することを目的としている。
単一発話テスト時間適応 (SUTA) は音声領域における最初のTTA研究である。
論文 参考訳(メタデータ) (2022-03-27T06:38:39Z) - Sparsity-based Feature Selection for Anomalous Subgroup Discovery [5.960402015658508]
異常パターン検出は、正常性からの逸脱が明らかであり、ドメイン間で広く適用可能なインスタンスを特定することを目的としている。
効率的な発見のための原則的かつスケーラブルな特徴選択方法が欠如している点が一般的である。
本稿では,機能駆動オッズ比の分散化によるシステム結果のずれをエンコードする,疎度に基づく自動特徴選択フレームワークを提案する。
論文 参考訳(メタデータ) (2022-01-06T10:56:43Z) - RFCBF: enhance the performance and stability of Fast Correlation-Based
Filter [6.781877756322586]
分類精度を向上させるために再サンプリング技術を組み合わせた新しいFCBF拡張RFCBFを提案する。
実験結果から,RFCBFアルゴリズムは従来の最先端手法よりも,分類精度と実行時間で有意に優れた結果が得られることがわかった。
論文 参考訳(メタデータ) (2021-05-30T12:36:32Z) - More Powerful Conditional Selective Inference for Generalized Lasso by
Parametric Programming [20.309302270008146]
条件付き選択的推論(si)は、データ駆動仮説の新しい統計推論フレームワークとして研究されてきた。
二次パラメトリックプログラミングに変換可能な問題のクラスに対して,より強力で一般的な条件付きSI法を提案する。
論文 参考訳(メタデータ) (2021-05-11T10:12:00Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。