論文の概要: Statistical Inference for Feature Selection after Optimal Transport-based Domain Adaptation
- arxiv url: http://arxiv.org/abs/2410.15022v1
- Date: Sat, 19 Oct 2024 07:35:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-22 13:21:01.783481
- Title: Statistical Inference for Feature Selection after Optimal Transport-based Domain Adaptation
- Title(参考訳): 最適輸送型ドメイン適応後の特徴選択の統計的推測
- Authors: Nguyen Thang Loi, Duong Tan Loc, Vo Nguyen Le Duy,
- Abstract要約: ドメイン適応(DA)に基づく特徴選択(FS)は、機械学習において重要な課題である。
そこで我々は,SFS-DA と呼ばれる DA の下で FS 信頼性を統計的に検証するための新しい統計手法を提案する。
- 参考スコア(独自算出の注目度): 7.10052009802944
- License:
- Abstract: Feature Selection (FS) under domain adaptation (DA) is a critical task in machine learning, especially when dealing with limited target data. However, existing methods lack the capability to guarantee the reliability of FS under DA. In this paper, we introduce a novel statistical method to statistically test FS reliability under DA, named SFS-DA (statistical FS-DA). The key strength of SFS-DA lies in its ability to control the false positive rate (FPR) below a pre-specified level $\alpha$ (e.g., 0.05) while maximizing the true positive rate. Compared to the literature on statistical FS, SFS-DA presents a unique challenge in addressing the effect of DA to ensure the validity of the inference on FS results. We overcome this challenge by leveraging the Selective Inference (SI) framework. Specifically, by carefully examining the FS process under DA whose operations can be characterized by linear and quadratic inequalities, we prove that achieving FPR control in SFS-DA is indeed possible. Furthermore, we enhance the true detection rate by introducing a more strategic approach. Experiments conducted on both synthetic and real-world datasets robustly support our theoretical results, showcasing the superior performance of the proposed SFS-DA method.
- Abstract(参考訳): ドメイン適応(DA)の下での機能選択(FS)は、特に限られたターゲットデータを扱う場合、機械学習において重要なタスクである。
しかし、既存の手法では、DAの下でFSの信頼性を保証する能力が欠如している。
本稿では,SFS-DA (Statistical FS-DA) という,統計的にFS信頼性を検証するための新しい統計手法を提案する。
SFS-DAの重要な強みは、偽陽性率(FPR)を、真陽性率を最大化しながら、予め指定されたレベル$\alpha$(e g , 0.05)以下に制御できる能力にある。
統計的FSに関する文献と比較すると、SFS-DAは、FS結果に対する推論の有効性を保証するためにDAの効果に対処する上で、ユニークな課題を提示している。
我々は選択推論(SI)フレームワークを活用することでこの課題を克服する。
具体的には、線形不等式と二次不等式を特徴付けることができるDAの下でのFSプロセスの精査により、SFS-DAにおけるFPR制御の実現が実際に可能であることを証明した。
さらに、より戦略的アプローチを導入することにより、真の検出率を高める。
合成と実世界の両方のデータセットで行った実験は、我々の理論結果をしっかりと支援し、提案したSFS-DA法の優れた性能を示す。
関連論文リスト
- Statistical Inference for Sequential Feature Selection after Domain Adaptation [7.10052009802944]
本稿では,SeqFS-DA が選択した特徴をテストするための新しい手法を提案する。
提案手法の主な利点は、価値レベル$alpha$(例えば0.05)以下の偽陽性率(FPR)を制御する能力である。
提案手法を,AIC,BIC,調整R-squaredを含むモデル選択基準でSeqFSに拡張する。
論文 参考訳(メタデータ) (2025-01-17T03:14:43Z) - Unveiling the Superior Paradigm: A Comparative Study of Source-Free Domain Adaptation and Unsupervised Domain Adaptation [52.36436121884317]
Source-Free Domain Adaptation (SFDA) は、現実のシナリオにおいて、Unsupervised Domain Adaptation (UDA) よりも一般的に優れていることを示す。
SFDAは、時間効率、ストレージ要件、対象とする学習目標、負の移動リスクの低減、過度な適合に対する堅牢性の向上といった利点を提供している。
利用可能なソースデータをマルチSFDA手法に効果的に統合する新しい重み推定法を提案する。
論文 参考訳(メタデータ) (2024-11-24T13:49:29Z) - Test-Time Domain Generalization for Face Anti-Spoofing [60.94384914275116]
Face Anti-Spoofing (FAS) は、顔認識システムをプレゼンテーション攻撃から保護するために重要である。
本稿では,テストデータを活用してモデルの一般化性を高める新しいテスト時間領域一般化フレームワークについて紹介する。
テスト時間スタイル投影 (TTSP) とディバーススタイルシフトシミュレーション (DSSS) によって構成された本手法は, 目に見えないデータを領域空間に効果的に投影する。
論文 参考訳(メタデータ) (2024-03-28T11:50:23Z) - Privacy-preserving Federated Primal-dual Learning for Non-convex and Non-smooth Problems with Model Sparsification [51.04894019092156]
FL(Federated Learning)は,FLオーケストレーション(PS)の下でクライアント上でモデルをトレーニングする,急速に成長する領域として認識されている。
本稿では,非滑らかなFL問題に対して,新しい一次分離アルゴリズムを提案し,保証する。
その独特な洞察力のある性質とその分析も提示される。
論文 参考訳(メタデータ) (2023-10-30T14:15:47Z) - Feature Reduction Method Comparison Towards Explainability and
Efficiency in Cybersecurity Intrusion Detection Systems [11.123884574885018]
侵入検知システム(IDS)は、収集されたコンピュータおよびネットワークデータに基づいて攻撃を検出し防止する。
最近の研究で、IDSモデルは機械学習(ML)と、ランダムフォレスト(RF)やディープニューラルネットワーク(DNN)のような深層学習(DL)手法を用いて構築されている。
RF情報ゲイン(RF-IG)、Bat Algorithm(CFSBA)を用いた相関選択、Aquila(CFS-AO)を用いたCFSの3つの異なるFS技術について検討する。
論文 参考訳(メタデータ) (2023-03-22T20:09:31Z) - Chasing Fairness Under Distribution Shift: A Model Weight Perturbation
Approach [72.19525160912943]
まず,分布シフト,データ摂動,モデルウェイト摂動の関連性を理論的に検証した。
次に、ターゲットデータセットの公平性を保証するのに十分な条件を分析します。
これらの十分な条件により、ロバストフェアネス正則化(RFR)を提案する。
論文 参考訳(メタデータ) (2023-03-06T17:19:23Z) - Federated Semi-Supervised Domain Adaptation via Knowledge Transfer [6.7543356061346485]
本稿では,複数の分散および機密データセットに対して半教師付きドメイン適応(SSDA)を実現するための革新的なアプローチを提案する。
Federated Semi-Supervised Domain Adaptation (FSSDA)は、戦略的に設計された知識蒸留技術に基づいて、SSDAとフェデレートラーニングを統合している。
FSSDA設計の有効性と効率を実証するために大規模な実験を行った。
論文 参考訳(メタデータ) (2022-07-21T19:36:10Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z) - Stochastic-Sign SGD for Federated Learning with Theoretical Guarantees [49.91477656517431]
量子化に基づく解法は、フェデレートラーニング(FL)において広く採用されている。
上記のプロパティをすべて享受する既存のメソッドはありません。
本稿では,SIGNSGDに基づく直感的かつ理論的に簡易な手法を提案し,そのギャップを埋める。
論文 参考訳(メタデータ) (2020-02-25T15:12:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。