論文の概要: Statistical Inference for Feature Selection after Optimal Transport-based Domain Adaptation
- arxiv url: http://arxiv.org/abs/2410.15022v1
- Date: Sat, 19 Oct 2024 07:35:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-22 13:21:01.783481
- Title: Statistical Inference for Feature Selection after Optimal Transport-based Domain Adaptation
- Title(参考訳): 最適輸送型ドメイン適応後の特徴選択の統計的推測
- Authors: Nguyen Thang Loi, Duong Tan Loc, Vo Nguyen Le Duy,
- Abstract要約: ドメイン適応(DA)に基づく特徴選択(FS)は、機械学習において重要な課題である。
そこで我々は,SFS-DA と呼ばれる DA の下で FS 信頼性を統計的に検証するための新しい統計手法を提案する。
- 参考スコア(独自算出の注目度): 7.10052009802944
- License:
- Abstract: Feature Selection (FS) under domain adaptation (DA) is a critical task in machine learning, especially when dealing with limited target data. However, existing methods lack the capability to guarantee the reliability of FS under DA. In this paper, we introduce a novel statistical method to statistically test FS reliability under DA, named SFS-DA (statistical FS-DA). The key strength of SFS-DA lies in its ability to control the false positive rate (FPR) below a pre-specified level $\alpha$ (e.g., 0.05) while maximizing the true positive rate. Compared to the literature on statistical FS, SFS-DA presents a unique challenge in addressing the effect of DA to ensure the validity of the inference on FS results. We overcome this challenge by leveraging the Selective Inference (SI) framework. Specifically, by carefully examining the FS process under DA whose operations can be characterized by linear and quadratic inequalities, we prove that achieving FPR control in SFS-DA is indeed possible. Furthermore, we enhance the true detection rate by introducing a more strategic approach. Experiments conducted on both synthetic and real-world datasets robustly support our theoretical results, showcasing the superior performance of the proposed SFS-DA method.
- Abstract(参考訳): ドメイン適応(DA)の下での機能選択(FS)は、特に限られたターゲットデータを扱う場合、機械学習において重要なタスクである。
しかし、既存の手法では、DAの下でFSの信頼性を保証する能力が欠如している。
本稿では,SFS-DA (Statistical FS-DA) という,統計的にFS信頼性を検証するための新しい統計手法を提案する。
SFS-DAの重要な強みは、偽陽性率(FPR)を、真陽性率を最大化しながら、予め指定されたレベル$\alpha$(e g , 0.05)以下に制御できる能力にある。
統計的FSに関する文献と比較すると、SFS-DAは、FS結果に対する推論の有効性を保証するためにDAの効果に対処する上で、ユニークな課題を提示している。
我々は選択推論(SI)フレームワークを活用することでこの課題を克服する。
具体的には、線形不等式と二次不等式を特徴付けることができるDAの下でのFSプロセスの精査により、SFS-DAにおけるFPR制御の実現が実際に可能であることを証明した。
さらに、より戦略的アプローチを導入することにより、真の検出率を高める。
合成と実世界の両方のデータセットで行った実験は、我々の理論結果をしっかりと支援し、提案したSFS-DA法の優れた性能を示す。
関連論文リスト
- Statistical Inference for Temporal Difference Learning with Linear Function Approximation [62.69448336714418]
時間差差(TD)学習は、おそらく政策評価に最も広く使用されるものであり、この目的の自然な枠組みとして機能する。
本稿では,Polyak-Ruppert平均化と線形関数近似によるTD学習の整合性について検討し,既存の結果よりも3つの重要な改善点を得た。
論文 参考訳(メタデータ) (2024-10-21T15:34:44Z) - Test-Time Domain Generalization for Face Anti-Spoofing [60.94384914275116]
Face Anti-Spoofing (FAS) は、顔認識システムをプレゼンテーション攻撃から保護するために重要である。
本稿では,テストデータを活用してモデルの一般化性を高める新しいテスト時間領域一般化フレームワークについて紹介する。
テスト時間スタイル投影 (TTSP) とディバーススタイルシフトシミュレーション (DSSS) によって構成された本手法は, 目に見えないデータを領域空間に効果的に投影する。
論文 参考訳(メタデータ) (2024-03-28T11:50:23Z) - Feature Norm Regularized Federated Learning: Transforming Skewed
Distributions into Global Insights [16.039822050613022]
本研究は,FNR-FLアルゴリズムを紹介する。
FNR-FLは、非I.D.シナリオにおけるモデルの精度と収束を高めるために、クラス平均特徴ノルムを取り入れている。
その結果,FNR-FLの精度は66.24%向上し,トレーニング時間は11.40%低下した。
論文 参考訳(メタデータ) (2023-12-12T03:09:37Z) - Privacy-preserving Federated Primal-dual Learning for Non-convex and Non-smooth Problems with Model Sparsification [51.04894019092156]
FL(Federated Learning)は,FLオーケストレーション(PS)の下でクライアント上でモデルをトレーニングする,急速に成長する領域として認識されている。
本稿では,非滑らかなFL問題に対して,新しい一次分離アルゴリズムを提案し,保証する。
その独特な洞察力のある性質とその分析も提示される。
論文 参考訳(メタデータ) (2023-10-30T14:15:47Z) - UNIDEAL: Curriculum Knowledge Distillation Federated Learning [17.817181326740698]
フェデレートラーニング(FL)は、複数のクライアント間で協調学習を可能にする、有望なアプローチとして登場した。
本稿では,ドメイン横断シナリオの課題に対処するための新しいFLアルゴリズムであるUNIを提案する。
この結果から,UNIはモデル精度と通信効率の両面において優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2023-09-16T11:30:29Z) - Feature Reduction Method Comparison Towards Explainability and
Efficiency in Cybersecurity Intrusion Detection Systems [11.123884574885018]
侵入検知システム(IDS)は、収集されたコンピュータおよびネットワークデータに基づいて攻撃を検出し防止する。
最近の研究で、IDSモデルは機械学習(ML)と、ランダムフォレスト(RF)やディープニューラルネットワーク(DNN)のような深層学習(DL)手法を用いて構築されている。
RF情報ゲイン(RF-IG)、Bat Algorithm(CFSBA)を用いた相関選択、Aquila(CFS-AO)を用いたCFSの3つの異なるFS技術について検討する。
論文 参考訳(メタデータ) (2023-03-22T20:09:31Z) - Chasing Fairness Under Distribution Shift: A Model Weight Perturbation
Approach [72.19525160912943]
まず,分布シフト,データ摂動,モデルウェイト摂動の関連性を理論的に検証した。
次に、ターゲットデータセットの公平性を保証するのに十分な条件を分析します。
これらの十分な条件により、ロバストフェアネス正則化(RFR)を提案する。
論文 参考訳(メタデータ) (2023-03-06T17:19:23Z) - Federated Semi-Supervised Domain Adaptation via Knowledge Transfer [6.7543356061346485]
本稿では,複数の分散および機密データセットに対して半教師付きドメイン適応(SSDA)を実現するための革新的なアプローチを提案する。
Federated Semi-Supervised Domain Adaptation (FSSDA)は、戦略的に設計された知識蒸留技術に基づいて、SSDAとフェデレートラーニングを統合している。
FSSDA設計の有効性と効率を実証するために大規模な実験を行った。
論文 参考訳(メタデータ) (2022-07-21T19:36:10Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z) - Stochastic-Sign SGD for Federated Learning with Theoretical Guarantees [49.91477656517431]
量子化に基づく解法は、フェデレートラーニング(FL)において広く採用されている。
上記のプロパティをすべて享受する既存のメソッドはありません。
本稿では,SIGNSGDに基づく直感的かつ理論的に簡易な手法を提案し,そのギャップを埋める。
論文 参考訳(メタデータ) (2020-02-25T15:12:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。