論文の概要: Reproduction of IVFS algorithm for high-dimensional topology preservation feature selection
- arxiv url: http://arxiv.org/abs/2409.12195v1
- Date: Fri, 23 Aug 2024 12:08:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-07 19:26:16.068924
- Title: Reproduction of IVFS algorithm for high-dimensional topology preservation feature selection
- Title(参考訳): 高次元トポロジー保存特性選択のためのIVFSアルゴリズムの再現
- Authors: Zihan Wang,
- Abstract要約: IVFSはランダムサブセット法にインスパイアされ、トポロジカルな構造を維持することによってデータの類似性を保っている。
我々は,IVFSの数学的基礎を体系的に整理し,数値実験によりその有効性を検証する。
その結果、IVFSは多くのデータセットにおいてSPECとMCFSよりも優れており、収束と安定性の問題が持続していることがわかった。
- 参考スコア(独自算出の注目度): 10.49860279555873
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Feature selection is a crucial technique for handling high-dimensional data. In unsupervised scenarios, many popular algorithms focus on preserving the original data structure. In this paper, we reproduce the IVFS algorithm introduced in AAAI 2020, which is inspired by the random subset method and preserves data similarity by maintaining topological structure. We systematically organize the mathematical foundations of IVFS and validate its effectiveness through numerical experiments similar to those in the original paper. The results demonstrate that IVFS outperforms SPEC and MCFS on most datasets, although issues with its convergence and stability persist.
- Abstract(参考訳): 特徴選択は高次元データを扱う上で重要な手法である。
教師なしのシナリオでは、多くの一般的なアルゴリズムが元のデータ構造を保存することに重点を置いている。
本稿では,AAAI 2020で導入されたIVFSアルゴリズムを再現する。
本稿では,IVFSの数学的基礎を体系的に整理し,その有効性を検証する。
その結果、IVFSは多くのデータセットにおいてSPECとMCFSよりも優れており、収束と安定性の問題が持続していることがわかった。
関連論文リスト
- Test-Time Domain Generalization for Face Anti-Spoofing [60.94384914275116]
Face Anti-Spoofing (FAS) は、顔認識システムをプレゼンテーション攻撃から保護するために重要である。
本稿では,テストデータを活用してモデルの一般化性を高める新しいテスト時間領域一般化フレームワークについて紹介する。
テスト時間スタイル投影 (TTSP) とディバーススタイルシフトシミュレーション (DSSS) によって構成された本手法は, 目に見えないデータを領域空間に効果的に投影する。
論文 参考訳(メタデータ) (2024-03-28T11:50:23Z) - A new computationally efficient algorithm to solve Feature Selection for
Functional Data Classification in high-dimensional spaces [41.79972837288401]
本稿では,機能的分類のための特徴選択手法FSFCを紹介し,特徴選択と機能的データの分類を共同で行うという課題に対処する。
我々は機能的主成分を採用し、Dual Augmented Lagrangianアルゴリズムの新しい適応バージョンを開発した。
FSFCの計算効率は、特徴数が統計単位数よりかなり多いような高次元シナリオを処理できる。
論文 参考訳(メタデータ) (2024-01-11T09:17:25Z) - Clustering through Feature Space Sequence Discovery and Analysis [0.0]
本稿では,特徴空間の各点を反復なく動的に探索するデータ変換シーケンス解析(DCSA)を提案する。
4次元から20531次元の異なる分野の実世界のデータセットに対する実験により、本研究の手法が堅牢であり、結果解析に視覚的解釈性があることが確認された。
論文 参考訳(メタデータ) (2022-12-02T06:20:04Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - UDRN: Unified Dimensional Reduction Neural Network for Feature Selection
and Feature Projection [37.03465340777392]
次元還元(DR)は、高次元データを最小定義された最適化目標を持つ低次元潜在空間にマッピングする。
FSは次元の重要なサブセットの選択に重点を置いているが、データ分散(構造)を破壊するリスクがある
FPは全ての入力特徴を低次元空間に結合し、データ構造を維持することを目的としている。
我々は、FSとFPをエンドツーエンドで統合する統一的なフレームワークUDRN(Unified dimensional Reduction Neural-network)を開発した。
論文 参考訳(メタデータ) (2022-07-08T10:30:20Z) - A Supervised Feature Selection Method For Mixed-Type Data using
Density-based Feature Clustering [1.3048920509133808]
本稿では、密度ベース特徴クラスタリング(SFSDFC)を用いた教師付き特徴選択法を提案する。
SFSDFCは、新しい密度に基づくクラスタリング法を用いて、特徴空間を不連続な特徴クラスタの集合に分解する。
そして、これらの特徴クラスタから最小限の冗長性を持つ重要な特徴のサブセットを得るために、効果的な特徴選択戦略を採用する。
論文 参考訳(メタデータ) (2021-11-10T15:05:15Z) - Privacy-Preserving Asynchronous Federated Learning Algorithms for
Multi-Party Vertically Collaborative Learning [151.47900584193025]
本稿では,非同期フェデレーションSGD(AFSGD-VP)アルゴリズムとその垂直分割データ上でのSVRGおよびSAGA変種を提案する。
我々の知る限り、AFSGD-VPとそのSVRGおよびSAGAの変種は、垂直に分割されたデータのための最初の非同期フェデレーション学習アルゴリズムである。
論文 参考訳(メタデータ) (2020-08-14T08:08:15Z) - Federated Doubly Stochastic Kernel Learning for Vertically Partitioned
Data [93.76907759950608]
本稿では,垂直分割データに対する2倍のカーネル学習アルゴリズムを提案する。
本稿では,FDSKLがカーネルを扱う場合,最先端のフェデレーション学習手法よりもはるかに高速であることを示す。
論文 参考訳(メタデータ) (2020-08-14T05:46:56Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z) - IVFS: Simple and Efficient Feature Selection for High Dimensional
Topology Preservation [33.424663018395684]
本稿では,サンプル類似性保存を向上する簡易かつ効果的な特徴選択アルゴリズムを提案する。
提案アルゴリズムは、全データの対距離と位相パターンを適切に保存することができる。
論文 参考訳(メタデータ) (2020-04-02T23:05:00Z) - New advances in enumerative biclustering algorithms with online
partitioning [80.22629846165306]
さらに、数値データセットの列に定数値を持つ最大二クラスタの効率的で完全で正しい非冗長列挙を実現できる二クラスタリングアルゴリズムであるRIn-Close_CVCを拡張した。
改良されたアルゴリズムはRIn-Close_CVC3と呼ばれ、RIn-Close_CVCの魅力的な特性を保ちます。
論文 参考訳(メタデータ) (2020-03-07T14:54:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。