論文の概要: Bi-Level Unsupervised Feature Selection
- arxiv url: http://arxiv.org/abs/2505.20563v1
- Date: Mon, 26 May 2025 22:52:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-28 17:05:58.311359
- Title: Bi-Level Unsupervised Feature Selection
- Title(参考訳): 双方向教師なし特徴選択
- Authors: Jingjing Liu, Xiansen Ju, Xianchao Xiu, Wanquan Liu,
- Abstract要約: 本稿では,クラスタリングレベルと特徴レベルを含む2レベル非教師付き特徴選択(BLUFS)手法を提案する。
クラスタリングレベルでは、スペクトルクラスタリングを用いてデータ構造を表現する擬似ラベルを生成し、連続線形回帰モデルを用いてプロジェクション行列を学習する。
機能レベルでは、$ell_2,0$-norm制約がプロジェクションマトリックスに課され、より効果的に機能を選択する。
- 参考スコア(独自算出の注目度): 11.383408944117804
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Unsupervised feature selection (UFS) is an important task in data engineering. However, most UFS methods construct models from a single perspective and often fail to simultaneously evaluate feature importance and preserve their inherent data structure, thus limiting their performance. To address this challenge, we propose a novel bi-level unsupervised feature selection (BLUFS) method, including a clustering level and a feature level. Specifically, at the clustering level, spectral clustering is used to generate pseudo-labels for representing the data structure, while a continuous linear regression model is developed to learn the projection matrix. At the feature level, the $\ell_{2,0}$-norm constraint is imposed on the projection matrix for more effectively selecting features. To the best of our knowledge, this is the first work to combine a bi-level framework with the $\ell_{2,0}$-norm. To solve the proposed bi-level model, we design an efficient proximal alternating minimization (PAM) algorithm, whose subproblems either have explicit solutions or can be computed by fast solvers. Furthermore, we establish the convergence result and computational complexity. Finally, extensive experiments on two synthetic datasets and eight real datasets demonstrate the superiority of BLUFS in clustering and classification tasks.
- Abstract(参考訳): 教師なし機能選択(UFS)は、データエンジニアリングにおいて重要なタスクである。
しかし、ほとんどのUFSメソッドは単一視点でモデルを構築し、しばしば特徴の重要性を同時に評価し、固有のデータ構造を保存することができず、性能が制限される。
この課題に対処するために,クラスタリングレベルと特徴レベルを含む2レベル非教師付き特徴選択(BLUFS)手法を提案する。
具体的には、クラスタリングレベルでは、スペクトルクラスタリングを用いてデータ構造を表現する擬似ラベルを生成し、連続線形回帰モデルを用いてプロジェクション行列を学習する。
特徴量レベルでは、$\ell_{2,0}$-norm制約が射影行列に課され、より効果的に特徴を選択できる。
私たちの知る限りでは、これはバイレベルフレームワークを$\ell_{2,0}$-normと組み合わせる最初の作業です。
提案する2レベルモデルでは, 部分確率が明示的な解を持つか, 高速解法で計算可能なPAMアルゴリズムを設計する。
さらに、収束結果と計算複雑性を確立する。
最後に、2つの合成データセットと8つの実データセットに関する広範な実験は、クラスタリングと分類タスクにおけるBLUFSの優位性を示している。
関連論文リスト
- Manifold Clustering with Schatten p-norm Maximization [16.90743611125625]
我々は,多様体クラスタリングに基づく新しいクラスタリングフレームワークを開発した。
具体的には、アルゴリズムはラベルを使用して多様体の構造をガイドし、その上にクラスタリングを行う。
クラスタリング過程におけるクラスバランスを自然に維持するために、ラベルのシャッテン p-ノルムを最大化する。
論文 参考訳(メタデータ) (2025-04-29T03:23:06Z) - Computational-Statistical Gaps in Gaussian Single-Index Models [77.1473134227844]
単次元モデル(Single-Index Models)は、植木構造における高次元回帰問題である。
我々は,統計的クエリ (SQ) と低遅延多項式 (LDP) フレームワークの両方において,計算効率のよいアルゴリズムが必ずしも$Omega(dkstar/2)$サンプルを必要とすることを示した。
論文 参考訳(メタデータ) (2024-03-08T18:50:19Z) - Local Stochastic Bilevel Optimization with Momentum-Based Variance
Reduction [104.41634756395545]
具体的には、まず、決定論的勾配に基づくアルゴリズムであるFedBiOを提案する。
FedBiOの複雑性は$O(epsilon-1.5)$である。
本アルゴリズムは数値実験において,他のベースラインと比較して優れた性能を示す。
論文 参考訳(メタデータ) (2022-05-03T16:40:22Z) - A Lagrangian Duality Approach to Active Learning [119.36233726867992]
トレーニングデータのサブセットのみをラベル付けするバッチアクティブな学習問題を考察する。
制約付き最適化を用いて学習問題を定式化し、各制約はラベル付きサンプルにモデルの性能を拘束する。
数値実験により,提案手法は最先端の能動学習法と同等かそれ以上に機能することを示した。
論文 参考訳(メタデータ) (2022-02-08T19:18:49Z) - Deep Attention-guided Graph Clustering with Dual Self-supervision [49.040136530379094]
デュアル・セルフ・スーパービジョン(DAGC)を用いたディープアテンション誘導グラフクラスタリング法を提案する。
我々は,三重項Kulback-Leibler分散損失を持つソフトな自己スーパービジョン戦略と,擬似的な監督損失を持つハードな自己スーパービジョン戦略からなる二重自己スーパービジョンソリューションを開発する。
提案手法は6つのベンチマークデータセットにおける最先端の手法より一貫して優れている。
論文 参考訳(メタデータ) (2021-11-10T06:53:03Z) - UCSL : A Machine Learning Expectation-Maximization framework for
Unsupervised Clustering driven by Supervised Learning [2.133032470368051]
Subtype Discoveryは、データセットの解釈可能で一貫性のあるサブ部分を見つけることで構成される。
UCSL (Unsupervised Clustering driven by Supervised Learning) という汎用的な期待最大化アンサンブルフレームワークを提案する。
我々の手法は汎用的であり、任意のクラスタリング手法を統合することができ、バイナリ分類と回帰の両方によって駆動することができる。
論文 参考訳(メタデータ) (2021-07-05T12:55:13Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Adaptive Graph-based Generalized Regression Model for Unsupervised
Feature Selection [11.214334712819396]
非相関的かつ識別的特徴の選択は、教師なしの機能選択の重要な問題である。
非相関制約と $ell_2,1$-norm 正規化によって課される新しい一般化回帰モデルを提案する。
それは同時に同じ近所に属するこれらのデータ ポイントの分散を減らすこと無相関および差別的な特徴を選ぶことができます。
論文 参考訳(メタデータ) (2020-12-27T09:07:26Z) - Multi-View Spectral Clustering with High-Order Optimal Neighborhood
Laplacian Matrix [57.11971786407279]
マルチビュースペクトルクラスタリングは、データ間の固有のクラスタ構造を効果的に明らかにすることができる。
本稿では,高次最適近傍ラプラシア行列を学習するマルチビュースペクトルクラスタリングアルゴリズムを提案する。
提案アルゴリズムは, 1次ベースと高次ベースの両方の線形結合の近傍を探索し, 最適ラプラシア行列を生成する。
論文 参考訳(メタデータ) (2020-08-31T12:28:40Z) - Robust Self-Supervised Convolutional Neural Network for Subspace
Clustering and Classification [0.10152838128195464]
本稿では,自己管理型畳み込みサブスペースクラスタリングネットワーク(S2$ConvSCN)のロバストな定式化を提案する。
真の教師なしのトレーニング環境では、Robust $S2$ConvSCNは、4つのよく知られたデータセットで見られるデータと見えないデータの両方に対して、ベースラインバージョンをかなり上回っている。
論文 参考訳(メタデータ) (2020-04-03T16:07:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。