論文の概要: GOLFS: Feature Selection via Combining Both Global and Local Information for High Dimensional Clustering
- arxiv url: http://arxiv.org/abs/2507.10956v1
- Date: Tue, 15 Jul 2025 03:39:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-16 19:46:02.970855
- Title: GOLFS: Feature Selection via Combining Both Global and Local Information for High Dimensional Clustering
- Title(参考訳): GOLFS:高次元クラスタリングのためのグローバル情報とローカル情報の組み合わせによる特徴選択
- Authors: Zhaoyu Xing, Yang Wan, Juan Wen, Wei Zhong,
- Abstract要約: GlObalとローカル情報を組み合わせた特徴選択法(GOLFS)を提案する。
GOLFSは、多様体学習による局所幾何学構造と、サンプルの大域的相関構造を組み合わせて、識別的特徴を選択する。
この組み合わせにより、より包括的な情報を活用することにより、機能選択とクラスタリングの両方の精度が向上する。
- 参考スコア(独自算出の注目度): 10.740524877905685
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: It is important to identify the discriminative features for high dimensional clustering. However, due to the lack of cluster labels, the regularization methods developed for supervised feature selection can not be directly applied. To learn the pseudo labels and select the discriminative features simultaneously, we propose a new unsupervised feature selection method, named GlObal and Local information combined Feature Selection (GOLFS), for high dimensional clustering problems. The GOLFS algorithm combines both local geometric structure via manifold learning and global correlation structure of samples via regularized self-representation to select the discriminative features. The combination improves the accuracy of both feature selection and clustering by exploiting more comprehensive information. In addition, an iterative algorithm is proposed to solve the optimization problem and the convergency is proved. Simulations and two real data applications demonstrate the excellent finite-sample performance of GOLFS on both feature selection and clustering.
- Abstract(参考訳): 高次元クラスタリングにおける識別的特徴を特定することが重要である。
しかし、クラスタラベルの欠如により、教師付き特徴選択のために開発された正規化手法を直接適用することはできない。
擬似ラベルを学習し,識別的特徴を同時に選択するために,高次元クラスタリング問題に対して,GlObalとローカル情報を組み合わせた特徴選択法(GOLFS)を提案する。
GOLFSアルゴリズムは、多様体学習による局所幾何学構造と、正規化自己表現によるサンプルの大域的相関構造を組み合わせることにより、識別的特徴を選択する。
この組み合わせにより、より包括的な情報を活用することにより、機能選択とクラスタリングの両方の精度が向上する。
さらに、最適化問題を解くために反復アルゴリズムを提案し、収束性を証明する。
シミュレーションと2つの実データ応用は、特徴選択とクラスタリングの両方において、GOLFSの優れた有限サンプル性能を示す。
関連論文リスト
- CLIP Meets Diffusion: A Synergistic Approach to Anomaly Detection [54.85000884785013]
異常検出は、異常の定義の曖昧さ、異常型の多様性、トレーニングデータの不足による複雑な問題である。
識別的基盤モデルと生成的基礎モデルの両方を活用するCLIPfusionを提案する。
本手法は, 異常検出の多面的課題に対処する上で, マルチモーダル・マルチモデル融合の有効性を裏付けるものである。
論文 参考訳(メタデータ) (2025-06-13T13:30:15Z) - Bi-Level Unsupervised Feature Selection [11.383408944117804]
本稿では,クラスタリングレベルと特徴レベルを含む2レベル非教師付き特徴選択(BLUFS)手法を提案する。
クラスタリングレベルでは、スペクトルクラスタリングを用いてデータ構造を表現する擬似ラベルを生成し、連続線形回帰モデルを用いてプロジェクション行列を学習する。
機能レベルでは、$ell_2,0$-norm制約がプロジェクションマトリックスに課され、より効果的に機能を選択する。
論文 参考訳(メタデータ) (2025-05-26T22:52:31Z) - Adaptive and Robust DBSCAN with Multi-agent Reinforcement Learning [53.527506374566485]
本稿では,多エージェント強化学習クラスタフレームワーク,すなわちAR-DBSCANを用いた新しいAdaptive and Robust DBSCANを提案する。
我々は、AR-DBSCANが、NMIおよびARIメトリクスの最大144.1%と175.3%のクラスタリング精度を向上するだけでなく、支配的なパラメータを確実に見つけることができることを示した。
論文 参考訳(メタデータ) (2025-05-07T11:37:23Z) - Cascaded two-stage feature clustering and selection via separability and consistency in fuzzy decision systems [8.048511956662336]
特徴選択は、計算複雑性を減らし、モデルパフォーマンスを改善し、オーバーフィッティングのリスクを軽減することができるため、機械学習において重要なテクニックである。
本稿では,ファジィ決定システムのための2段階特徴クラスタリングと選択アルゴリズムを提案する。
提案アルゴリズムの有効性を18の公開データセットと現実世界の統合失調症データセットを用いて評価した。
論文 参考訳(メタデータ) (2024-07-22T02:44:32Z) - GLC++: Source-Free Universal Domain Adaptation through Global-Local Clustering and Contrastive Affinity Learning [84.54244771470012]
Source-Free Universal Domain Adaptation (SF-UniDA) は、共通カテゴリに属する「既知の」データを正確に分類することを目的としている。
本稿では,適応的な一対一のグローバルクラスタリングアルゴリズムを備えた新しいグローバル・ローカルクラスタリング(GLC)手法を提案する。
我々はGLCをGLC++に進化させ、対照的な親和性学習戦略を統合する。
論文 参考訳(メタデータ) (2024-03-21T13:57:45Z) - Feature Selection as Deep Sequential Generative Learning [50.00973409680637]
本研究では, 逐次再構成, 変分, 性能評価器の損失を伴って, 深部変分変圧器モデルを構築した。
提案モデルでは,特徴選択の知識を抽出し,連続的な埋め込み空間を学習し,特徴選択決定シーケンスをユーティリティスコアに関連付けられた埋め込みベクトルにマッピングする。
論文 参考訳(メタデータ) (2024-03-06T16:31:56Z) - Reinforcement Graph Clustering with Unknown Cluster Number [91.4861135742095]
本稿では,Reinforcement Graph Clusteringと呼ばれる新しいディープグラフクラスタリング手法を提案する。
提案手法では,クラスタ数決定と教師なし表現学習を統一的なフレームワークに統合する。
フィードバック動作を行うために、クラスタリング指向の報酬関数を提案し、同一クラスタの凝集を高め、異なるクラスタを分離する。
論文 参考訳(メタデータ) (2023-08-13T18:12:28Z) - Sparse and geometry-aware generalisation of the mutual information for joint discriminative clustering and feature selection [19.066989850964756]
GEMINIと呼ばれる相互情報の幾何を考慮した一般化を最大化しようとする識別クラスタリングモデルを導入する。
このアルゴリズムは,特徴探索の負担を回避し,識別クラスタリングモデルのみを設計しながら,高次元データや大量のサンプルに対して容易にスケーラブルである。
以上の結果から,Sparse GEMINIは競合アルゴリズムであり,関連基準や事前仮説を使わずに,クラスタリングに関して変数の関連するサブセットを選択することができることがわかった。
論文 参考訳(メタデータ) (2023-02-07T10:52:04Z) - Deep Attention-guided Graph Clustering with Dual Self-supervision [49.040136530379094]
デュアル・セルフ・スーパービジョン(DAGC)を用いたディープアテンション誘導グラフクラスタリング法を提案する。
我々は,三重項Kulback-Leibler分散損失を持つソフトな自己スーパービジョン戦略と,擬似的な監督損失を持つハードな自己スーパービジョン戦略からなる二重自己スーパービジョンソリューションを開発する。
提案手法は6つのベンチマークデータセットにおける最先端の手法より一貫して優れている。
論文 参考訳(メタデータ) (2021-11-10T06:53:03Z) - Attention-driven Graph Clustering Network [49.040136530379094]
我々は、注意駆動グラフクラスタリングネットワーク(AGCN)という新しいディープクラスタリング手法を提案する。
AGCNは、ノード属性特徴とトポロジグラフ特徴を動的に融合するために、不均一な融合モジュールを利用する。
AGCNは、教師なしの方法で特徴学習とクラスタ割り当てを共同で行うことができる。
論文 参考訳(メタデータ) (2021-08-12T02:30:38Z) - Adaptive Graph-based Generalized Regression Model for Unsupervised
Feature Selection [11.214334712819396]
非相関的かつ識別的特徴の選択は、教師なしの機能選択の重要な問題である。
非相関制約と $ell_2,1$-norm 正規化によって課される新しい一般化回帰モデルを提案する。
それは同時に同じ近所に属するこれらのデータ ポイントの分散を減らすこと無相関および差別的な特徴を選ぶことができます。
論文 参考訳(メタデータ) (2020-12-27T09:07:26Z) - Joint Adaptive Graph and Structured Sparsity Regularization for
Unsupervised Feature Selection [6.41804410246642]
本稿では,共同適応グラフと構造付き空間正規化unsupervised feature selection (JASFS)法を提案する。
最適な機能のサブセットがグループで選択され、選択された機能の数が自動的に決定される。
8つのベンチマーク実験の結果,提案手法の有効性と有効性を示した。
論文 参考訳(メタデータ) (2020-10-09T08:17:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。