論文の概要: i-IF-Learn: Iterative Feature Selection and Unsupervised Learning for High-Dimensional Complex Data
- arxiv url: http://arxiv.org/abs/2603.24025v1
- Date: Wed, 25 Mar 2026 07:35:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-26 21:06:11.18498
- Title: i-IF-Learn: Iterative Feature Selection and Unsupervised Learning for High-Dimensional Complex Data
- Title(参考訳): i-IF-Learn:高次元複素データに対する反復的特徴選択と教師なし学習
- Authors: Chen Ma, Wanjie Wang, Shuhao Fan,
- Abstract要約: i-IF-Learnは、機能選択とクラスタリングを共同で実行する教師なしのフレームワークである。
我々の中心となる革新は、擬似ラベル監視と教師なし信号とを効果的に組み合わせた適応的特徴選択統計である。
遺伝子マイクロアレイと単細胞RNA-seqデータセットの実験により、i-IF-Learnは古典的および深層クラスタリングベースラインを著しく超えることが示された。
- 参考スコア(独自算出の注目度): 5.761834753104483
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unsupervised learning of high-dimensional data is challenging due to irrelevant or noisy features obscuring underlying structures. It's common that only a few features, called the influential features, meaningfully define the clusters. Recovering these influential features is helpful in data interpretation and clustering. We propose i-IF-Learn, an iterative unsupervised framework that jointly performs feature selection and clustering. Our core innovation is an adaptive feature selection statistic that effectively combines pseudo-label supervision with unsupervised signals, dynamically adjusting based on intermediate label reliability to mitigate error propagation common in iterative frameworks. Leveraging low-dimensional embeddings (PCA or Laplacian eigenmaps) followed by $k$-means, i-IF-Learn simultaneously outputs influential feature subset and clustering labels. Numerical experiments on gene microarray and single-cell RNA-seq datasets show that i-IF-Learn significantly surpasses classical and deep clustering baselines. Furthermore, using our selected influential features as preprocessing substantially enhances downstream deep models such as DeepCluster, UMAP, and VAE, highlighting the importance and effectiveness of targeted feature selection.
- Abstract(参考訳): 高次元データの教師なし学習は、基礎構造を隠蔽する無関係な、またはノイズの多い特徴のために困難である。
影響のある機能と呼ばれるいくつかの機能だけが、クラスタを有意義に定義するのが一般的です。
これらの影響のある機能を回復することは、データの解釈とクラスタリングに役立ちます。
i-IF-Learnは,機能選択とクラスタリングを共同で行う,反復的かつ教師なしのフレームワークである。
我々の中核的な革新は、擬似ラベル監視と教師なし信号とを効果的に組み合わせ、中間ラベルの信頼性に基づいて動的に調整し、反復的フレームワークに共通するエラーの伝播を緩和する適応的特徴選択統計である。
低次元埋め込み (PCA またはラプラシア固有写像) と $k$-means を併用すると、i-IF-Learn は影響のある特徴部分集合とクラスタリングラベルを同時に出力する。
遺伝子マイクロアレイと単細胞RNA-seqデータセットの数値実験により、i-IF-Learnは古典的および深層クラスタリングベースラインを著しく超えることが示された。
さらに、選択した影響力のある特徴を前処理として利用することで、DeepCluster、UMAP、VAEといった下流の深層モデルを大幅に強化し、ターゲットとなる特徴選択の重要性と有効性を強調します。
関連論文リスト
- Unsupervised Feature Selection via Robust Autoencoder and Adaptive Graph Learning [4.371255245299254]
教師なし機能選択(UFS)は、データを同時にクラスタ化し、最も識別しやすい特徴を特定することを目的としている。
本稿では, ディープオートエンコーダを利用して非線形特徴表現を学習するロバスト・オートエンコーダに基づくunsupervised Feature Selection (RAEUFS)モデルを提案する。
提案手法は, クリーンかつ外部に汚染されたデータ設定において, 最先端のUFSアプローチより優れる。
論文 参考訳(メタデータ) (2025-12-21T12:42:37Z) - You Can Trust Your Clustering Model: A Parameter-free Self-Boosting Plug-in for Deep Clustering [73.48306836608124]
DCBoostはパラメータフリーのプラグインで、現在のディープクラスタリングモデルのグローバルな特徴構造を強化するように設計されている。
本手法は, クラスタリング性能を効果的に向上することを目的としている。
論文 参考訳(メタデータ) (2025-11-26T09:16:36Z) - GOLFS: Feature Selection via Combining Both Global and Local Information for High Dimensional Clustering [10.740524877905685]
GlObalとローカル情報を組み合わせた特徴選択法(GOLFS)を提案する。
GOLFSは、多様体学習による局所幾何学構造と、サンプルの大域的相関構造を組み合わせて、識別的特徴を選択する。
この組み合わせにより、より包括的な情報を活用することにより、機能選択とクラスタリングの両方の精度が向上する。
論文 参考訳(メタデータ) (2025-07-15T03:39:07Z) - Collaborative Feature-Logits Contrastive Learning for Open-Set Semi-Supervised Object Detection [75.02249869573994]
オープンセットのシナリオでは、ラベルなしデータセットには、イン・ディストリビューション(ID)クラスとアウト・オブ・ディストリビューション(OOD)クラスの両方が含まれている。
このような設定で半教師付き検出器を適用すると、OODクラスをIDクラスとして誤分類する可能性がある。
我々は、CFL-Detector(Collaborative Feature-Logits Detector)と呼ばれるシンプルで効果的な方法を提案する。
論文 参考訳(メタデータ) (2024-11-20T02:57:35Z) - Adaptive Self-supervised Robust Clustering for Unstructured Data with Unknown Cluster Number [12.926206811876174]
適応型自己教師型ロバストクラスタリング(Adaptive Self-supervised Robust Clustering, ASRC)と呼ばれる非構造化データに適した,新たな自己教師型ディープクラスタリング手法を提案する。
ASRCはグラフ構造とエッジ重みを適応的に学習し、局所構造情報と大域構造情報の両方をキャプチャする。
ASRCは、クラスタ数の事前知識に依存するメソッドよりも優れており、非構造化データのクラスタリングの課題に対処する上での有効性を強調している。
論文 参考訳(メタデータ) (2024-07-29T15:51:09Z) - Dynamic Clustering and Cluster Contrastive Learning for Unsupervised
Person Re-identification [29.167783500369442]
教師なしRe-ID手法は、ラベルのないデータから堅牢で差別的な特徴を学習することを目的としている。
本稿では,動的クラスタリングとクラスタコントラスト学習(DCCC)手法を提案する。
提案したDCCCの有効性を検証するために, 広く利用されている複数の公開データセットの実験を行った。
論文 参考訳(メタデータ) (2023-03-13T01:56:53Z) - Deep Attention-guided Graph Clustering with Dual Self-supervision [49.040136530379094]
デュアル・セルフ・スーパービジョン(DAGC)を用いたディープアテンション誘導グラフクラスタリング法を提案する。
我々は,三重項Kulback-Leibler分散損失を持つソフトな自己スーパービジョン戦略と,擬似的な監督損失を持つハードな自己スーパービジョン戦略からなる二重自己スーパービジョンソリューションを開発する。
提案手法は6つのベンチマークデータセットにおける最先端の手法より一貫して優れている。
論文 参考訳(メタデータ) (2021-11-10T06:53:03Z) - Attention-driven Graph Clustering Network [49.040136530379094]
我々は、注意駆動グラフクラスタリングネットワーク(AGCN)という新しいディープクラスタリング手法を提案する。
AGCNは、ノード属性特徴とトポロジグラフ特徴を動的に融合するために、不均一な融合モジュールを利用する。
AGCNは、教師なしの方法で特徴学習とクラスタ割り当てを共同で行うことができる。
論文 参考訳(メタデータ) (2021-08-12T02:30:38Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - New advances in enumerative biclustering algorithms with online
partitioning [80.22629846165306]
さらに、数値データセットの列に定数値を持つ最大二クラスタの効率的で完全で正しい非冗長列挙を実現できる二クラスタリングアルゴリズムであるRIn-Close_CVCを拡張した。
改良されたアルゴリズムはRIn-Close_CVC3と呼ばれ、RIn-Close_CVCの魅力的な特性を保ちます。
論文 参考訳(メタデータ) (2020-03-07T14:54:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。