論文の概要: Bringing Clustering to MLL: Weakly-Supervised Clustering for Partial Multi-Label Learning
- arxiv url: http://arxiv.org/abs/2604.09359v1
- Date: Fri, 10 Apr 2026 14:31:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.90376
- Title: Bringing Clustering to MLL: Weakly-Supervised Clustering for Partial Multi-Label Learning
- Title(参考訳): MLLにクラスタリングを導入する - 部分的マルチラベル学習のための弱スーパービジョンクラスタリング
- Authors: Yu Chen, Weijun Lv, Yue Huang, Xuhuan Zhu, Fang Li,
- Abstract要約: PML(WSC-PML)のための新しいクラスタリング手法を提案する。
クラスタリングメンバシップ行列 $mathbfA$ を2つのコンポーネントに分解する: $mathbfA = mathbf odot mathbfF$。
この分解により、教師なしクラスタリングのシームレスな統合と、効果的なラベルノイズハンドリングのためのマルチラベル監視が可能となる。
- 参考スコア(独自算出の注目度): 17.455160786776336
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Label noise in multi-label learning (MLL) poses significant challenges for model training, particularly in partial multi-label learning (PML) where candidate labels contain both relevant and irrelevant labels. While clustering offers a natural approach to exploit data structure for noise identification, traditional clustering methods cannot be directly applied to multi-label scenarios due to a fundamental incompatibility: clustering produces membership values that sum to one per instance, whereas multi-label assignments require binary values that can sum to any number. We propose a novel weakly-supervised clustering approach for PML (WSC-PML) that bridges clustering and multi-label learning through membership matrix decomposition. Our key innovation decomposes the clustering membership matrix $\mathbf{A}$ into two components: $\mathbf{A} = \mathbfΠ \odot \mathbf{F}$, where $\mathbfΠ$ maintains clustering constraints while $\mathbf{F}$ preserves multi-label characteristics. This decomposition enables seamless integration of unsupervised clustering with multi-label supervision for effective label noise handling. WSC-PML employs a three-stage process: initial prototype learning from noisy labels, adaptive confidence-based weak supervision construction, and joint optimization via iterative clustering refinement. Extensive experiments on 24 datasets demonstrate that our approach outperforms six state-of-the-art methods across all evaluation metrics.
- Abstract(参考訳): 多ラベル学習(MLL)におけるラベルノイズは、モデルトレーニング、特に、関連するラベルと無関係ラベルの両方を含む候補ラベルを含む部分的多ラベル学習(PML)において重要な課題となる。
クラスタリングは、ノイズ識別のためにデータ構造を利用する自然なアプローチを提供するが、従来のクラスタリング手法は、基本的な非互換性のため、マルチラベルのシナリオに直接適用することはできない。
本稿では,PML (WSC-PML) のためのクラスタリング手法を提案する。
我々の重要な革新は、クラスタリングメンバシップ行列 $\mathbf{A}$ を2つのコンポーネントに分解する: $\mathbf{A} = \mathbf\odot \mathbf{F}$ ここで、$\mathbf{F}$ はクラスタリング制約を維持し、$\mathbf{F}$ はマルチラベル特性を保存する。
この分解により、教師なしクラスタリングのシームレスな統合と、効果的なラベルノイズハンドリングのためのマルチラベル監視が可能となる。
WSC-PMLは、ノイズラベルからの初期のプロトタイプ学習、適応的信頼に基づく弱い監督構築、反復的クラスタリングによる共同最適化という3段階のプロセスを採用している。
24のデータセットに対する大規模な実験により、我々の手法はすべての評価指標で6つの最先端の手法より優れていることが示された。
関連論文リスト
- Feature-Label Modal Alignment for Robust Partial Multi-Label Learning [66.1611192892514]
特徴ラベルアライメント(PML-MA)に基づく新しいPML手法を提案する。
PML-MAは特徴とラベルを2つの相補的なモダリティとして扱い、体系的なアライメントを通じて一貫性を回復する。
実世界のデータセットと合成データセットの両方の実験では、PML-MAが最先端の手法を大幅に上回っていることが示されている。
論文 参考訳(メタデータ) (2026-04-10T07:44:46Z) - ESMC: MLLM-Based Embedding Selection for Explainable Multiple Clustering [79.69917150582633]
MLLM(Multi-modal large language model)は、ユーザ主導のクラスタリングを実現するために利用することができる。
本手法はまず,MLLMのテキストトークンの隠蔽状態が対応する特徴と強く関連していることを明らかにする。
また、擬似ラベル学習を付加した軽量クラスタリングヘッドを採用し、クラスタリング精度を大幅に向上させた。
論文 参考訳(メタデータ) (2025-11-30T04:36:51Z) - Partial Label Clustering [26.94926680877357]
部分ラベル学習(Partial label learning, PLL)は、かなり弱い教師付き学習フレームワークである。
本稿では,クラスタリング性能を向上させるために,限られた部分ラベルを利用する部分ラベル問題について検討する。
論文 参考訳(メタデータ) (2025-05-06T05:43:55Z) - Double-Stage Feature-Level Clustering-Based Mixture of Experts Framework [0.0]
本稿では,DFCP-MoE(Mixture of Experts)フレームワークについて述べる。
入力特徴抽出、特徴レベルのクラスタリング、計算効率の良い擬似ラベル戦略で構成されている。
そこで本研究では,MoEモデルを用いたクラスタリング入力の訓練により,専門家の専門性を向上する条件付きエンドツーエンド共同訓練手法を提案する。
論文 参考訳(メタデータ) (2025-03-12T16:13:50Z) - Label Cluster Chains for Multi-Label Classification [2.072831155509228]
マルチラベル分類は、複数のラベルをインスタンスに同時に割り当てることができる教師付き機械学習の一種である。
そこで本稿では,ラベル空間に分割法を適用して得られた解離相関ラベルクラスタをチェーンする手法を提案する。
提案手法は,学習と連鎖が相関するラベルクラスタをよりよく探索し,ラベル相関を学習できることを示唆する。
論文 参考訳(メタデータ) (2024-11-01T11:16:37Z) - Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。
クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。
提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-30T00:32:47Z) - Revisiting Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [85.51611950757643]
IAC (Instance-Adaptive Clustering, インスタンス適応クラスタリング) を提案する。
IACは$ MathcalO(n, textpolylog(n) $の計算複雑性を維持しており、大規模問題に対してスケーラブルで実用的なものである。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - Rethinking Clustering-Based Pseudo-Labeling for Unsupervised
Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。
このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。
このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文 参考訳(メタデータ) (2022-09-27T19:04:36Z) - Meta Clustering Learning for Large-scale Unsupervised Person
Re-identification [124.54749810371986]
メタクラスタリング学習(MCL)と呼ばれる「大規模タスクのための小さなデータ」パラダイムを提案する。
MCLは、第1フェーズのトレーニングのためにコンピューティングを節約するためにクラスタリングを介して、未ラベルデータのサブセットを擬似ラベル付けするのみである。
提案手法は計算コストを大幅に削減すると同時に,従来よりも優れた性能を実現している。
論文 参考訳(メタデータ) (2021-11-19T04:10:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。