論文の概要: Collaborative Learning of Semantic-Aware Feature Learning and Label Recovery for Multi-Label Image Recognition with Incomplete Labels
- arxiv url: http://arxiv.org/abs/2510.10055v1
- Date: Sat, 11 Oct 2025 06:43:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:29.755333
- Title: Collaborative Learning of Semantic-Aware Feature Learning and Label Recovery for Multi-Label Image Recognition with Incomplete Labels
- Title(参考訳): 不完全ラベルを用いた複数ラベル画像認識のための意味認識型特徴学習とラベル回復の協調学習
- Authors: Zhi-Fen He, Ren-Dong Xie, Bo Li, Bin Liu, Jin-Yan Hu,
- Abstract要約: 本稿では,セマンティック・アウェアな特徴学習とラベル・リカバリ手法の協調学習を提案する。
CLSLは,非完全ラベルを用いた最先端の多ラベル画像認識法よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 8.864897133482907
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-label image recognition with incomplete labels is a critical learning task and has emerged as a focal topic in computer vision. However, this task is confronted with two core challenges: semantic-aware feature learning and missing label recovery. In this paper, we propose a novel Collaborative Learning of Semantic-aware feature learning and Label recovery (CLSL) method for multi-label image recognition with incomplete labels, which unifies the two aforementioned challenges into a unified learning framework. More specifically, we design a semantic-related feature learning module to learn robust semantic-related features by discovering semantic information and label correlations. Then, a semantic-guided feature enhancement module is proposed to generate high-quality discriminative semantic-aware features by effectively aligning visual and semantic feature spaces. Finally, we introduce a collaborative learning framework that integrates semantic-aware feature learning and label recovery, which can not only dynamically enhance the discriminability of semantic-aware features but also adaptively infer and recover missing labels, forming a mutually reinforced loop between the two processes. Extensive experiments on three widely used public datasets (MS-COCO, VOC2007, and NUS-WIDE) demonstrate that CLSL outperforms the state-of-the-art multi-label image recognition methods with incomplete labels.
- Abstract(参考訳): 不完全ラベルを用いたマルチラベル画像認識は重要な学習課題であり、コンピュータビジョンにおいて焦点となるトピックとして現れてきた。
しかし、この課題はセマンティック・アウェアな特徴学習とラベル回復の欠如という2つの課題に直面している。
本稿では,これら2つの課題を統合学習フレームワークに統合した,非完全ラベル付きマルチラベル画像認識のための,意味認識型特徴学習とラベルリカバリ(CLSL)手法を提案する。
より具体的には,意味情報とラベル相関を見出すことにより,ロバストな意味関連特徴を学習するための意味関連特徴学習モジュールを設計する。
次に,視覚的特徴空間と意味的特徴空間を効果的に整合させて,高品質な識別的意味認識機能を生成するために,意味誘導機能拡張モジュールを提案する。
最後に、意味認識機能学習とラベルリカバリを統合した協調学習フレームワークを導入し、意味認識機能の特徴の識別性を動的に向上するだけでなく、欠落ラベルを適応的に推論・復元し、2つのプロセス間の相互強化ループを形成する。
広く使われている3つの公開データセット(MS-COCO、VOC2007、NAS-WIDE)の大規模な実験により、CLSLは不完全なラベルを持つ最先端のマルチラベル画像認識法よりも優れていることが示された。
関連論文リスト
- Exploring Partial Multi-Label Learning via Integrating Semantic Co-occurrence Knowledge [30.05176623784069]
部分的マルチラベル学習は、不完全な注釈付きデータから知識を抽出することを目的としている。
主な課題は、ラベルとインスタンス間のあいまいな関係を正確に識別することである。
本稿では,セマンティック・コレクレンス・インサイト・ネットワーク(SCINet)を提案する。
論文 参考訳(メタデータ) (2025-07-08T13:53:28Z) - Context-Based Semantic-Aware Alignment for Semi-Supervised Multi-Label Learning [37.13424985128905]
大規模な画像テキストペアで事前訓練された視覚言語モデルは、SSMLL設定下でのラベル付きデータ制限の課題を軽減することができる。
SSMLL問題を解くために,文脈に基づく意味認識アライメント手法を提案する。
論文 参考訳(メタデータ) (2024-12-25T09:06:54Z) - Multi-Label Contrastive Learning : A Comprehensive Study [48.81069245141415]
マルチラベルの分類は、研究と産業の両方において重要な領域として現れてきた。
対照的な学習をマルチラベル分類に適用することは、ユニークな課題である。
多様な環境における多ラベル分類のためのコントラスト学習損失の詳細な研究を行う。
論文 参考訳(メタデータ) (2024-11-27T20:20:06Z) - DualCoOp++: Fast and Effective Adaptation to Multi-Label Recognition
with Limited Annotations [79.433122872973]
低ラベル体制における多ラベル画像認識は、大きな課題と実践的重要性の課題である。
我々は、何百万もの補助的な画像テキストペアで事前訓練されたテキストと視覚的特徴の強力なアライメントを活用する。
Evidence-guided Dual Context Optimization (DualCoOp++) という,効率的かつ効果的なフレームワークを導入する。
論文 参考訳(メタデータ) (2023-08-03T17:33:20Z) - Semantic Contrastive Bootstrapping for Single-positive Multi-label
Recognition [36.3636416735057]
本研究では,意味的コントラスト型ブートストラップ法(Scob)を用いて,オブジェクト間の関係を徐々に回復する手法を提案する。
次に、アイコン的オブジェクトレベルの表現を抽出する再帰的セマンティックマスク変換器を提案する。
大規模な実験結果から,提案手法が最先端のモデルを超えていることが示唆された。
論文 参考訳(メタデータ) (2023-07-15T01:59:53Z) - Exploring Structured Semantic Prior for Multi Label Recognition with
Incomplete Labels [60.675714333081466]
不完全なラベルを持つマルチラベル認識(MLR)は非常に難しい。
最近の研究は、視覚言語モデルであるCLIPにおける画像とラベルの対応を探り、不十分なアノテーションを補うことを目指している。
我々は,MLRにおけるラベル管理の欠如を,構造化されたセマンティクスを導出することにより,不完全なラベルで修復することを提唱する。
論文 参考訳(メタデータ) (2023-03-23T12:39:20Z) - Learning Disentangled Label Representations for Multi-label
Classification [39.97251974500034]
One-Shared-Feature-for-Multiple-Labels (OFML) は識別ラベルの特徴を学習するのに役立ちません。
我々は,One-specific-Feature-for-One-Label(OFOL)機構を導入し,新しいアンタングル付きラベル特徴学習フレームワークを提案する。
8つのデータセットで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-12-02T21:49:34Z) - SSKD: Self-Supervised Knowledge Distillation for Cross Domain Adaptive
Person Re-Identification [25.96221714337815]
ドメイン適応型人物再識別(re-ID)は、ソースドメインとターゲットドメインの間に大きな違いがあるため、難しい課題である。
既存の手法は主にクラスタリングアルゴリズムによって未ラベルのターゲット画像の擬似ラベルを生成する。
本稿では,識別学習とソフトラベル学習の2つのモジュールを含む自己監督的知識蒸留(SSKD)手法を提案する。
論文 参考訳(メタデータ) (2020-09-13T10:12:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。