論文の概要: Semantic Contrastive Bootstrapping for Single-positive Multi-label
Recognition
- arxiv url: http://arxiv.org/abs/2307.07680v1
- Date: Sat, 15 Jul 2023 01:59:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-18 18:38:21.959204
- Title: Semantic Contrastive Bootstrapping for Single-positive Multi-label
Recognition
- Title(参考訳): シングル陽性マルチラベル認識のためのセマンティックコントラストブートストラップ
- Authors: Cheng Chen, Yifan Zhao, Jia Li
- Abstract要約: 本研究では,意味的コントラスト型ブートストラップ法(Scob)を用いて,オブジェクト間の関係を徐々に回復する手法を提案する。
次に、アイコン的オブジェクトレベルの表現を抽出する再帰的セマンティックマスク変換器を提案する。
大規模な実験結果から,提案手法が最先端のモデルを超えていることが示唆された。
- 参考スコア(独自算出の注目度): 36.3636416735057
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning multi-label image recognition with incomplete annotation is gaining
popularity due to its superior performance and significant labor savings when
compared to training with fully labeled datasets. Existing literature mainly
focuses on label completion and co-occurrence learning while facing
difficulties with the most common single-positive label manner. To tackle this
problem, we present a semantic contrastive bootstrapping (Scob) approach to
gradually recover the cross-object relationships by introducing class
activation as semantic guidance. With this learning guidance, we then propose a
recurrent semantic masked transformer to extract iconic object-level
representations and delve into the contrastive learning problems on multi-label
classification tasks. We further propose a bootstrapping framework in an
Expectation-Maximization fashion that iteratively optimizes the network
parameters and refines semantic guidance to alleviate possible disturbance
caused by wrong semantic guidance. Extensive experimental results demonstrate
that the proposed joint learning framework surpasses the state-of-the-art
models by a large margin on four public multi-label image recognition
benchmarks. Codes can be found at https://github.com/iCVTEAM/Scob.
- Abstract(参考訳): 不完全なアノテーションによるマルチラベル画像認識の学習は、完全なラベル付きデータセットでのトレーニングに比べて優れたパフォーマンスと大幅な労力削減によって人気を集めている。
既存の文献は主にラベルの完成と共起学習に重点を置いており、最も一般的な単一陽性のラベルの手法では困難に直面している。
そこで本研究では,クラスアクティベーションをセマンティックガイダンスとして導入することにより,オブジェクト間の関係を徐々に回復するセマンティック・コントラッシブ・ブートストラップ(Scob)手法を提案する。
この学習指導により,多段分類タスクにおいて,代表的オブジェクトレベル表現を抽出し,コントラスト学習問題に取り込むために,再帰的な意味マスクトランスフォーマを提案する。
さらに、ネットワークパラメータを反復的に最適化し、セマンティックガイダンスの誤りによる障害を軽減するためにセマンティックガイダンスを改良する期待最大化方式のブートストラップフレームワークを提案する。
広範な実験結果から,提案手法は4つの公開マルチラベル画像認識ベンチマークにおいて,最先端モデルを大きく上回っていることが示された。
コードはhttps://github.com/iCVTEAM/Scob.comにある。
関連論文リスト
- DualCoOp++: Fast and Effective Adaptation to Multi-Label Recognition
with Limited Annotations [79.433122872973]
低ラベル体制における多ラベル画像認識は、大きな課題と実践的重要性の課題である。
我々は、何百万もの補助的な画像テキストペアで事前訓練されたテキストと視覚的特徴の強力なアライメントを活用する。
Evidence-guided Dual Context Optimization (DualCoOp++) という,効率的かつ効果的なフレームワークを導入する。
論文 参考訳(メタデータ) (2023-08-03T17:33:20Z) - Exploring Structured Semantic Prior for Multi Label Recognition with
Incomplete Labels [60.675714333081466]
不完全なラベルを持つマルチラベル認識(MLR)は非常に難しい。
最近の研究は、視覚言語モデルであるCLIPにおける画像とラベルの対応を探り、不十分なアノテーションを補うことを目指している。
我々は,MLRにおけるラベル管理の欠如を,構造化されたセマンティクスを導出することにより,不完全なラベルで修復することを提唱する。
論文 参考訳(メタデータ) (2023-03-23T12:39:20Z) - Class Enhancement Losses with Pseudo Labels for Zero-shot Semantic
Segmentation [40.09476732999614]
マスクの提案モデルは、ゼロショットセマンティックセグメンテーションの性能を大幅に改善した。
トレーニング中にバックグラウンドを埋め込むことは問題であり、結果として得られたモデルが過剰に学習し、正しいラベルではなく、すべての見えないクラスをバックグラウンドクラスとして割り当てる傾向がある。
本稿では,学習中の背景埋め込みの使用を回避し,テキスト埋め込みとマスク提案のセマンティックな関係を類似度スコアのランク付けにより活用する新しいクラス拡張損失を提案する。
論文 参考訳(メタデータ) (2023-01-18T06:55:02Z) - Dense Contrastive Visual-Linguistic Pretraining [53.61233531733243]
画像とテキストを共同で表現するマルチモーダル表現学習手法が提案されている。
これらの手法は,大規模マルチモーダル事前学習から高レベルな意味情報を取得することにより,優れた性能を実現する。
そこで本稿では,非バイアスのDense Contrastive Visual-Linguistic Pretrainingを提案する。
論文 参考訳(メタデータ) (2021-09-24T07:20:13Z) - Leveraging Auxiliary Tasks with Affinity Learning for Weakly Supervised
Semantic Segmentation [88.49669148290306]
そこで我々はAuxSegNetと呼ばれる弱教師付きマルチタスク・フレームワークを提案し,サリエンシ検出とマルチラベル画像分類を補助タスクとして活用する。
同様の構造的セマンティクスに着想を得て,サリエンシとセグメンテーションの表現から,クロスタスクなグローバル画素レベルの親和性マップを学習することを提案する。
学習されたクロスタスク親和性は、両方のタスクに対して改善された擬似ラベルを提供するために、唾液度予測を洗練し、CAMマップを伝播するために使用することができる。
論文 参考訳(メタデータ) (2021-07-25T11:39:58Z) - Multi-Label Image Classification with Contrastive Learning [57.47567461616912]
コントラスト学習の直接適用は,複数ラベルの場合においてほとんど改善できないことを示す。
完全教師付き環境下でのコントラスト学習を用いたマルチラベル分類のための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-07-24T15:00:47Z) - Open-Set Representation Learning through Combinatorial Embedding [62.05670732352456]
ラベル付きクラスとラベルなしクラスの両方の例に基づく表現学習を通じて、データセットにおける新しい概念を識別することに興味がある。
異種ラベル空間上の複数の教師付きメタクラス分類器によって与えられる構成知識を用いて、自然に未知のクラス内のサンプルをクラスタリングする学習手法を提案する。
提案アルゴリズムは,未確認クラスの識別性の向上と,新しいクラスに一般化可能な既知のクラス表現の学習を併用して,新しい概念を探索する。
論文 参考訳(メタデータ) (2021-06-29T11:51:57Z) - Towards Cross-Granularity Few-Shot Learning: Coarse-to-Fine
Pseudo-Labeling with Visual-Semantic Meta-Embedding [13.063136901934865]
少ないショットラーニングは、テスト時に少数のサンプルしか持たない、新しいカテゴリに迅速に適応することを目的としている。
本稿では,より困難なシナリオ,すなわちクロスグラニュラリティ・グラニュラリティ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラ
画像埋め込みの類似性に応じて,各粗いクラスを擬似微細クラスにグリーディクラスタリングすることで,詳細なデータ分布を近似する。
論文 参考訳(メタデータ) (2020-07-11T03:44:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。