論文の概要: SLAM: Semantic Learning based Activation Map for Weakly Supervised
Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2210.12417v1
- Date: Sat, 22 Oct 2022 11:17:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-25 17:21:40.889702
- Title: SLAM: Semantic Learning based Activation Map for Weakly Supervised
Semantic Segmentation
- Title(参考訳): SLAM:弱い教師付きセマンティックセグメンテーションのための意味学習に基づくアクティベーションマップ
- Authors: Junliang Chen, Xiaodong Zhao, Minmin Liu, Linlin Shen
- Abstract要約: SLAM(Semantic Learning based Activation Map)と呼ばれるWSSSのための新しい意味学習ベースのフレームワークを提案する。
まず、各オブジェクトカテゴリのセマンティックスを学習し、入力画像からカテゴリ固有のセマンティック埋め込みを抽出する意味エンコーダを設計する。
アクティベーションマップの正確性、完全性、コンパクト性、整合性を保証するため、4つの損失関数、すなわち、カテゴリ地上、カテゴリ背景、アクティベーション正規化、一貫性損失が提案される。
- 参考スコア(独自算出の注目度): 34.996841532954925
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent mainstream weakly-supervised semantic segmentation (WSSS) approaches
based on image-level annotations mainly relies on binary image-level
classification with limited representation capacity. In this paper, we propose
a novel semantic learning based framework for WSSS, named SLAM (Semantic
Learning based Activation Map). We firstly design a semantic encoder to learn
semantics of each object category and extract category-specific semantic
embeddings from an input image. The semantic embeddings of foreground and
background are then integrated to a segmentation network to learn the
activation map. Four loss functions, i.e, category-foreground,
category-background, activation regularization, and consistency loss are
proposed to ensure the correctness, completeness, compactness and consistency
of the activation map. Experimental results show that our semantic learning
based SLAM achieves much better performance than binary image-level
classification based approaches, i.e., around 3\% mIoU higher than OC-CSE
\cite{occse}, CPN \cite{cpn} on PASCAL VOC dataset. Our SLAM also surpasses AMN
\cite{amn} trained with strong per-pixel constraint and CLIMS \cite{clims}
utilizing extra multi-modal knowledge. Code will be made available.
- Abstract(参考訳): 画像レベルのアノテーションに基づく近年の主流であるWSSSアプローチは、表現能力に制限のあるバイナリ画像レベルの分類に大きく依存している。
本稿では, SLAM (Semantic Learning based Activation Map) という,WSSSのための新しい意味学習ベースのフレームワークを提案する。
まず,各対象カテゴリのセマンティクスを学習し,入力画像からカテゴリ固有のセマンティクス埋め込みを抽出するセマンティクスエンコーダを設計する。
前景と背景のセマンティック埋め込みは、活性化マップを学ぶためにセグメンテーションネットワークに統合される。
アクティベーションマップの正当性,完全性,コンパクト性,整合性を確保するため, 4つの損失関数,すなわち, カテゴリ地上, カテゴリ背景, アクティベーション正規化, 一貫性損失を提案する。
実験結果から, 意味学習に基づくSLAMは, PASCAL VOCデータセット上で, OC-CSE \cite{occse}, CPN \cite{cpn} よりも約3\% mIoU高い精度で, バイナリ画像レベルの分類に基づくアプローチよりもはるかに優れた性能が得られることが示された。
私たちのSLAMは、強いピクセル単位の制約で訓練されたAMN \cite{amn} や、余分なマルチモーダル知識を利用した CLIMS \cite{clims} も越えています。
コードは利用可能になる。
関連論文リスト
- Auxiliary Tasks Enhanced Dual-affinity Learning for Weakly Supervised
Semantic Segmentation [79.05949524349005]
AuxSegNet+は、サリエンシマップから豊富な情報を探索する弱教師付き補助学習フレームワークである。
また,サリエンシとセグメンテーションの特徴マップから画素レベルの親和性を学習するためのクロスタスク親和性学習機構を提案する。
論文 参考訳(メタデータ) (2024-03-02T10:03:21Z) - SemPLeS: Semantic Prompt Learning for Weakly-Supervised Semantic
Segmentation [36.41778553250247]
Weakly-Supervised Semantic (WSSS) は、画像レベルの監督のみで画像データを用いてセグメンテーションモデルを訓練することを目的としている。
本稿では,CLIP潜伏空間を効果的に促進するためのWSSS(Semantic Prompt Learning for WSSS)フレームワークを提案する。
SemPLeSはオブジェクト領域と関連するクラスラベル間のセマンティックアライメントを改善することができる。
論文 参考訳(メタデータ) (2024-01-22T09:41:05Z) - Advancing Incremental Few-shot Semantic Segmentation via Semantic-guided
Relation Alignment and Adaptation [98.51938442785179]
増分的な数ショットセマンティックセマンティックセマンティクスは、セマンティクスセマンティクスモデルを新しいクラスに漸進的に拡張することを目的としている。
このタスクは、データ不均衡のため、ベースクラスと新しいクラスの間で深刻な意味認識の問題に直面します。
本稿では,従来の意味情報のガイダンスを完全に考慮した意味誘導型関係調整適応法を提案する。
論文 参考訳(メタデータ) (2023-05-18T10:40:52Z) - ISLE: A Framework for Image Level Semantic Segmentation Ensemble [5.137284292672375]
従来のセマンティックセグメンテーションネットワークは、最先端の予測品質に到達するために、大量のピクセル単位のアノテートラベルを必要とする。
クラスレベルで異なるセマンティックセグメンテーション手法のセットに「擬似ラベル」のアンサンブルを用いるISLEを提案する。
私たちはISLEの個々のコンポーネントよりも2.4%改善しています。
論文 参考訳(メタデータ) (2023-03-14T13:36:36Z) - Semantic Representation and Dependency Learning for Multi-Label Image
Recognition [76.52120002993728]
本稿では,各カテゴリのカテゴリ固有のセマンティック表現を学習するための,新しい,効果的なセマンティック表現と依存性学習(SRDL)フレームワークを提案する。
具体的には,カテゴリー別注意領域(CAR)モジュールを設計し,チャネル/空間的注意行列を生成してモデルを導出する。
また、カテゴリ間のセマンティック依存を暗黙的に学習するオブジェクト消去(OE)モジュールを設計し、セマンティック認識領域を消去する。
論文 参考訳(メタデータ) (2022-04-08T00:55:15Z) - A Simple Baseline for Zero-shot Semantic Segmentation with Pre-trained
Vision-language Model [61.58071099082296]
オブジェクト検出やセマンティックセグメンテーションといった、より広範な視覚問題に対して、ゼロショット認識をどのようにうまく機能させるかは定かではない。
本稿では,既訓練の視覚言語モデルであるCLIPを用いて,ゼロショットセマンティックセマンティックセマンティックセマンティクスを構築することを目的とした。
実験結果から, この単純なフレームワークは, 従来の最先端をはるかに上回っていることが明らかとなった。
論文 参考訳(メタデータ) (2021-12-29T18:56:18Z) - Leveraging Auxiliary Tasks with Affinity Learning for Weakly Supervised
Semantic Segmentation [88.49669148290306]
そこで我々はAuxSegNetと呼ばれる弱教師付きマルチタスク・フレームワークを提案し,サリエンシ検出とマルチラベル画像分類を補助タスクとして活用する。
同様の構造的セマンティクスに着想を得て,サリエンシとセグメンテーションの表現から,クロスタスクなグローバル画素レベルの親和性マップを学習することを提案する。
学習されたクロスタスク親和性は、両方のタスクに対して改善された擬似ラベルを提供するために、唾液度予測を洗練し、CAMマップを伝播するために使用することができる。
論文 参考訳(メタデータ) (2021-07-25T11:39:58Z) - Mining Cross-Image Semantics for Weakly Supervised Semantic Segmentation [128.03739769844736]
2つのニューラルコアテンションを分類器に組み込んで、画像間のセマンティックな類似点と相違点をキャプチャする。
オブジェクトパターン学習の強化に加えて、コアテンションは他の関連する画像からのコンテキストを活用して、ローカライズマップの推論を改善することができる。
提案アルゴリズムは,これらすべての設定に対して新たな最先端性を設定し,その有効性と一般化性を示す。
論文 参考訳(メタデータ) (2020-07-03T21:53:46Z) - Discovering Latent Classes for Semi-Supervised Semantic Segmentation [18.5909667833129]
本稿では,半教師付きセマンティックセグメンテーションの問題について検討する。
ラベル付き画像のセマンティッククラスと一致した潜在クラスを学習する。
提案手法は,半教師付きセマンティックセグメンテーションのための技術結果の状態を達成している。
論文 参考訳(メタデータ) (2019-12-30T14:16:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。