論文の概要: High-fidelity Pseudo-labels for Boosting Weakly-Supervised Segmentation
- arxiv url: http://arxiv.org/abs/2304.02621v1
- Date: Wed, 5 Apr 2023 17:43:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-06 11:57:56.456994
- Title: High-fidelity Pseudo-labels for Boosting Weakly-Supervised Segmentation
- Title(参考訳): 弱改良セグメンテーション強化のための高忠実擬似ラベル
- Authors: Arvi Jonnarth, Yushan Zhang, Michael Felsberg
- Abstract要約: 近年, 弱教師付きセマンティックセグメンテーション (WSSS) が普及している。
本稿では,従来のWSSS手法を効果的に強化するアドオン手法を提案する。
PASCAL VOCデータセットの実験では、大規模な設定でもパフォーマンスの向上が達成できる。
- 参考スコア(独自算出の注目度): 14.321459549557527
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The task of image-level weakly-supervised semantic segmentation (WSSS) has
gained popularity in recent years, as it reduces the vast data annotation cost
for training segmentation models. The typical approach for WSSS involves
training an image classification network using global average pooling (GAP) on
convolutional feature maps. This enables the estimation of object locations
based on class activation maps (CAMs), which identify the importance of image
regions. The CAMs are then used to generate pseudo-labels, in the form of
segmentation masks, to supervise a segmentation model in the absence of
pixel-level ground truth. In case of the SEAM baseline, a previous work
proposed to improve CAM learning in two ways: (1) Importance sampling, which is
a substitute for GAP, and (2) the feature similarity loss, which utilizes a
heuristic that object contours almost exclusively align with color edges in
images. In this work, we propose a different probabilistic interpretation of
CAMs for these techniques, rendering the likelihood more appropriate than the
multinomial posterior. As a result, we propose an add-on method that can boost
essentially any previous WSSS method, improving both the region similarity and
contour quality of all implemented state-of-the-art baselines. This is
demonstrated on a wide variety of baselines on the PASCAL VOC dataset.
Experiments on the MS COCO dataset show that performance gains can also be
achieved in a large-scale setting. Our code is available at
https://github.com/arvijj/hfpl.
- Abstract(参考訳): 画像レベルの弱い教師付きセマンティックセグメンテーション(wsss)のタスクは、近年、セグメンテーションモデルのトレーニングのための膨大なデータアノテーションコストを削減し、人気が高まっている。
WSSSの典型的なアプローチは、畳み込み特徴マップのグローバル平均プーリング(GAP)を用いた画像分類ネットワークのトレーニングである。
これにより、画像領域の重要性を識別するクラスアクティベーションマップ(CAM)に基づいて、オブジェクトの位置を推定できる。
CAMは、ピクセルレベルの基底真理が欠如しているセグメンテーションモデルを監督するために、セグメンテーションマスクの形で擬似ラベルを生成するために使用される。
SEAMベースラインの場合,(1)GAPの代替品である輸入サンプリング,(2)画像のカラーエッジにほぼ排他的に整合するヒューリスティックな特徴類似性損失の2つの方法により,CAM学習を改善するための先行研究が提案された。
本研究では,これらの手法に対して,camsの確率的解釈を異にする手法を提案する。
その結果,従来のWSSS手法を本質的に強化し,実装されたすべての技術ベースラインの領域類似性と輪郭品質を向上するアドオン手法を提案する。
これはPASCAL VOCデータセットの様々なベースラインで実証される。
MS COCOデータセットの実験では、大規模な環境でもパフォーマンスの向上が達成できる。
私たちのコードはhttps://github.com/arvijj/hfplで利用可能です。
関連論文リスト
- SSA-Seg: Semantic and Spatial Adaptive Pixel-level Classifier for Semantic Segmentation [11.176993272867396]
本稿ではセマンティック・空間適応(SSA-Seg)を提案し,セマンティックセグメンテーションの課題に対処する。
具体的には、固定されたプロトタイプから得られた粗いマスクを用いて、テスト画像のセマンティック領域と空間領域の中心に向けて固定されたプロトタイプを調整する。
その結果,提案したSSA-Segは,計算コストを最小限に抑えながら,ベースラインモデルのセグメンテーション性能を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2024-05-10T15:14:23Z) - A Lightweight Clustering Framework for Unsupervised Semantic
Segmentation [28.907274978550493]
教師なしセマンティックセグメンテーションは、注釈付きデータを用いることなく、画像の各ピクセルを対応するクラスに分類することを目的としている。
教師なしセマンティックセグメンテーションのための軽量クラスタリングフレームワークを提案する。
本フレームワークは,PASCAL VOCおよびMS COCOデータセットの最先端結果を実現する。
論文 参考訳(メタデータ) (2023-11-30T15:33:42Z) - Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - Deep Neural Networks Fused with Textures for Image Classification [20.58839604333332]
きめ細かい画像分類はコンピュータビジョンにおいて難しい課題である。
グローバルテクスチャと局所パッチ情報を組み合わせたFGICの融合手法を提案する。
提案手法は,有意なマージンを有する既存手法よりも高い分類精度を達成できた。
論文 参考訳(メタデータ) (2023-08-03T15:21:08Z) - CorrMatch: Label Propagation via Correlation Matching for
Semi-Supervised Semantic Segmentation [73.89509052503222]
本稿では、CorrMatchと呼ばれる、単純だが実行可能な半教師付きセマンティックセマンティックセマンティックセマンティクス手法を提案する。
相関写像は、同一カテゴリのクラスタリングピクセルを容易に実現できるだけでなく、良好な形状情報も含んでいることを観察する。
我々は,高信頼画素を拡大し,さらに掘り出すために,画素の対の類似性をモデル化して画素伝搬を行う。
そして、相関地図から抽出した正確なクラス非依存マスクを用いて、領域伝搬を行い、擬似ラベルを強化する。
論文 参考訳(メタデータ) (2023-06-07T10:02:29Z) - Learning Implicit Feature Alignment Function for Semantic Segmentation [51.36809814890326]
Implicit Feature Alignment Function (IFA)は、暗黙の神経表現の急速に拡大するトピックにインスパイアされている。
IFAは機能マップを異なるレベルで暗黙的に整列し、任意の解像度でセグメンテーションマップを生成することができることを示す。
提案手法は,様々なアーキテクチャの改善と組み合わせて,一般的なベンチマークにおける最先端の精度のトレードオフを実現する。
論文 参考訳(メタデータ) (2022-06-17T09:40:14Z) - Few-shot semantic segmentation via mask aggregation [5.886986014593717]
セマンティックセグメンテーションは、ラベル付きデータが少ない新しいクラスを認識することを目的としている。
従来の研究では、これをピクセル単位の分類問題と見なしていた。
この問題に対処するためのマスクベースの分類手法を提案する。
論文 参考訳(メタデータ) (2022-02-15T07:13:09Z) - Weakly-Supervised Semantic Segmentation with Visual Words Learning and
Hybrid Pooling [38.336345235423586]
画像レベルのラベルを持つWSSS(Weakly Supervised Semantic Activation)メソッドは、一般的に分類ネットワークをトレーニングして、初期粗いセグメンテーションラベルとしてクラスマップ(CAM)を生成する。
これら2つの問題は、分類ネットワークのトレーニングにおいて、画像レベルの監督とグローバル情報の集約のみに起因する。
本研究では,視覚単語学習モジュールとハイブリッドプーリング手法を提案し,これらを分類ネットワークに組み込んで上記の問題を緩和する。
論文 参考訳(メタデータ) (2022-02-10T03:19:08Z) - Semantic Distribution-aware Contrastive Adaptation for Semantic
Segmentation [50.621269117524925]
ドメイン適応セマンティックセグメンテーション(ドメイン適応セマンティックセグメンテーション)とは、特定のソースドメインのアノテーションだけで特定のターゲットドメイン上で予測を行うことを指す。
画素ワイド表示アライメントを可能にする意味分布対応コントラスト適応アルゴリズムを提案する。
複数のベンチマークでSDCAを評価し、既存のアルゴリズムを大幅に改善します。
論文 参考訳(メタデータ) (2021-05-11T13:21:25Z) - Semantic Segmentation with Generative Models: Semi-Supervised Learning
and Strong Out-of-Domain Generalization [112.68171734288237]
本論文では,画像とラベルの再生モデルを用いた識別画素レベルのタスクのための新しいフレームワークを提案する。
我々は,共同画像ラベルの分布を捕捉し,未ラベル画像の大規模な集合を用いて効率的に訓練する生成的対向ネットワークを学習する。
ドメイン内性能をいくつかのベースラインと比較し,ドメイン外一般化を極端に示す最初の例である。
論文 参考訳(メタデータ) (2021-04-12T21:41:25Z) - Seed the Views: Hierarchical Semantic Alignment for Contrastive
Representation Learning [116.91819311885166]
一つの画像から生成されたビューをtextbfCross-samples や Multi-level representation に拡張することで,階層的なセマンティックアライメント戦略を提案する。
提案手法はCsMlと呼ばれ,サンプル間の多層視覚表現を堅牢な方法で統合する機能を備えている。
論文 参考訳(メタデータ) (2020-12-04T17:26:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。