論文の概要: Top-K Pooling with Patch Contrastive Learning for Weakly-Supervised
Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2310.09828v2
- Date: Wed, 27 Dec 2023 11:40:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-29 22:13:26.748926
- Title: Top-K Pooling with Patch Contrastive Learning for Weakly-Supervised
Semantic Segmentation
- Title(参考訳): 弱教師付きセマンティックセグメンテーションのためのパッチコントラスト学習によるトップKプーリング
- Authors: Wangyu Wu, Tianhong Dai, Xiaowei Huang, Fei Ma, Jimin Xiao
- Abstract要約: パッチコントラスト学習(TKP-PCL)を用いたトップKプーリングという新しいViTベースのWSSS手法を提案する。
また,パッチ埋め込みを向上し,最終的な結果を改善するパッチコントラッシブエラー (PCE) も提案されている。
当社のアプローチは非常に効率的で、PASCAL 2012データセットの他の最先端のWSSSメソッドよりも優れています。
- 参考スコア(独自算出の注目度): 25.628382644404066
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Weakly Supervised Semantic Segmentation (WSSS) using only image-level labels
has gained significant attention due to cost-effectiveness. Recently, Vision
Transformer (ViT) based methods without class activation map (CAM) have shown
greater capability in generating reliable pseudo labels than previous methods
using CAM. However, the current ViT-based methods utilize max pooling to select
the patch with the highest prediction score to map the patch-level
classification to the image-level one, which may affect the quality of pseudo
labels due to the inaccurate classification of the patches. In this paper, we
introduce a novel ViT-based WSSS method named top-K pooling with patch
contrastive learning (TKP-PCL), which employs a top-K pooling layer to
alleviate the limitations of previous max pooling selection. A patch
contrastive error (PCE) is also proposed to enhance the patch embeddings to
further improve the final results. The experimental results show that our
approach is very efficient and outperforms other state-of-the-art WSSS methods
on the PASCAL VOC 2012 dataset.
- Abstract(参考訳): 画像レベルラベルのみを用いたWSSS(Weakly Supervised Semantic Segmentation)は費用対効果から注目されている。
近年,クラスアクティベーションマップ(CAM)を持たない視覚変換器(ViT)を用いた手法は,従来の手法よりも信頼性の高い擬似ラベルを生成する能力が高いことが示された。
しかし、現在のViTベースの手法では、最大プーリングを用いて、パッチレベルの分類を画像レベルにマッピングするために、パッチの正確な分類による擬似ラベルの品質に影響を与える可能性のある、最高の予測スコアを持つパッチを選択する。
本稿では,新しいvitベースのwsss法であるtop-k pooling with patch contrastive learning (tkp-pcl)を提案する。
また,パッチ埋め込みを向上し,最終的な結果を改善するパッチコントラッシブエラー (PCE) も提案されている。
実験の結果,本手法はPASCAL VOC 2012データセットの他の最先端のWSSS手法よりも効率が良く,性能も優れていた。
関連論文リスト
- Active Label Correction for Semantic Segmentation with Foundation Models [34.0733215363568]
本稿では,画素の擬似ラベルを補正する補正クエリの設計に基づく,アクティブラベル補正(ALC)の有効なフレームワークを提案する。
提案手法は, (i) 擬似ラベルを用いた補正クエリのアノテータフレンドリな設計, (ii) スーパーピクセルに基づくラベル展開を先取りする取得関数の2つの重要な手法からなる。
PASCAL,Cityscapes,Kvasir-SEGデータセットの実験結果から,ALCフレームワークの有効性が示された。
論文 参考訳(メタデータ) (2024-03-16T06:10:22Z) - One-Step Multi-View Clustering Based on Transition Probability [61.841829428397034]
遷移確率に基づくワンステップマルチビュークラスタリング(OSMVC-TP)を導入する。
本手法は,アンカーポイントからカテゴリへの遷移確率を直接学習し,サンプルからカテゴリへの遷移確率を計算する。
異なる視点でラベルの整合性を維持するために、ソフトラベルからなるテンソルにシャッテン p-ノルムの制約を適用する。
論文 参考訳(メタデータ) (2024-03-03T09:43:23Z) - Exploiting Low-confidence Pseudo-labels for Source-free Object Detection [54.98300313452037]
Source-free Object Detection (SFOD) は、ラベル付きソースデータにアクセスすることなく、未ラベルのターゲットドメインにソーストレーニングされた検出器を適応することを目的としている。
現在のSFOD法は適応相におけるしきい値に基づく擬似ラベル手法を用いる。
疑似ラベルを最大限に活用するために,高信頼度と低信頼度しきい値を導入する手法を提案する。
論文 参考訳(メタデータ) (2023-10-19T12:59:55Z) - ProTeCt: Prompt Tuning for Taxonomic Open Set Classification [59.59442518849203]
分類学的オープンセット(TOS)設定では、ほとんどショット適応法はうまくいきません。
本稿では,モデル予測の階層的一貫性を校正する即時チューニング手法を提案する。
次に,階層整合性のための新しいPrompt Tuning(ProTeCt)手法を提案し,ラベル集合の粒度を分類する。
論文 参考訳(メタデータ) (2023-06-04T02:55:25Z) - High-fidelity Pseudo-labels for Boosting Weakly-Supervised Segmentation [17.804090651425955]
画像レベルの弱い教師付きセグメンテーション(WSSS)は、トレーニング中にセグメンテーションマスクを代理することで、通常膨大なデータアノテーションコストを削減する。
本研究は,GAPの代替となる重要サンプリングと特徴類似性損失という,CAMを改善するための2つの手法に基づく。
複数の独立二項問題の後部二項問題に基づいて両手法を再構成する。
パフォーマンスが向上し、より一般的なものになり、事実上あらゆるWSSSメソッドを増強できるアドオンメソッドが出来上がります。
論文 参考訳(メタデータ) (2023-04-05T17:43:57Z) - Max Pooling with Vision Transformers reconciles class and shape in
weakly supervised semantic segmentation [0.0]
本研究は,CAMをベースとせず,ViT-PCM (ViT Patch-Class Mapping) と呼ばれる新しいWSSS手法を提案する。
当社のモデルは,PascalVOC 2012 $val$setで69.3%のmIoUを達成した,ベースライン擬似マスク(BPM)の最先端技術よりも優れています。
論文 参考訳(メタデータ) (2022-10-31T15:32:23Z) - Dense FixMatch: a simple semi-supervised learning method for pixel-wise
prediction tasks [68.36996813591425]
Dense FixMatchは,高密度かつ構造化された予測タスクのオンライン半教師付き学習のための簡易な手法である。
我々は、擬似ラベルにマッチング操作を追加することにより、画像分類を超えた半教師付き学習問題にFixMatchの適用を可能にする。
Dense FixMatchは、ラベル付きデータのみを使用して教師付き学習と比較すると、結果を著しく改善し、ラベル付きサンプルの1/4でそのパフォーマンスに近づいた。
論文 参考訳(メタデータ) (2022-10-18T15:02:51Z) - Rethinking Pseudo Labels for Semi-Supervised Object Detection [84.697097472401]
物体検出に適した確実な擬似ラベルを導入する。
我々は,クラス不均衡問題を緩和するために,各カテゴリの擬似ラベルと再重み付き損失関数を生成するために使用する閾値を動的に調整する。
提案手法では,COCOのラベル付きデータのみを用いて,教師付きベースラインを最大10%改善する。
論文 参考訳(メタデータ) (2021-06-01T01:32:03Z) - Puzzle-CAM: Improved localization via matching partial and full features [0.5482532589225552]
弱教師付きセマンティックセマンティックセマンティクス(WSSS)を導入し、セマンティクス性能のギャップを画素レベルの監視から画像レベルの監視へと狭める。
ほとんどの高度なアプローチは、セグメンテーションネットワークをトレーニングするために擬似ラベルを生成するクラスアクティベーションマップ(CAM)に基づいている。
本稿では,個々のパッチと画像全体の違いを最小限に抑えるプロセスであるPuzzle-CAMを提案する。
実験では、Puzzle-CAMはPASCAL VOC 2012データセットの監視のために同じラベルを使用した従来の最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2021-01-27T08:19:38Z) - In Defense of Pseudo-Labeling: An Uncertainty-Aware Pseudo-label
Selection Framework for Semi-Supervised Learning [53.1047775185362]
Pseudo-labeling (PL) は一般的な SSL アプローチで、この制約はありませんが、当初の処方では比較的不十分です。
PLは不整合モデルからの誤った高い信頼度予測により性能が低下していると論じる。
そこで本研究では,疑似ラベリング精度を向上させるための不確実性認識型擬似ラベル選択(ups)フレームワークを提案する。
論文 参考訳(メタデータ) (2021-01-15T23:29:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。