論文の概要: Top-K Pooling with Patch Contrastive Learning for Weakly-Supervised
Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2310.09828v1
- Date: Sun, 15 Oct 2023 13:19:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-17 17:49:41.802432
- Title: Top-K Pooling with Patch Contrastive Learning for Weakly-Supervised
Semantic Segmentation
- Title(参考訳): 弱教師付きセマンティックセグメンテーションのためのパッチコントラスト学習によるトップKプーリング
- Authors: Wangyu Wu, Tianhong Dai, Xiaowei Huang, Fei Ma, Jimin Xiao
- Abstract要約: パッチコントラスト学習(TKP-PCL)を用いたトップKプーリングという新しいViTベースのWSSS手法を提案する。
また,パッチ埋め込みを向上し,最終的な結果を改善するパッチコントラッシブエラー (PCE) も提案されている。
当社のアプローチは非常に効率的で、PASCAL 2012データセットの他の最先端のWSSSメソッドよりも優れています。
- 参考スコア(独自算出の注目度): 25.628382644404066
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Weakly Supervised Semantic Segmentation (WSSS) using only image-level labels
has gained significant attention due to cost-effectiveness. Recently, Vision
Transformer (ViT) based methods without class activation map (CAM) have shown
greater capability in generating reliable pseudo labels than previous methods
using CAM. However, the current ViT-based methods utilize max pooling to select
the patch with the highest prediction score to map the patch-level
classification to the image-level one, which may affect the quality of pseudo
labels due to the inaccurate classification of the patches. In this paper, we
introduce a novel ViT-based WSSS method named top-K pooling with patch
contrastive learning (TKP-PCL), which employs a top-K pooling layer to
alleviate the limitations of previous max pooling selection. A patch
contrastive error (PCE) is also proposed to enhance the patch embeddings to
further improve the final results. The experimental results show that our
approach is very efficient and outperforms other state-of-the-art WSSS methods
on the PASCAL VOC 2012 dataset.
- Abstract(参考訳): 画像レベルラベルのみを用いたWSSS(Weakly Supervised Semantic Segmentation)は費用対効果から注目されている。
近年,クラスアクティベーションマップ(CAM)を持たない視覚変換器(ViT)を用いた手法は,従来の手法よりも信頼性の高い擬似ラベルを生成する能力が高いことが示された。
しかし、現在のViTベースの手法では、最大プーリングを用いて、パッチレベルの分類を画像レベルにマッピングするために、パッチの正確な分類による擬似ラベルの品質に影響を与える可能性のある、最高の予測スコアを持つパッチを選択する。
本稿では,新しいvitベースのwsss法であるtop-k pooling with patch contrastive learning (tkp-pcl)を提案する。
また,パッチ埋め込みを向上し,最終的な結果を改善するパッチコントラッシブエラー (PCE) も提案されている。
実験の結果,本手法はPASCAL VOC 2012データセットの他の最先端のWSSS手法よりも効率が良く,性能も優れていた。
関連論文リスト
- PEPL: Precision-Enhanced Pseudo-Labeling for Fine-Grained Image Classification in Semi-Supervised Learning [3.801446153948012]
半教師付き学習フレームワーク内でのきめ細かい画像分類のためのPEPL(Precision-Enhanced Pseudo-Labeling)手法を提案する。
提案手法は,高品質な擬似ラベルを生成することにより,ラベルなしデータの豊富さを活用する。
ベンチマークデータセット上での最先端のパフォーマンスを実現し、既存の半教師付き戦略よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2024-09-05T02:32:07Z) - APC: Adaptive Patch Contrast for Weakly Supervised Semantic Segmentation [22.808117374130198]
画像レベルラベルのみを用いたWSSS(Weakly Supervised Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic
視覚変換器(ViT)に基づく最近の手法は、信頼性の高い擬似ラベルを生成するのに優れた能力を示している。
我々は、パッチ埋め込み学習を大幅に強化する、テキストパッチコントラスト(APC)と呼ばれる新しいViTベースのWSSS手法を提案する。
論文 参考訳(メタデータ) (2024-07-15T12:10:05Z) - Adapting Conformal Prediction to Distribution Shifts Without Labels [16.478151550456804]
コンフォーマル予測(CP)により、機械学習モデルは、保証されたカバレッジ率で予測セットを出力できる。
我々の目標は、テストドメインからのラベルなしデータのみを使用して、CP生成予測セットの品質を改善することです。
これは、未ラベルテストデータに対するベースモデルの不確実性に応じてCPのスコア関数を調整する、ECP と EACP と呼ばれる2つの新しい手法によって達成される。
論文 参考訳(メタデータ) (2024-06-03T15:16:02Z) - Active Label Correction for Semantic Segmentation with Foundation Models [34.0733215363568]
本稿では,画素の擬似ラベルを補正する補正クエリの設計に基づく,アクティブラベル補正(ALC)の有効なフレームワークを提案する。
提案手法は, (i) 擬似ラベルを用いた補正クエリのアノテータフレンドリな設計, (ii) スーパーピクセルに基づくラベル展開を先取りする取得関数の2つの重要な手法からなる。
PASCAL,Cityscapes,Kvasir-SEGデータセットの実験結果から,ALCフレームワークの有効性が示された。
論文 参考訳(メタデータ) (2024-03-16T06:10:22Z) - One-Step Multi-View Clustering Based on Transition Probability [61.841829428397034]
遷移確率に基づくワンステップマルチビュークラスタリング(OSMVC-TP)を導入する。
本手法は,アンカーポイントからカテゴリへの遷移確率を直接学習し,サンプルからカテゴリへの遷移確率を計算する。
異なる視点でラベルの整合性を維持するために、ソフトラベルからなるテンソルにシャッテン p-ノルムの制約を適用する。
論文 参考訳(メタデータ) (2024-03-03T09:43:23Z) - Exploiting Low-confidence Pseudo-labels for Source-free Object Detection [54.98300313452037]
Source-free Object Detection (SFOD) は、ラベル付きソースデータにアクセスすることなく、未ラベルのターゲットドメインにソーストレーニングされた検出器を適応することを目的としている。
現在のSFOD法は適応相におけるしきい値に基づく擬似ラベル手法を用いる。
疑似ラベルを最大限に活用するために,高信頼度と低信頼度しきい値を導入する手法を提案する。
論文 参考訳(メタデータ) (2023-10-19T12:59:55Z) - ProTeCt: Prompt Tuning for Taxonomic Open Set Classification [59.59442518849203]
分類学的オープンセット(TOS)設定では、ほとんどショット適応法はうまくいきません。
本稿では,モデル予測の階層的一貫性を校正する即時チューニング手法を提案する。
次に,階層整合性のための新しいPrompt Tuning(ProTeCt)手法を提案し,ラベル集合の粒度を分類する。
論文 参考訳(メタデータ) (2023-06-04T02:55:25Z) - Dense FixMatch: a simple semi-supervised learning method for pixel-wise
prediction tasks [68.36996813591425]
Dense FixMatchは,高密度かつ構造化された予測タスクのオンライン半教師付き学習のための簡易な手法である。
我々は、擬似ラベルにマッチング操作を追加することにより、画像分類を超えた半教師付き学習問題にFixMatchの適用を可能にする。
Dense FixMatchは、ラベル付きデータのみを使用して教師付き学習と比較すると、結果を著しく改善し、ラベル付きサンプルの1/4でそのパフォーマンスに近づいた。
論文 参考訳(メタデータ) (2022-10-18T15:02:51Z) - Rethinking Pseudo Labels for Semi-Supervised Object Detection [84.697097472401]
物体検出に適した確実な擬似ラベルを導入する。
我々は,クラス不均衡問題を緩和するために,各カテゴリの擬似ラベルと再重み付き損失関数を生成するために使用する閾値を動的に調整する。
提案手法では,COCOのラベル付きデータのみを用いて,教師付きベースラインを最大10%改善する。
論文 参考訳(メタデータ) (2021-06-01T01:32:03Z) - In Defense of Pseudo-Labeling: An Uncertainty-Aware Pseudo-label
Selection Framework for Semi-Supervised Learning [53.1047775185362]
Pseudo-labeling (PL) は一般的な SSL アプローチで、この制約はありませんが、当初の処方では比較的不十分です。
PLは不整合モデルからの誤った高い信頼度予測により性能が低下していると論じる。
そこで本研究では,疑似ラベリング精度を向上させるための不確実性認識型擬似ラベル選択(ups)フレームワークを提案する。
論文 参考訳(メタデータ) (2021-01-15T23:29:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。