論文の概要: APC: Adaptive Patch Contrast for Weakly Supervised Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2407.10649v1
- Date: Mon, 15 Jul 2024 12:10:05 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-16 15:21:27.006031
- Title: APC: Adaptive Patch Contrast for Weakly Supervised Semantic Segmentation
- Title(参考訳): APC: 弱修正セマンティックセグメンテーションのための適応パッチコントラスト
- Authors: Wangyu Wu, Tianhong Dai, Zhenhong Chen, Xiaowei Huang, Fei Ma, Jimin Xiao,
- Abstract要約: 画像レベルラベルのみを用いたWSSS(Weakly Supervised Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic
視覚変換器(ViT)に基づく最近の手法は、信頼性の高い擬似ラベルを生成するのに優れた能力を示している。
我々は、パッチ埋め込み学習を大幅に強化する、テキストパッチコントラスト(APC)と呼ばれる新しいViTベースのWSSS手法を提案する。
- 参考スコア(独自算出の注目度): 22.808117374130198
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Weakly Supervised Semantic Segmentation (WSSS) using only image-level labels has gained significant attention due to its cost-effectiveness. The typical framework involves using image-level labels as training data to generate pixel-level pseudo-labels with refinements. Recently, methods based on Vision Transformers (ViT) have demonstrated superior capabilities in generating reliable pseudo-labels, particularly in recognizing complete object regions, compared to CNN methods. However, current ViT-based approaches have some limitations in the use of patch embeddings, being prone to being dominated by certain abnormal patches, as well as many multi-stage methods being time-consuming and lengthy in training, thus lacking efficiency. Therefore, in this paper, we introduce a novel ViT-based WSSS method named \textit{Adaptive Patch Contrast} (APC) that significantly enhances patch embedding learning for improved segmentation effectiveness. APC utilizes an Adaptive-K Pooling (AKP) layer to address the limitations of previous max pooling selection methods. Additionally, we propose a Patch Contrastive Learning (PCL) to enhance patch embeddings, thereby further improving the final results. Furthermore, we improve upon the existing multi-stage training framework without CAM by transforming it into an end-to-end single-stage training approach, thereby enhancing training efficiency. The experimental results show that our approach is effective and efficient, outperforming other state-of-the-art WSSS methods on the PASCAL VOC 2012 and MS COCO 2014 dataset within a shorter training duration.
- Abstract(参考訳): 画像レベルラベルのみを用いたWSSS(Weakly Supervised Semantic Segmentation)は,費用対効果から注目されている。
典型的なフレームワークでは、画像レベルのラベルをトレーニングデータとして使用して、改良付きのピクセルレベルの擬似ラベルを生成する。
近年、視覚変換器(ViT)に基づく手法は、CNN法と比較して、信頼性の高い擬似ラベルを生成する能力、特に完全な対象領域を認識する能力に優れていることが示されている。
しかし、現在のViTベースのアプローチでは、パッチ埋め込みの使用にいくつかの制限があり、特定の異常なパッチに支配される傾向があり、また、訓練に時間がかかり、時間がかかり、効率が損なわれている。
そこで本稿では, パッチ埋め込み学習を著しく向上し, セグメンテーション効率の向上を図るための, ViT ベースの新しい WSSS 手法である \textit{Adaptive Patch Contrast} (APC) を提案する。
APCはAdaptive-K Pooling (AKP) レイヤを使用して、以前の最大プール選択法の制限に対処する。
さらに,パッチ埋め込みを向上し,最終的な結果を改善するために,パッチコントラスト学習(PCL)を提案する。
さらに、CAMを使わずに既存のマルチステージトレーニングフレームワークを改善し、エンドツーエンドの単一ステージトレーニングアプローチに変換することにより、トレーニング効率を向上する。
実験の結果,本手法は,PASCAL VOC 2012およびMS COCO 2014データセットにおいて,より短いトレーニング期間で,最先端のWSSS手法よりも効果的かつ効果的であることが示唆された。
関連論文リスト
- SLCA++: Unleash the Power of Sequential Fine-tuning for Continual Learning with Pre-training [68.7896349660824]
本稿では,Seq FTのレンズからの進行オーバーフィッティング問題を詳細に解析する。
過度に高速な表現学習と偏りのある分類層がこの問題を構成することを考慮し、先進的なSlow Learner with Alignment(S++)フレームワークを導入する。
提案手法は,バックボーンパラメータの学習率を選択的に減少させるスローラーナーと,ポストホック方式で不規則な分類層を整列させるアライメントを含む。
論文 参考訳(メタデータ) (2024-08-15T17:50:07Z) - DAWN: Domain-Adaptive Weakly Supervised Nuclei Segmentation via Cross-Task Interactions [17.68742587885609]
現在の弱い制御された核分割アプローチは、2段階の擬似ラベル生成とネットワークトレーニングプロセスに従う。
本稿では,クロスタスクインタラクション戦略を用いたドメイン適応型弱教師付き核セグメンテーションフレームワークを提案する。
提案手法の有効性を検証するため,6つのデータセットに対して広範囲な比較・アブレーション実験を行った。
論文 参考訳(メタデータ) (2024-04-23T12:01:21Z) - Top-K Pooling with Patch Contrastive Learning for Weakly-Supervised
Semantic Segmentation [25.628382644404066]
パッチコントラスト学習(TKP-PCL)を用いたトップKプーリングという新しいViTベースのWSSS手法を提案する。
また,パッチ埋め込みを向上し,最終的な結果を改善するパッチコントラッシブエラー (PCE) も提案されている。
当社のアプローチは非常に効率的で、PASCAL 2012データセットの他の最先端のWSSSメソッドよりも優れています。
論文 参考訳(メタデータ) (2023-10-15T13:19:59Z) - Boosting Weakly-Supervised Image Segmentation via Representation,
Transform, and Compensator [26.991314511807907]
既存のWSISアプローチでは多段階の訓練手順が広く使われており、質の高い擬似マスクを基礎として取得している。
そこで本研究では,Symese ネットワークとコントラスト学習を用いて,クラスアクティベーションマップ(CAM)の品質を向上し,自己補充プロセスを実現するための,新しいワンステージ WSIS 手法を提案する。
PASCAL VOC 2012データセットでは67.2%と68.76%のmIoUを達成した。
論文 参考訳(メタデータ) (2023-09-02T09:07:25Z) - Contextual Squeeze-and-Excitation for Efficient Few-Shot Image
Classification [57.36281142038042]
本稿では,事前学習したニューラルネットワークを新しいタスクで調整し,性能を大幅に向上させる,Contextual Squeeze-and-Excitation (CaSE) という適応ブロックを提案する。
また、メタトレーニングされたCaSEブロックと微調整ルーチンを利用して効率よく適応する、アッパーCaSEと呼ばれるコーディネートダイスに基づく新しいトレーニングプロトコルを提案する。
論文 参考訳(メタデータ) (2022-06-20T15:25:08Z) - Efficient Few-Shot Object Detection via Knowledge Inheritance [62.36414544915032]
Few-shot Object Detection (FSOD) は、未確認のタスクに少ないトレーニングサンプルで適応できるジェネリック検出器を学習することを目的としている。
計算量の増加を伴わない効率的なプレトレイン・トランスファー・フレームワーク(PTF)のベースラインを提案する。
また,予測された新しいウェイトと事前訓練されたベースウェイトとのベクトル長の不整合を軽減するために,適応長再スケーリング(ALR)戦略を提案する。
論文 参考訳(メタデータ) (2022-03-23T06:24:31Z) - Adaptive Affinity Loss and Erroneous Pseudo-Label Refinement for Weakly
Supervised Semantic Segmentation [48.294903659573585]
本稿では,多段階アプローチの親和性学習を単一段階モデルに組み込むことを提案する。
深層ニューラルネットワークは、トレーニングフェーズで包括的なセマンティック情報を提供するために使用される。
提案手法の有効性を評価するため,PASCAL VOC 2012データセットを用いて実験を行った。
論文 参考訳(メタデータ) (2021-08-03T07:48:33Z) - A Simple Baseline for Semi-supervised Semantic Segmentation with Strong
Data Augmentation [74.8791451327354]
セマンティックセグメンテーションのためのシンプルで効果的な半教師付き学習フレームワークを提案する。
単純な設計とトレーニングのテクニックのセットは、半教師付きセマンティックセグメンテーションの性能を大幅に向上させることができる。
本手法は,Cityscapes と Pascal VOC データセットの半教師付き設定において,最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2021-04-15T06:01:39Z) - Selective Pseudo-Labeling with Reinforcement Learning for
Semi-Supervised Domain Adaptation [116.48885692054724]
半教師付きドメイン適応のための強化学習に基づく選択擬似ラベル法を提案する。
高精度かつ代表的な擬似ラベルインスタンスを選択するための深層Q-ラーニングモデルを開発する。
提案手法は, SSDAのベンチマークデータセットを用いて評価し, 全ての比較手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2020-12-07T03:37:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。