論文の概要: Pseudo-mask Matters inWeakly-supervised Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2108.12995v1
- Date: Mon, 30 Aug 2021 05:35:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-31 14:39:19.042146
- Title: Pseudo-mask Matters inWeakly-supervised Semantic Segmentation
- Title(参考訳): pseudo-mask matter inweakly-supervised semantic segmentation
- Authors: Yi Li, Zhanghui Kuang, Liyang Liu, Yimin Chen, Wayne Zhang
- Abstract要約: 例えば,クラスアクティベーションマップ(CAM)からの高品質な擬似マスク生成や,ノイズの多い擬似マスク監視によるトレーニングなどである。
i)変分平滑化の係数を適応的にCAMを平滑化させる、(ii)各クラスの重要性を示す新しい指標に基づいて拡張されたCAMを擬似マスクに投影する、(iii)擬似雑音の影響を抑えるための事前的アンダーフィッティング戦略
- 参考スコア(独自算出の注目度): 24.73662587701187
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most weakly supervised semantic segmentation (WSSS) methods follow the
pipeline that generates pseudo-masks initially and trains the segmentation
model with the pseudo-masks in fully supervised manner after. However, we find
some matters related to the pseudo-masks, including high quality pseudo-masks
generation from class activation maps (CAMs), and training with noisy
pseudo-mask supervision. For these matters, we propose the following designs to
push the performance to new state-of-art: (i) Coefficient of Variation
Smoothing to smooth the CAMs adaptively; (ii) Proportional Pseudo-mask
Generation to project the expanded CAMs to pseudo-mask based on a new metric
indicating the importance of each class on each location, instead of the scores
trained from binary classifiers. (iii) Pretended Under-Fitting strategy to
suppress the influence of noise in pseudo-mask; (iv) Cyclic Pseudo-mask to
boost the pseudo-masks during training of fully supervised semantic
segmentation (FSSS). Experiments based on our methods achieve new state-of-art
results on two changeling weakly supervised semantic segmentation datasets,
pushing the mIoU to 70.0% and 40.2% on PAS-CAL VOC 2012 and MS COCO 2014
respectively. Codes including segmentation framework are released at
https://github.com/Eli-YiLi/PMM
- Abstract(参考訳): 最も弱い教師付きセマンティクスセグメンテーション(wsss)メソッドは、最初に疑似マスクを生成するパイプラインに従い、その後に疑似マスクでセグメンテーションモデルを訓練する。
しかし,クラスアクティベーションマップ(cams)からの高品質疑似マスク生成や,ノイズの多い疑似マスク監督によるトレーニングなど,疑似マスクに関する問題も見いだされている。
これらの問題に対して,我々は,新しい最先端にパフォーマンスをプッシュする設計を提案する。 (i) カムを適応的に平滑化するための変動平滑化係数 (ii) 拡張されたカムを擬似マスクに投影する比例擬似マスク生成 (ii) バイナリ分類器からトレーニングされたスコアではなく,各クラスの重要性を示す新しいメトリックに基づいて,拡張カムを擬似マスクに投影する。
3)擬似マスクにおけるノイズの影響を抑えるための前置アンダーフィッティング戦略(IV)完全教師ありセマンティックセグメンテーション(FSSS)の訓練中に擬似マスクを増強するための周期的擬似マスク。
本手法に基づく実験は,pas-cal voc 2012 および ms coco 2014 において,miou を 70.0% および 40.2% まで押し下げる,弱い教師付きセマンティクスセグメンテーションデータセットの2つの変更に関する新たな結果を得た。
セグメンテーションフレームワークを含むコードはhttps://github.com/eli-yili/pmmでリリース
関連論文リスト
- Hybrid Mask Generation for Infrared Small Target Detection with Single-Point Supervision [18.168923054036682]
SIRST(Single-frame infrared small target)検出は、微小なターゲットを識別する必要があるため、大きな課題となる。
ネットワークトレーニングのためのシングルポイントラベルのみから,ターゲット毎に高品質なマスクを復元するハイブリッドマスク生成手法を提案する。
3つのデータセットにまたがる実験結果から,本手法は単一点監視による赤外線小目標検出法よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-09-06T03:34:44Z) - ColorMAE: Exploring data-independent masking strategies in Masked AutoEncoders [53.3185750528969]
Masked AutoEncoders (MAE)は、堅牢な自己管理フレームワークとして登場した。
データに依存しないColorMAEという手法を導入し、ランダムノイズをフィルタすることで異なる二元マスクパターンを生成する。
ランダムマスキングと比較して,下流タスクにおける戦略の優位性を示す。
論文 参考訳(メタデータ) (2024-07-17T22:04:00Z) - Mask2Anomaly: Mask Transformer for Universal Open-set Segmentation [29.43462426812185]
本稿では,画素単位の分類からマスク分類へのシフトによるパラダイム変化を提案する。
マスクをベースとしたMask2Anomalyは,マスク分類アーキテクチャの統合の可能性を示した。
総合的質的・質的評価により, Mask2Anomaly は新たな最先端結果が得られることを示す。
論文 参考訳(メタデータ) (2023-09-08T20:07:18Z) - Unmasking Anomalies in Road-Scene Segmentation [18.253109627901566]
異常セグメンテーションはアプリケーションを駆動するための重要なタスクである。
本稿では,画素単位の分類からマスク分類へのシフトによるパラダイム変化を提案する。
Mask2Anomalyはマスク分類アーキテクチャに異常検出手法を統合する可能性を示した。
論文 参考訳(メタデータ) (2023-07-25T08:23:10Z) - Non-Iterative Scribble-Supervised Learning with Pacing Pseudo-Masks for
Medical Image Segmentation [13.940364677162968]
Scribble-supervised Medical Image segmentationはスパースマスクの制限に対処する。
そこで我々は,PacingPseudoという,異質な擬似マスクのストリームが整合性学習を通じてネットワークを教える非定性的手法を提案する。
提案したPacingPseudoの有効性は、3つの公開医療画像データセットで検証されている。
論文 参考訳(メタデータ) (2022-10-20T01:57:44Z) - Per-Pixel Classification is Not All You Need for Semantic Segmentation [184.2905747595058]
マスク分類はセマンティックレベルのセグメンテーションタスクとインスタンスレベルのセグメンテーションタスクの両方を解くのに十分一般的である。
マスクの集合を予測する単純なマスク分類モデルであるMaskFormerを提案する。
提案手法は,現在の最先端セマンティック(ADE20Kでは55.6 mIoU)とパノプティックセグメンテーション(COCOでは52.7 PQ)モデルの両方に優れる。
論文 参考訳(メタデータ) (2021-07-13T17:59:50Z) - Image Inpainting by End-to-End Cascaded Refinement with Mask Awareness [66.55719330810547]
任意の欠落領域を塗りつぶすことは、様々なマスクされた領域で有効な特徴を学ぶことは非自明だから難しい。
符号化フェーズにおける欠落領域のマルチスケール特徴を学習する新しいマスク対応インペイントソリューションを提案する。
私たちのフレームワークは、3つの公開データセットに関する広範な実験を通じて定量的および定性的に検証されます。
論文 参考訳(メタデータ) (2021-04-28T13:17:47Z) - RefineMask: Towards High-Quality Instance Segmentation with Fine-Grained
Features [53.71163467683838]
RefineMaskは、オブジェクトやシーンの高品質なインスタンスセグメンテーションのための新しい方法です。
インスタンス毎のセグメンテーションプロセス中に粒度の細かい機能を多段階的に組み込む。
以前のほとんどのメソッドで過剰にスムースされたオブジェクトの曲がった部分のようなハードケースをセグメンテーションすることに成功します。
論文 参考訳(メタデータ) (2021-04-17T15:09:20Z) - Improving Self-supervised Pre-training via a Fully-Explored Masked
Language Model [57.77981008219654]
Masked Language Model (MLM)フレームワークは、自己教師型言語事前学習に広く採用されている。
そこで本研究では,テキストシーケンスを複数の非重複セグメントに分割するマスキング手法を提案する。
論文 参考訳(メタデータ) (2020-10-12T21:28:14Z) - PointINS: Point-based Instance Segmentation [117.38579097923052]
POI(Point-of-Interest)機能によるインスタンスセグメンテーションにおけるマスク表現は、各インスタンスの高次元マスク機能を学ぶには、計算負荷が重いため、難しい。
本稿では、このマスク表現学習タスクを2つの抽出可能なモジュールに分解するインスタンス認識畳み込みを提案する。
インスタンス認識の畳み込みとともに、単純で実用的なインスタンスセグメンテーションアプローチであるPointINSを提案する。
論文 参考訳(メタデータ) (2020-03-13T08:24:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。