論文の概要: Learning structure-aware semantic segmentation with image-level
supervision
- arxiv url: http://arxiv.org/abs/2104.07216v1
- Date: Thu, 15 Apr 2021 03:33:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-16 14:57:03.601149
- Title: Learning structure-aware semantic segmentation with image-level
supervision
- Title(参考訳): 画像レベルの監視による構造認識セマンティックセグメンテーションの学習
- Authors: Jiawei Liu, Jing Zhang, Yicong Hong, Nick Barnes
- Abstract要約: CAMにおける失われた構造情報は、下流セマンティックセマンティックセグメンテーションにおけるその応用を制限すると論じる。
劣化予測をペナルティ化する補助意味境界検出モジュールを紹介します。
PASCAL-VOCデータセットの実験結果から,提案手法の有効性が示された。
- 参考スコア(独自算出の注目度): 36.40302533324508
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Compared with expensive pixel-wise annotations, image-level labels make it
possible to learn semantic segmentation in a weakly-supervised manner. Within
this pipeline, the class activation map (CAM) is obtained and further processed
to serve as a pseudo label to train the semantic segmentation model in a
fully-supervised manner. In this paper, we argue that the lost structure
information in CAM limits its application in downstream semantic segmentation,
leading to deteriorated predictions. Furthermore, the inconsistent class
activation scores inside the same object contradicts the common sense that each
region of the same object should belong to the same semantic category. To
produce sharp prediction with structure information, we introduce an auxiliary
semantic boundary detection module, which penalizes the deteriorated
predictions. Furthermore, we adopt smoothness loss to encourage prediction
inside the object to be consistent. Experimental results on the PASCAL-VOC
dataset illustrate the effectiveness of the proposed solution.
- Abstract(参考訳): 画像レベルのラベルは、高価なピクセル単位のアノテーションと比較して、セマンティックセグメンテーションを弱教師付きで学習することができる。
このパイプライン内で、クラスアクティベーションマップ(CAM)を取得し、さらに擬似ラベルとして処理し、セマンティックセグメンテーションモデルを完全に教師された方法でトレーニングする。
本稿では,CAMにおける失われる構造情報は,下流セマンティックセマンティックセグメンテーションにおける適用を制限し,劣化した予測をもたらすことを論じる。
さらに、同じオブジェクト内の一貫性のないクラスアクティベーションスコアは、同じオブジェクトの各領域は同じ意味カテゴリーに属するべきであるという常識と矛盾する。
構造情報を用いて鋭い予測を行うために,劣化した予測をペナルティ化する補助的意味境界検出モジュールを導入する。
さらに、オブジェクト内部の一貫性の予測を促進するために、滑らかさ損失を採用する。
PASCAL-VOCデータセットの実験結果から,提案手法の有効性が示された。
関連論文リスト
- EAGLE: Eigen Aggregation Learning for Object-Centric Unsupervised Semantic Segmentation [5.476136494434766]
意味的類似性行列から派生した固有ベイズを通して意味的および構造的手がかりを提供する手法であるEiCueを紹介する。
オブジェクトレベルの表現を画像内および画像間の整合性で学習する。
COCO-Stuff、Cityscapes、Potsdam-3データセットの実験では、最先端のUSSの結果が示されている。
論文 参考訳(メタデータ) (2024-03-03T11:24:16Z) - Semantics Meets Temporal Correspondence: Self-supervised Object-centric Learning in Videos [63.94040814459116]
自己教師付き手法は、高レベルの意味論と低レベルの時間対応の学習において顕著な進歩を見せている。
融合した意味特徴と対応地図の上に,意味認識型マスキングスロットアテンションを提案する。
我々は、時間的コヒーレントなオブジェクト中心表現を促進するために、セマンティックおよびインスタンスレベルの時間的一貫性を自己スーパービジョンとして採用する。
論文 参考訳(メタデータ) (2023-08-19T09:12:13Z) - Decom--CAM: Tell Me What You See, In Details! Feature-Level Interpretation via Decomposition Class Activation Map [23.71680014689873]
クラスアクティベーションマップ(CAM)は、オブジェクトの位置をハイライトすることで深層モデルの予測を解釈するために広く使われている。
本稿では,分解クラス活性化マップ(Decom-CAM)と呼ばれる2段階の解釈可能性を提案する。
実験の結果,提案したDecom-CAMは最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2023-05-27T14:33:01Z) - Location-Aware Self-Supervised Transformers [74.76585889813207]
画像部品の相対的な位置を予測し,セマンティックセグメンテーションのためのネットワークを事前訓練する。
参照パッチのサブセットを問合せのサブセットにマスキングすることで,タスクの難しさを制御します。
実験により,この位置認識事前学習が,いくつかの難解なセマンティックセグメンテーションベンチマークに競合する表現をもたらすことが示された。
論文 参考訳(メタデータ) (2022-12-05T16:24:29Z) - SSA: Semantic Structure Aware Inference for Weakly Pixel-Wise Dense
Predictions without Cost [36.27226683586425]
The semantic structure aware inference (SSA) was proposed to explore the semantic structure information hidden in different stage of the CNN-based network to generate high-quality CAM in the model inference。
提案手法はパラメータを含まない利点があり,訓練は不要である。したがって,弱教師付き画素ワイド予測タスクにも適用可能である。
論文 参考訳(メタデータ) (2021-11-05T11:07:21Z) - Mixup-CAM: Weakly-supervised Semantic Segmentation via Uncertainty
Regularization [73.03956876752868]
我々は、ネットワークがオブジェクトの他の部分に注意を払うことを可能にする、原則的でエンドツーエンドのトレーニング可能なフレームワークを提案する。
具体的には、ミックスアップデータ拡張方式を分類ネットワークに導入し、2つの不確実な正規化項を設計し、ミックスアップ戦略をよりよく扱う。
論文 参考訳(メタデータ) (2020-08-03T21:19:08Z) - Mining Cross-Image Semantics for Weakly Supervised Semantic Segmentation [128.03739769844736]
2つのニューラルコアテンションを分類器に組み込んで、画像間のセマンティックな類似点と相違点をキャプチャする。
オブジェクトパターン学習の強化に加えて、コアテンションは他の関連する画像からのコンテキストを活用して、ローカライズマップの推論を改善することができる。
提案アルゴリズムは,これらすべての設定に対して新たな最先端性を設定し,その有効性と一般化性を示す。
論文 参考訳(メタデータ) (2020-07-03T21:53:46Z) - Semantics-Driven Unsupervised Learning for Monocular Depth and
Ego-Motion Estimation [33.83396613039467]
ビデオからの単眼深度と自我運動推定のためのセマンティクス駆動型教師なし学習手法を提案する。
近年の教師なし学習法では, 合成ビューと実画像の光度誤差を指導信号として用いている。
論文 参考訳(メタデータ) (2020-06-08T05:55:07Z) - Self-Supervised Tuning for Few-Shot Segmentation [82.32143982269892]
Few-shotのセグメンテーションは、アノテートされたサンプルがほとんどない各画像ピクセルにカテゴリラベルを割り当てることを目的としている。
既存のメタラーニング手法では, 画像から抽出した視覚的特徴を埋め込み空間に埋め込むと, カテゴリー別識別記述子の生成に失敗する傾向にある。
本稿では,複数のエピソードにまたがる潜在特徴の分布を,自己分割方式に基づいて動的に調整する適応型フレームワークチューニングを提案する。
論文 参考訳(メタデータ) (2020-04-12T03:53:53Z) - Self-supervised Equivariant Attention Mechanism for Weakly Supervised
Semantic Segmentation [93.83369981759996]
本稿では,自己監督同変注意機構(SEAM)を提案する。
本手法は,完全教師付きセマンティックセグメンテーションにおいて,同値が暗黙の制約であることを示す。
本稿では,ネットワーク学習のための自己スーパービジョンを提供するために,様々な変換画像から予測されたCAMの整合性正則化を提案する。
論文 参考訳(メタデータ) (2020-04-09T14:57:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。