論文の概要: Expansion and Shrinkage of Localization for Weakly-Supervised Semantic
Segmentation
- arxiv url: http://arxiv.org/abs/2209.07761v2
- Date: Tue, 20 Sep 2022 02:40:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2022-09-21 14:40:09.665136
- Title: Expansion and Shrinkage of Localization for Weakly-Supervised Semantic
Segmentation
- Title(参考訳): 弱教師付きセマンティクスセグメンテーションにおける局所化の拡大と縮小
- Authors: Jinlong Li, Zequn Jie, Xu Wang, Xiaolin Wei, Lin Ma
- Abstract要約: 元のCAM法は不完全かつ不正確なローカライゼーションマップを生成する。
本稿では,変形可能な畳み込みにおけるオフセット学習に基づく拡張・収縮方式を提案する。
PASCAL VOC 2012 と MS COCO 2014 で様々な実験を行い,本手法の優位性を実証した。
- 参考スコア(独自算出の注目度): 40.411468073279906
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generating precise class-aware pseudo ground-truths, a.k.a, class activation
maps (CAMs), is essential for weakly-supervised semantic segmentation. The
original CAM method usually produces incomplete and inaccurate localization
maps. To tackle with this issue, this paper proposes an Expansion and Shrinkage
scheme based on the offset learning in the deformable convolution, to
sequentially improve the recall and precision of the located object in the two
respective stages. In the Expansion stage, an offset learning branch in a
deformable convolution layer, referred as "expansion sampler" seeks for
sampling increasingly less discriminative object regions, driven by an inverse
supervision signal that maximizes image-level classification loss. The located
more complete object in the Expansion stage is then gradually narrowed down to
the final object region during the Shrinkage stage. In the Shrinkage stage, the
offset learning branch of another deformable convolution layer, referred as
"shrinkage sampler", is introduced to exclude the false positive background
regions attended in the Expansion stage to improve the precision of the
localization maps. We conduct various experiments on PASCAL VOC 2012 and MS
COCO 2014 to well demonstrate the superiority of our method over other
state-of-the-art methods for weakly-supervised semantic segmentation. Code will
be made publicly available here https://github.com/TyroneLi/ESOL_WSSS.
- Abstract(参考訳): クラスアクティベーションマップ(クラスアクティベーションマップ、CAM)を正確に生成することは、弱い教師付きセマンティックセマンティックセグメンテーションに不可欠である。
元のCAM法は、通常不完全かつ不正確なローカライゼーションマップを生成する。
そこで本稿では,変形可能な畳み込みにおけるオフセット学習に基づく拡張・収縮方式を提案する。
拡大段階において、変形可能な畳み込み層のオフセット学習ブランチである「膨張サンプリング」は、画像レベルの分類損失を最大化する逆の監視信号によって駆動される、より少ない識別対象領域をサンプリングする。
膨張段階におけるより完全な位置は、収縮段階において最終対象領域に徐々に狭められる。
収縮段階において、「収縮サンプリング」と呼ばれる別の変形可能な畳み込み層のオフセット学習枝を導入し、拡大段階に含まれる偽陽性背景領域を排除し、局所化マップの精度を向上させる。
我々は,pascal voc 2012 と ms coco 2014 について様々な実験を行い,弱教師付き意味セグメンテーションのための他の最先端手法よりも優れていることを示す。
コードはhttps://github.com/tyroneli/esol_wsssで公開されている。
関連論文リスト
- Towards the Uncharted: Density-Descending Feature Perturbation for Semi-supervised Semantic Segmentation [51.66997548477913]
本稿では,DDFP(Dedentity-Descending Feature Perturbation)という特徴レベルの一貫性学習フレームワークを提案する。
半教師付き学習における低密度分離仮定にインスパイアされた私たちの重要な洞察は、特徴密度はセグメンテーション分類器が探索する最も有望な方向の光を放つことができるということである。
提案したDFFPは、機能レベルの摂動に関する他の設計よりも優れており、Pascal VOCとCityscapesのデータセット上でのアートパフォーマンスの状態を示している。
論文 参考訳(メタデータ) (2024-03-11T06:59:05Z) - Background Activation Suppression for Weakly Supervised Object
Localization and Semantic Segmentation [84.62067728093358]
弱教師付きオブジェクトローカライゼーションとセマンティックセグメンテーションは、画像レベルのラベルのみを使用してオブジェクトをローカライズすることを目的としている。
画素レベルのローカライゼーションを実現するために,フォアグラウンド予測マップを生成することで,新たなパラダイムが誕生した。
本稿では,物体の局在化学習過程に関する2つの驚くべき実験結果を示す。
論文 参考訳(メタデータ) (2023-09-22T15:44:10Z) - Divide and Contrast: Source-free Domain Adaptation via Adaptive
Contrastive Learning [122.62311703151215]
Divide and Contrast (DaC) は、それぞれの制限を回避しつつ、両方の世界の善良な端を接続することを目的としている。
DaCは、ターゲットデータをソースライクなサンプルとターゲット固有なサンプルに分割する。
さらに、ソースライクなドメインと、メモリバンクベースの最大平均離散性(MMD)損失を用いて、ターゲット固有のサンプルとを整合させて、分散ミスマッチを低減する。
論文 参考訳(メタデータ) (2022-11-12T09:21:49Z) - Weakly Supervised Semantic Segmentation via Progressive Patch Learning [39.87150496277798]
分類の局所的詳細抽出を改善するために「プログレッシブ・パッチ・ラーニング」アプローチを提案する。
は、機能マップをパッチに分解し、最終的なアグリゲーションの前に各ローカルパッチを独立して処理する。
プログレッシブ・パッチ・ラーニング(Progressive Patch Learning)は、特徴の破壊とパッチ・ラーニングをさらにプログレッシブな方法で多段階の粒度に拡張する。
論文 参考訳(メタデータ) (2022-09-16T09:54:17Z) - GSMFlow: Generation Shifts Mitigating Flow for Generalized Zero-Shot
Learning [55.79997930181418]
Generalized Zero-Shot Learningは、目に見えないクラスから見えないクラスに意味的な知識を移すことで、目に見えないクラスと見えないクラスの両方から画像を認識することを目的としている。
生成モデルの利点を生かして、見学したクラスから学んだ知識に基づいて、現実的な見知らぬサンプルを幻覚させることは、有望な解決策である。
本研究では,複数の条件付きアフィン結合層からなるフローベース生成フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-05T04:04:37Z) - Anti-Adversarially Manipulated Attributions for Weakly Supervised
Semantic Segmentation and Object Localization [31.69344455448125]
本稿では,最終ソフトマックス層やシグモイド層の前に分類器が生成する分類スコアを増やすために操作した画像の属性マップを提案する。
この操作は対逆的な方法で実現され、元の画像は対逆攻撃で使用されるものと反対方向に画素勾配に沿って摂動される。
さらに,対象物に関係のない領域の不正な帰属と,対象物の小さな領域への過剰な帰属の集中を抑制する新たな正規化手法を導入する。
論文 参考訳(メタデータ) (2022-04-11T06:18:02Z) - Reducing Information Bottleneck for Weakly Supervised Semantic
Segmentation [17.979336178991083]
弱教師付きセマンティックセグメンテーションは、クラスラベルからピクセルレベルのローカライゼーションを生成する。
このようなラベルで訓練された分類器は、ターゲットオブジェクトの小さな識別領域に焦点を当てる可能性が高い。
本稿では,最後のアクティベーション関数を除去することで,情報のボトルネックを低減する手法を提案する。
さらに,非識別領域から分類への情報伝達をさらに促進する新たなプーリング手法を提案する。
論文 参考訳(メタデータ) (2021-10-13T06:49:45Z) - Non-Salient Region Object Mining for Weakly Supervised Semantic
Segmentation [64.2719590819468]
弱教師付きセマンティックセグメンテーションのための非塩分領域オブジェクトマイニング手法を提案する。
擬似ラベルの偽陰性率を低減するために、潜在的なオブジェクトマイニングモジュールを提案する。
非サリエント領域マスキングモジュールは、非サリエント領域内のオブジェクトをさらに発見するのに役立ちます。
論文 参考訳(メタデータ) (2021-03-26T16:44:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。