論文の概要: Find it if You Can: End-to-End Adversarial Erasing for Weakly-Supervised
Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2011.04626v1
- Date: Mon, 9 Nov 2020 18:35:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 01:37:18.993245
- Title: Find it if You Can: End-to-End Adversarial Erasing for Weakly-Supervised
Semantic Segmentation
- Title(参考訳): 弱改良セマンティックセグメンテーションにおけるエンド・ツー・エンド逆消去法
- Authors: Erik Stammes, Tom F.H. Runia, Michael Hofmann, Mohsen Ghafoorian
- Abstract要約: 本稿では,注目マップの逆消去の新たな定式化を提案する。
提案手法はサリエンシマスクを必要とせず, 注意マップの識別対象領域への拡散を防止するために, 正規化損失を用いる。
パスカルVOCデータセットを用いた実験により, 従来と比べ2.1mIoU, 1.0mIoUのセグメンテーション性能が向上することが示された。
- 参考スコア(独自算出の注目度): 6.326017213490535
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic segmentation is a task that traditionally requires a large dataset
of pixel-level ground truth labels, which is time-consuming and expensive to
obtain. Recent advancements in the weakly-supervised setting show that
reasonable performance can be obtained by using only image-level labels.
Classification is often used as a proxy task to train a deep neural network
from which attention maps are extracted. However, the classification task needs
only the minimum evidence to make predictions, hence it focuses on the most
discriminative object regions. To overcome this problem, we propose a novel
formulation of adversarial erasing of the attention maps. In contrast to
previous adversarial erasing methods, we optimize two networks with opposing
loss functions, which eliminates the requirement of certain suboptimal
strategies; for instance, having multiple training steps that complicate the
training process or a weight sharing policy between networks operating on
different distributions that might be suboptimal for performance. The proposed
solution does not require saliency masks, instead it uses a regularization loss
to prevent the attention maps from spreading to less discriminative object
regions. Our experiments on the Pascal VOC dataset demonstrate that our
adversarial approach increases segmentation performance by 2.1 mIoU compared to
our baseline and by 1.0 mIoU compared to previous adversarial erasing
approaches.
- Abstract(参考訳): セマンティクスセグメンテーションは伝統的にピクセルレベルの基底真理ラベルの大規模なデータセットを必要とするタスクであり、時間と費用がかかる。
近年の弱教師付き設定の進歩により、画像レベルラベルのみを用いて合理的な性能が得られるようになった。
分類はしばしば、注目マップを抽出するディープニューラルネットワークをトレーニングするためのプロキシタスクとして使用される。
しかし、分類タスクは予測を行うために最小の証拠のみを必要とするため、最も識別可能な対象領域に焦点を当てている。
この問題を克服するために,注目マップの逆消去の新たな定式化を提案する。
従来の敵対的消去手法とは対照的に,ある準最適戦略の要件を排除した2つのネットワークを最適化する。例えば,訓練過程を複雑化する複数のトレーニングステップや,異なる分散上で動作しているネットワーク間の重み共有ポリシが,性能に最適である可能性がある。
提案手法はサリエンシマスクを必要とせず, 注意マップの識別対象領域への拡散を防止するために, 正規化損失を用いる。
パスカルVOCデータセットを用いた実験により, 従来と比べ2.1mIoU, 1.0mIoUのセグメンテーション性能が向上することが示された。
関連論文リスト
- Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - Open-Vocabulary Semantic Segmentation with Decoupled One-Pass Network [26.97153244517095]
入力画像の視覚言語モデルに1つのパスしか必要としないネットワークを提案する。
本稿ではまず,事前学習した視覚エンコーダにおけるパッチ埋め込み間の有害な干渉を抑制するために,パッチ重大度と呼ばれる新しいネットワーク適応手法を提案する。
そこで我々は,ネットワークがより差別的な特徴に着目するよう促すために,分類アンカー学習を提案する。
論文 参考訳(メタデータ) (2023-04-03T17:59:21Z) - Flip Learning: Erase to Segment [65.84901344260277]
弱い教師付きセグメンテーション(WSS)は、時間と面倒な手作業のアノテーションを減らすのに役立ちます。
ボックスアノテーションのみを必要とするFlip Learningという,斬新で汎用的なWSSフレームワークを提案する。
提案手法は,完全教師付き学習と弱教師付き学習のギャップを狭める大きな可能性を示す。
論文 参考訳(メタデータ) (2021-08-02T09:56:10Z) - Leveraging Auxiliary Tasks with Affinity Learning for Weakly Supervised
Semantic Segmentation [88.49669148290306]
そこで我々はAuxSegNetと呼ばれる弱教師付きマルチタスク・フレームワークを提案し,サリエンシ検出とマルチラベル画像分類を補助タスクとして活用する。
同様の構造的セマンティクスに着想を得て,サリエンシとセグメンテーションの表現から,クロスタスクなグローバル画素レベルの親和性マップを学習することを提案する。
学習されたクロスタスク親和性は、両方のタスクに対して改善された擬似ラベルを提供するために、唾液度予測を洗練し、CAMマップを伝播するために使用することができる。
論文 参考訳(メタデータ) (2021-07-25T11:39:58Z) - Standardized Max Logits: A Simple yet Effective Approach for Identifying
Unexpected Road Obstacles in Urban-Scene Segmentation [18.666365568765098]
本稿では,各予測クラスにおける最大ロジットの相対的意味を反映し,各分布を整列させるため,最大ロジットを標準化する,単純かつ効果的なアプローチを提案する。
提案手法は,一般公開されているFishyscapes Lost & Foundのリーダーボード上での最先端のパフォーマンスを高いマージンで達成する。
論文 参考訳(メタデータ) (2021-07-23T14:25:02Z) - Unsupervised Image Segmentation by Mutual Information Maximization and
Adversarial Regularization [7.165364364478119]
InMARS(Information Maximization and Adrial Regularization)と呼ばれる新しい教師なしセマンティックセマンティックセマンティクス手法を提案する。
シーンを知覚群に解析する人間の知覚に触発され、提案手法はまず、入力画像を意味のある領域(スーパーピクセルとも呼ばれる)に分割する。
次に、相互情報最大化(Multual-Information-Maximization)と、それらの領域を意味論的に意味のあるクラスにクラスタ化するための敵対的トレーニング戦略を利用する。
提案手法は2つの非教師付きセマンティックセグメンテーションデータセット上での最先端性能を実現することを実証した。
論文 参考訳(メタデータ) (2021-07-01T18:36:27Z) - Unsupervised Semantic Segmentation by Contrasting Object Mask Proposals [78.12377360145078]
画素埋め込みを学習するために、コントラスト最適化の目的として、予め決められた事前を取り入れた新しい2段階フレームワークを導入する。
これは、プロキシタスクやエンドツーエンドのクラスタリングに依存する既存の作業から大きく逸脱している。
特に、PASCALでラベル付き例の1%だけを用いて学習した表現を微調整すると、7.1% mIoUで教師付き ImageNet の事前トレーニングを上回ります。
論文 参考訳(メタデータ) (2021-02-11T18:54:47Z) - Pixel-Level Cycle Association: A New Perspective for Domain Adaptive
Semantic Segmentation [169.82760468633236]
本稿では,ソースとターゲットの画素ペア間の画素レベルサイクルの関連性を構築することを提案する。
我々の手法は1段階のエンドツーエンドで訓練でき、追加のパラメータは導入しない。
論文 参考訳(メタデータ) (2020-10-31T00:11:36Z) - Mixup-CAM: Weakly-supervised Semantic Segmentation via Uncertainty
Regularization [73.03956876752868]
我々は、ネットワークがオブジェクトの他の部分に注意を払うことを可能にする、原則的でエンドツーエンドのトレーニング可能なフレームワークを提案する。
具体的には、ミックスアップデータ拡張方式を分類ネットワークに導入し、2つの不確実な正規化項を設計し、ミックスアップ戦略をよりよく扱う。
論文 参考訳(メタデータ) (2020-08-03T21:19:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。