論文の概要: Activation-Based Sampling for Pixel- to Image-Level Aggregation in
Weakly-Supervised Segmentation
- arxiv url: http://arxiv.org/abs/2203.12459v1
- Date: Wed, 23 Mar 2022 14:54:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-24 21:14:52.883090
- Title: Activation-Based Sampling for Pixel- to Image-Level Aggregation in
Weakly-Supervised Segmentation
- Title(参考訳): 弱修正セグメンテーションにおける画素対画像レベルアグリゲーションのアクティベーションに基づくサンプリング
- Authors: Arvi Jonnarth, Michael Felsberg, Yushan Zhang
- Abstract要約: クラスアクティベーションマップ(CAM)は、クラス予測を用いて画像内のオブジェクトをローカライズし、セグメント化するために使用することができる。
我々はCAM学習を改善するための2つの貢献を提案する。
まず、CAMによって誘導されるクラスワイドな確率質量関数に基づいて重要度を抽出し、画像レベルのクラス予測を生成する。
第2に,画像のエッジと予測輪郭の一致を目的とした特徴類似性損失項を定式化する。
- 参考スコア(独自算出の注目度): 14.321459549557527
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Classification networks can be used to localize and segment objects in images
by means of class activation maps (CAMs). However, without pixel-level
annotations, they are known to (1) mainly focus on discriminative regions, and
(2) to produce diffuse CAMs without well-defined prediction contours. In this
work, we approach both problems with two contributions for improving CAM
learning. First, we incorporate importance sampling based on the class-wise
probability mass function induced by the CAMs to produce stochastic image-level
class predictions. This results in CAMs which activate over a larger extent of
the objects. Second, we formulate a feature similarity loss term which aims to
match the prediction contours with edges in the image. As a third contribution,
we conduct experiments on the PASCAL VOC and MS-COCO benchmark datasets to
demonstrate that these modifications significantly increase the performance in
terms of contour accuracy, while being comparable to current state-of-the-art
methods in terms of region similarity.
- Abstract(参考訳): 分類ネットワークは、クラスアクティベーションマップ(cams)によって画像内のオブジェクトのローカライズとセグメンテーションに使用することができる。
しかし,ピクセルレベルのアノテーションがなければ,(1)識別領域に焦点をあてること,(2)よく定義された予測輪郭のない拡散CAMを生成することが知られている。
本研究では,CAM学習の改善に2つの貢献によって両問題にアプローチする。
まず,camsによって引き起こされるクラス毎確率質量関数に基づく重要度サンプリングを行い,確率的画像レベルのクラス予測を行う。
これにより、CAMはより大きな範囲のオブジェクトを活性化する。
次に,画像のエッジと予測輪郭の一致を目的とした特徴類似性損失項を定式化する。
第3のコントリビューションとして,PASCAL VOCおよびMS-COCOベンチマークデータセットを用いた実験を行い,これらの修正によって輪郭精度が著しく向上することを示した。
関連論文リスト
- Auxiliary Tasks Enhanced Dual-affinity Learning for Weakly Supervised
Semantic Segmentation [79.05949524349005]
AuxSegNet+は、サリエンシマップから豊富な情報を探索する弱教師付き補助学習フレームワークである。
また,サリエンシとセグメンテーションの特徴マップから画素レベルの親和性を学習するためのクロスタスク親和性学習機構を提案する。
論文 参考訳(メタデータ) (2024-03-02T10:03:21Z) - BroadCAM: Outcome-agnostic Class Activation Mapping for Small-scale
Weakly Supervised Applications [69.22739434619531]
そこで我々はBroadCAMと呼ばれる結果に依存しないCAMアプローチを提案する。
VOC2012でBroadCAM、WSSSでBCSS-WSSS、WSOLでOpenImages30kを評価することで、BroadCAMは優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2023-09-07T06:45:43Z) - Beyond Discriminative Regions: Saliency Maps as Alternatives to CAMs for
Weakly Supervised Semantic Segmentation [7.518769185369959]
本稿では,Wakly Supervised Semantic (WS3) におけるサリエンシと CAM の総合比較について述べる。
我々は,ベンチマークデータセットに関する実証研究を通じて,CAMの限界に対処する上でのサリエンシの有効性を実証する。
論文 参考訳(メタデータ) (2023-08-21T21:30:48Z) - High-fidelity Pseudo-labels for Boosting Weakly-Supervised Segmentation [17.804090651425955]
画像レベルの弱い教師付きセグメンテーション(WSSS)は、トレーニング中にセグメンテーションマスクを代理することで、通常膨大なデータアノテーションコストを削減する。
本研究は,GAPの代替となる重要サンプリングと特徴類似性損失という,CAMを改善するための2つの手法に基づく。
複数の独立二項問題の後部二項問題に基づいて両手法を再構成する。
パフォーマンスが向上し、より一般的なものになり、事実上あらゆるWSSSメソッドを増強できるアドオンメソッドが出来上がります。
論文 参考訳(メタデータ) (2023-04-05T17:43:57Z) - Attention-based Class Activation Diffusion for Weakly-Supervised
Semantic Segmentation [98.306533433627]
クラスアクティベーションマップの抽出(CAM)は、弱教師付きセマンティックセグメンテーション(WSSS)の重要なステップである
本稿では,CAMとアテンション行列を確率的拡散法で結合する新しい手法を提案し,それをAD-CAMとダブする。
擬似ラベルとしてのAD-CAMは、最先端のCAMよりも強力なWSSSモデルが得られることを示す実験である。
論文 参考訳(メタデータ) (2022-11-20T10:06:32Z) - Saliency Guided Inter- and Intra-Class Relation Constraints for Weakly
Supervised Semantic Segmentation [66.87777732230884]
本稿では,活性化対象領域の拡大を支援するために,Salliency Guided Inter-およびIntra-Class Relation Constrained (I$2$CRC) フレームワークを提案する。
また,オブジェクトガイド付きラベルリファインメントモジュールを導入し,セグメンテーション予測と初期ラベルをフル活用し,優れた擬似ラベルを得る。
論文 参考訳(メタデータ) (2022-06-20T03:40:56Z) - LEAD: Self-Supervised Landmark Estimation by Aligning Distributions of
Feature Similarity [49.84167231111667]
自己監督型ランドマーク検出における既存の研究は、画像から高密度(ピクセルレベルの)特徴表現を学習することに基づいている。
自己教師付き方式で高密度同変表現の学習を強化するアプローチを提案する。
機能抽出器にそのような先行性があることは,アノテーションの数が大幅に制限されている場合でも,ランドマーク検出に役立ちます。
論文 参考訳(メタデータ) (2022-04-06T17:48:18Z) - SSA: Semantic Structure Aware Inference for Weakly Pixel-Wise Dense
Predictions without Cost [36.27226683586425]
The semantic structure aware inference (SSA) was proposed to explore the semantic structure information hidden in different stage of the CNN-based network to generate high-quality CAM in the model inference。
提案手法はパラメータを含まない利点があり,訓練は不要である。したがって,弱教師付き画素ワイド予測タスクにも適用可能である。
論文 参考訳(メタデータ) (2021-11-05T11:07:21Z) - Towards Learning Spatially Discriminative Feature Representations [26.554140976236052]
組込み特徴写像をクラスアクティベーションマップ(CAM)に制約する新しい損失関数(CAM-loss)を提案する。
CAM-lossはバックボーンを駆動し、ターゲットカテゴリの特徴を表現し、ターゲット以外のカテゴリやバックグラウンドの特徴を抑圧する。
実験の結果, CAM-lossは様々なネットワーク構造に適用可能であり, 画像分類の性能向上のために, 主流の正規化手法と組み合わせることができることがわかった。
論文 参考訳(メタデータ) (2021-09-03T08:04:17Z) - Calibrating Class Activation Maps for Long-Tailed Visual Recognition [60.77124328049557]
本稿では,CNNの長期分布からネットワーク学習を改善するための2つの効果的な修正を提案する。
まず,ネットワーク分類器の学習と予測を改善するために,CAMC (Class Activation Map) モジュールを提案する。
第2に,長期化問題における表現学習における正規化分類器の利用について検討する。
論文 参考訳(メタデータ) (2021-08-29T05:45:03Z) - Complementary Patch for Weakly Supervised Semantic Segmentation [25.990386258122726]
情報量の増加として,クラス活性化マップ(CAM)における対象領域の拡大を定式化する。
本稿では,新しい補足パッチ(CP)表現を提案するとともに,CPペアという補足的隠れ部分を持つ一対の入力画像によるCAMの和の情報が,ベースラインCAMの情報よりも大きいか等しいことを証明した。
CAMの品質をさらに向上するために,文脈情報を強化するために,Pixel-Region correlation Module (PRCM)を提案する。
論文 参考訳(メタデータ) (2021-08-09T07:50:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。