論文の概要: Beyond Discriminative Regions: Saliency Maps as Alternatives to CAMs for
Weakly Supervised Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2308.11052v1
- Date: Mon, 21 Aug 2023 21:30:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-23 19:48:34.585129
- Title: Beyond Discriminative Regions: Saliency Maps as Alternatives to CAMs for
Weakly Supervised Semantic Segmentation
- Title(参考訳): 識別領域を超えて:弱監視セマンティックセマンティックセグメンテーションのためのCAMに代わるサリエンシマップ
- Authors: M. Maruf, Arka Daw, Amartya Dutta, Jie Bu, Anuj Karpatne
- Abstract要約: 本稿では,Wakly Supervised Semantic (WS3) におけるサリエンシと CAM の総合比較について述べる。
我々は,ベンチマークデータセットに関する実証研究を通じて,CAMの限界に対処する上でのサリエンシの有効性を実証する。
- 参考スコア(独自算出の注目度): 7.518769185369959
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, several Weakly Supervised Semantic Segmentation (WS3)
methods have been proposed that use class activation maps (CAMs) generated by a
classifier to produce pseudo-ground truths for training segmentation models.
While CAMs are good at highlighting discriminative regions (DR) of an image,
they are known to disregard regions of the object that do not contribute to the
classifier's prediction, termed non-discriminative regions (NDR). In contrast,
attribution methods such as saliency maps provide an alternative approach for
assigning a score to every pixel based on its contribution to the
classification prediction. This paper provides a comprehensive comparison
between saliencies and CAMs for WS3. Our study includes multiple perspectives
on understanding their similarities and dissimilarities. Moreover, we provide
new evaluation metrics that perform a comprehensive assessment of WS3
performance of alternative methods w.r.t. CAMs. We demonstrate the
effectiveness of saliencies in addressing the limitation of CAMs through our
empirical studies on benchmark datasets. Furthermore, we propose random
cropping as a stochastic aggregation technique that improves the performance of
saliency, making it a strong alternative to CAM for WS3.
- Abstract(参考訳): 近年,分類器が生成するクラスアクティベーションマップ(cams)を用いて,訓練用セグメンテーションモデルの擬似基底真理を生成する,弱い教師付きセマンティックセグメンテーション(ws3)手法がいくつか提案されている。
CAMは画像の識別領域(DR)を強調するのが得意であるが、分類器の予測に寄与しない物体の領域を無視することが知られている。
対照的に、サリエンシーマップのような帰属法は、分類予測への貢献に基づいて各ピクセルにスコアを割り当てる別のアプローチを提供する。
本稿では、WS3に対する唾液とCAMを包括的に比較する。
本研究は, 類似点と相違点の理解に関する複数の視点を含む。
さらに、代替手法であるCAMのWS3性能を総合的に評価する新しい評価指標を提供する。
我々は,ベンチマークデータセットに関する実証研究を通じて,CAMの限界に対処する上でのサリエンシの有効性を示す。
さらに,サリエンシ性能を向上させる確率的集約手法としてランダムトリミングを提案し,WS3 に対する CAM の強力な代替となる。
関連論文リスト
- Generalize or Detect? Towards Robust Semantic Segmentation Under Multiple Distribution Shifts [56.57141696245328]
斬新なクラスとドメインの両方が存在するようなオープンワールドシナリオでは、理想的なセグメンテーションモデルは安全のために異常なクラスを検出する必要がある。
既存の方法はドメインレベルとセマンティックレベルの分散シフトを区別するのに苦労することが多い。
論文 参考訳(メタデータ) (2024-11-06T11:03:02Z) - Volumetric Semantically Consistent 3D Panoptic Mapping [77.13446499924977]
非構造環境における自律エージェントに適したセマンティック3Dマップを生成することを目的としたオンライン2次元から3次元のセマンティック・インスタンスマッピングアルゴリズムを提案する。
マッピング中にセマンティック予測の信頼性を統合し、セマンティックおよびインスタンス一貫性のある3D領域を生成する新しい方法を導入する。
提案手法は,パブリックな大規模データセット上での最先端の精度を実現し,多くの広く使用されているメトリクスを改善した。
論文 参考訳(メタデータ) (2023-09-26T08:03:10Z) - Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - Discrepancy-based Active Learning for Weakly Supervised Bleeding
Segmentation in Wireless Capsule Endoscopy Images [36.39723547760312]
本稿では,CAMと地上の真理のギャップをいくつかのアノテーションで埋めるために,新たな離散型ベースEdアクティブラーニング手法を提案する。
具体的には、労働を解放するために、ノイズの多いCAMを正確なモデル予測といくつかの人間ラベルに置き換えるために、新しい離散デコーダとCAMPUS基準を設計する。
提案手法は最先端のアクティブラーニング手法より優れており,トレーニングデータの10%しかラベル付けされていない完全アノテートデータセットでトレーニングされたものと同等の性能を発揮する。
論文 参考訳(メタデータ) (2023-08-09T15:04:17Z) - Decom--CAM: Tell Me What You See, In Details! Feature-Level Interpretation via Decomposition Class Activation Map [23.71680014689873]
クラスアクティベーションマップ(CAM)は、オブジェクトの位置をハイライトすることで深層モデルの予測を解釈するために広く使われている。
本稿では,分解クラス活性化マップ(Decom-CAM)と呼ばれる2段階の解釈可能性を提案する。
実験の結果,提案したDecom-CAMは最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2023-05-27T14:33:01Z) - Extracting Class Activation Maps from Non-Discriminative Features as
well [23.968856513180032]
分類モデルからのクラスアクティベーションマップ(CAM)は、しばしば前景オブジェクトのカバレッジが低くなる。
本稿では,識別不能な特徴を明示的にキャプチャするCAMの新しい計算手法を提案する。
結果のKクラスタセンターは、ローカルプロトタイプと呼ばれ、"head"、"leg"、"body"の"sheep"といったローカルセマンティクスを表しています。
論文 参考訳(メタデータ) (2023-03-18T04:47:42Z) - PointInst3D: Segmenting 3D Instances by Points [136.7261709896713]
本稿では,ポイント単位の予測方式で機能する,完全畳み込み型3Dポイントクラウドインスタンスセグメンテーション手法を提案する。
その成功の鍵は、各サンプルポイントに適切なターゲットを割り当てることにある。
提案手法はScanNetとS3DISのベンチマークで有望な結果が得られる。
論文 参考訳(メタデータ) (2022-04-25T02:41:46Z) - Importance Sampling CAMs for Weakly-Supervised Segmentation [16.86352815414646]
クラスアクティベーションマップ(CAM)は、クラスアクティベーションマップ(CAM)を用いて、画像内のオブジェクトのローカライズとセグメント化に使用できる。
本研究では,CAM学習の改善に2つの貢献によって両問題にアプローチする。
PASCAL VOC 2012ベンチマークデータセットを用いて,これらの修正によって輪郭精度が著しく向上することを示す。
論文 参考訳(メタデータ) (2022-03-23T14:54:29Z) - Complementary Patch for Weakly Supervised Semantic Segmentation [25.990386258122726]
情報量の増加として,クラス活性化マップ(CAM)における対象領域の拡大を定式化する。
本稿では,新しい補足パッチ(CP)表現を提案するとともに,CPペアという補足的隠れ部分を持つ一対の入力画像によるCAMの和の情報が,ベースラインCAMの情報よりも大きいか等しいことを証明した。
CAMの品質をさらに向上するために,文脈情報を強化するために,Pixel-Region correlation Module (PRCM)を提案する。
論文 参考訳(メタデータ) (2021-08-09T07:50:54Z) - MCDAL: Maximum Classifier Discrepancy for Active Learning [74.73133545019877]
近年の最先端のアクティブラーニング手法は, 主にGAN(Generative Adversarial Networks)をサンプル取得に活用している。
本稿では,MCDAL(Maximum Discrepancy for Active Learning)と呼ぶ新しいアクティブラーニングフレームワークを提案する。
特に,両者の差分を最大化することにより,より厳密な決定境界を学習する2つの補助的分類層を利用する。
論文 参考訳(メタデータ) (2021-07-23T06:57:08Z) - Region Comparison Network for Interpretable Few-shot Image
Classification [97.97902360117368]
新しいクラスのモデルをトレーニングするために、ラベル付きサンプルの限られた数だけを効果的に活用するための画像分類が提案されている。
本研究では,領域比較ネットワーク (RCN) と呼ばれる距離学習に基づく手法を提案する。
また,タスクのレベルからカテゴリへの解釈可能性の一般化も提案する。
論文 参考訳(メタデータ) (2020-09-08T07:29:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。