論文の概要: Instance-Guided Class Activation Mapping for Weakly Supervised Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2509.12496v1
- Date: Mon, 15 Sep 2025 22:41:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-17 17:50:52.796545
- Title: Instance-Guided Class Activation Mapping for Weakly Supervised Semantic Segmentation
- Title(参考訳): 弱教師付きセマンティックセグメンテーションのためのインスタンスガイド型クラスアクティベーションマッピング
- Authors: Ali Torabi, Sanjog Gaihre, MD Mahbubur Rahman, Yaqoob Majeed,
- Abstract要約: 我々は,高品質で境界対応なローカライゼーションマップを生成する新しい手法IG-CAMを提案する。
提案手法は,完全な対象範囲と正確な境界線による局所化精度が向上することを示す。
IG-CAMを弱教師付きセマンティックセグメンテーションのための新しいベンチマークとして確立した。
- 参考スコア(独自算出の注目度): 5.539128209356213
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Weakly Supervised Semantic Segmentation (WSSS) addresses the challenge of training segmentation models using only image-level annotations, eliminating the need for expensive pixel-level labeling. While existing methods struggle with precise object boundary localization and often focus only on the most discriminative regions, we propose IG-CAM (Instance-Guided Class Activation Mapping), a novel approach that leverages instance-level cues and influence functions to generate high-quality, boundary-aware localization maps. Our method introduces three key innovations: (1) Instance-Guided Refinement that uses ground truth segmentation masks to guide CAM generation, ensuring complete object coverage rather than just discriminative parts; (2) Influence Function Integration that captures the relationship between training samples and model predictions, leading to more robust feature representations; and (3) Multi-Scale Boundary Enhancement that employs progressive refinement strategies to achieve sharp, precise object boundaries. IG-CAM achieves state-of-the-art performance on the PASCAL VOC 2012 dataset with an mIoU of 82.3% before post-processing, which further improves to 86.6% after applying Conditional Random Field (CRF) refinement, significantly outperforming previous WSSS methods. Our approach demonstrates superior localization accuracy, with complete object coverage and precise boundary delineation, while maintaining computational efficiency. Extensive ablation studies validate the contribution of each component, and qualitative comparisons across 600 diverse images showcase the method's robustness and generalization capability. The results establish IG-CAM as a new benchmark for weakly supervised semantic segmentation, offering a practical solution for scenarios where pixel-level annotations are unavailable or prohibitively expensive.
- Abstract(参考訳): Weakly Supervised Semantic Segmentation (WSSS)は、画像レベルのアノテーションのみを使用してセグメンテーションモデルをトレーニングするという課題に対処し、高価なピクセルレベルのラベリングを必要としない。
既存の手法は正確なオブジェクト境界のローカライゼーションに苦慮し,最も識別性の高い領域にのみ焦点をあてることが多いが, IG-CAM(インスタンスガイド型クラス活性化マッピング)は, インスタンスレベルのキューと影響関数を利用して高品質で境界対応のローカライゼーションマップを生成する新しいアプローチである。
提案手法では,(1)CAM生成を誘導し,識別的部分よりも完全な対象カバレッジを確保する,(2)訓練サンプルとモデル予測の関係を捉え,より堅牢な特徴表現につながる,影響関数の統合,(3)高度で精密な対象境界を達成するためのプログレッシブ・リファウンダリー・プログレッシブ・リファウンダリー・エンハンスメントの3つの重要なイノベーションを紹介する。
IG-CAMは、後処理前のmIoUが82.3%のPASCAL VOC 2012データセットで最先端のパフォーマンスを達成し、条件付きランダムフィールド(CRF)の改良により86.6%に向上し、従来のWSSSメソッドよりも大幅に向上した。
提案手法は,計算効率を保ちながら,完全な対象範囲と境界線を正確に記述し,より優れた局所化精度を示す。
広範囲にわたるアブレーション研究は、各成分の寄与を検証し、600の多様な画像に対する質的な比較は、この手法の堅牢性と一般化能力を示している。
その結果、IG-CAMは弱い教師付きセマンティックセグメンテーションのための新しいベンチマークとして確立され、ピクセルレベルのアノテーションが利用できない、あるいは違法に高価であるシナリオに対して実用的なソリューションを提供する。
関連論文リスト
- A Deep Learning Framework for Boundary-Aware Semantic Segmentation [9.680285420002516]
本研究では境界拡張機能ブリッジングモジュール(BEFBM)を用いたMask2Formerに基づくセマンティックセマンティックセマンティクスアルゴリズムを提案する。
提案手法は,mIOU,mDICE,mRecallなどのメトリクスを大幅に改善する。
ビジュアル分析は、きめ細かい領域におけるモデルの利点を裏付ける。
論文 参考訳(メタデータ) (2025-03-28T00:00:08Z) - Context-Aware Weakly Supervised Image Manipulation Localization with SAM Refinement [52.15627062770557]
悪意のある画像操作は社会的リスクを生じさせ、効果的な画像操作検出方法の重要性を高めている。
画像操作検出の最近のアプローチは、完全に教師されたアプローチによって大きく推進されている。
本稿では,デュアルブランチトランスフォーマー-CNNアーキテクチャに基づく,弱教師付きフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-26T07:35:09Z) - When Segmentation Meets Hyperspectral Image: New Paradigm for Hyperspectral Image Classification [4.179738334055251]
ハイパースペクトル画像(HSI)分類は、リモートセンシングの基盤であり、豊富なスペクトル情報を通じて正確な材料と土地被覆の識別を可能にする。
ディープラーニングはこのタスクに大きな進歩をもたらしたが、小さなパッチベースの分類器は進歩の90%以上を占めており、制限に直面している。
本研究では, HSI分類のための新しいパラダイムとベースラインであるHSIsegを提案し, これらの課題を克服するために, 分割手法と新しい動的シフト地域変換器(DSRT)を組み合わせる。
論文 参考訳(メタデータ) (2025-02-18T05:04:29Z) - Progressive Feature Self-reinforcement for Weakly Supervised Semantic
Segmentation [55.69128107473125]
Weakly Supervised Semantic (WSSS) のイメージレベルラベルを用いたシングルステージアプローチを提案する。
我々は、画像内容が決定論的領域(例えば、自信ある前景と背景)と不確実領域(例えば、オブジェクト境界と誤分類されたカテゴリ)に適応的に分割して、別々の処理を行う。
そこで我々は,これらの自信のある領域と同一のクラスラベルを持つ拡張画像とのセマンティック一貫性を制約する補完的な自己強調手法を提案する。
論文 参考訳(メタデータ) (2023-12-14T13:21:52Z) - Background Activation Suppression for Weakly Supervised Object
Localization and Semantic Segmentation [84.62067728093358]
弱教師付きオブジェクトローカライゼーションとセマンティックセグメンテーションは、画像レベルのラベルのみを使用してオブジェクトをローカライズすることを目的としている。
画素レベルのローカライゼーションを実現するために,フォアグラウンド予測マップを生成することで,新たなパラダイムが誕生した。
本稿では,物体の局在化学習過程に関する2つの驚くべき実験結果を示す。
論文 参考訳(メタデータ) (2023-09-22T15:44:10Z) - Boosting Weakly-Supervised Image Segmentation via Representation,
Transform, and Compensator [26.991314511807907]
既存のWSISアプローチでは多段階の訓練手順が広く使われており、質の高い擬似マスクを基礎として取得している。
そこで本研究では,Symese ネットワークとコントラスト学習を用いて,クラスアクティベーションマップ(CAM)の品質を向上し,自己補充プロセスを実現するための,新しいワンステージ WSIS 手法を提案する。
PASCAL VOC 2012データセットでは67.2%と68.76%のmIoUを達成した。
論文 参考訳(メタデータ) (2023-09-02T09:07:25Z) - High-fidelity Pseudo-labels for Boosting Weakly-Supervised Segmentation [17.804090651425955]
画像レベルの弱い教師付きセグメンテーション(WSSS)は、トレーニング中にセグメンテーションマスクを代理することで、通常膨大なデータアノテーションコストを削減する。
本研究は,GAPの代替となる重要サンプリングと特徴類似性損失という,CAMを改善するための2つの手法に基づく。
複数の独立二項問題の後部二項問題に基づいて両手法を再構成する。
パフォーマンスが向上し、より一般的なものになり、事実上あらゆるWSSSメソッドを増強できるアドオンメソッドが出来上がります。
論文 参考訳(メタデータ) (2023-04-05T17:43:57Z) - Weakly Supervised Semantic Segmentation via Progressive Patch Learning [39.87150496277798]
分類の局所的詳細抽出を改善するために「プログレッシブ・パッチ・ラーニング」アプローチを提案する。
は、機能マップをパッチに分解し、最終的なアグリゲーションの前に各ローカルパッチを独立して処理する。
プログレッシブ・パッチ・ラーニング(Progressive Patch Learning)は、特徴の破壊とパッチ・ラーニングをさらにプログレッシブな方法で多段階の粒度に拡張する。
論文 参考訳(メタデータ) (2022-09-16T09:54:17Z) - Collaborative Propagation on Multiple Instance Graphs for 3D Instance
Segmentation with Single-point Supervision [63.429704654271475]
本稿では,1つのオブジェクトを1つのポイントでラベル付けするだけでよい,弱教師付き手法RWSegを提案する。
これらの疎いラベルにより、セマンティック情報とインスタンス情報を伝達する2つの分岐を持つ統一的なフレームワークを導入する。
具体的には、異なるインスタンスグラフ間の競合を促進するクロスグラフ競合ランダムウォークス(CRW)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-08-10T02:14:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。