論文の概要: PixelCAM: Pixel Class Activation Mapping for Histology Image Classification and ROI Localization
- arxiv url: http://arxiv.org/abs/2503.24135v1
- Date: Mon, 31 Mar 2025 14:18:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-01 19:35:57.442791
- Title: PixelCAM: Pixel Class Activation Mapping for Histology Image Classification and ROI Localization
- Title(参考訳): PixelCAM: 画像分類とROIローカライゼーションのためのPixelクラスアクティベーションマッピング
- Authors: Alexis Guichemerre, Soufiane Belharbi, Mohammadhadi Shateri, Luke McCaffrey, Eric Granger,
- Abstract要約: 弱教師付きオブジェクトローカライゼーション(WSOL)メソッドは、トレーニングモデルで画像の分類とROIのローカライズを可能にする。
標準WSOL法は, クラスアクティベーションマッピング(CAM)法に依存し, 単一または2段階の戦略に従って空間的局所化マップを生成する。
我々は,空間オブジェクトの局所化が可能な画素特徴空間における,コスト効率の良いフォアグラウンド/バックグラウンドの画素ワイズ分類器であるPixelCAMを提案する。
- 参考スコア(独自算出の注目度): 7.869923456842283
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Weakly supervised object localization (WSOL) methods allow training models to classify images and localize ROIs. WSOL only requires low-cost image-class annotations yet provides a visually interpretable classifier, which is important in histology image analysis. Standard WSOL methods rely on class activation mapping (CAM) methods to produce spatial localization maps according to a single- or two-step strategy. While both strategies have made significant progress, they still face several limitations with histology images. Single-step methods can easily result in under- or over-activation due to the limited visual ROI saliency in histology images and the limited localization cues. They also face the well-known issue of asynchronous convergence between classification and localization tasks. The two-step approach is sub-optimal because it is tied to a frozen classifier, limiting the capacity for localization. Moreover, these methods also struggle when applied to out-of-distribution (OOD) datasets. In this paper, a multi-task approach for WSOL is introduced for simultaneous training of both tasks to address the asynchronous convergence problem. In particular, localization is performed in the pixel-feature space of an image encoder that is shared with classification. This allows learning discriminant features and accurate delineation of foreground/background regions to support ROI localization and image classification. We propose PixelCAM, a cost-effective foreground/background pixel-wise classifier in the pixel-feature space that allows for spatial object localization. PixelCAM is trained using pixel pseudo-labels collected from a pretrained WSOL model. Both image and pixel-wise classifiers are trained simultaneously using standard gradient descent. In addition, our pixel classifier can easily be integrated into CNN- and transformer-based architectures without any modifications.
- Abstract(参考訳): 弱教師付きオブジェクトローカライゼーション(WSOL)メソッドは、トレーニングモデルで画像の分類とROIのローカライズを可能にする。
WSOLは、低コストのイメージクラスアノテーションしか必要としないが、視覚的に解釈可能な分類器を提供する。
標準WSOL法は, クラスアクティベーションマッピング(CAM)法に依存し, 単一または2段階の戦略に従って空間的局所化マップを生成する。
どちらの戦略も大きな進歩を遂げているが、組織像ではいくつかの制限に直面している。
単段階法では, 組織像の視力低下と局所化の限界により, 視力低下や過度な活動が容易に引き起こされる。
彼らはまた、分類タスクとローカライゼーションタスクの非同期収束というよく知られた問題に直面している。
2段階のアプローチは、凍結した分類器に結びついており、ローカライゼーションの能力を制限するため、準最適である。
さらに、これらの手法は、アウト・オブ・ディストリビューション(OOD)データセットに適用する場合にも苦労する。
本稿では,非同期収束問題に対処する両タスクの同時学習のためのWSOLのマルチタスク手法を提案する。
特に、分類と共有される画像エンコーダの画素特徴空間におけるローカライゼーションを行う。
これにより、ROIのローカライゼーションと画像分類をサポートするために、差別的特徴の学習と、前景/背景領域の正確な記述が可能になる。
我々は,空間オブジェクトの局所化が可能な画素特徴空間における,コスト効率の良いフォアグラウンド/バックグラウンドの画素ワイズ分類器であるPixelCAMを提案する。
PixelCAMは、事前訓練されたWSOLモデルから収集されたピクセル擬似ラベルを使用して訓練される。
画像および画素単位の分類器は、標準勾配降下法を用いて同時に訓練される。
さらに,我々の画素分類器はCNNやトランスフォーマーをベースとしたアーキテクチャに容易に組み込むことができる。
関連論文リスト
- TeD-Loc: Text Distillation for Weakly Supervised Object Localization [13.412674368913747]
TeD-Locは、CLIPテキストの埋め込みからモデルバックボーンに知識を抽出し、パッチレベルのローカライゼーションを生成するアプローチである。
CUBとILSVRCの両方のデータセットで、最先端モデルのTop-1LOC精度を約5%向上させる。
論文 参考訳(メタデータ) (2025-01-22T04:36:17Z) - Pixel-Inconsistency Modeling for Image Manipulation Localization [59.968362815126326]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。
本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。
実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文 参考訳(メタデータ) (2023-09-30T02:54:51Z) - High-fidelity Pseudo-labels for Boosting Weakly-Supervised Segmentation [17.804090651425955]
画像レベルの弱い教師付きセグメンテーション(WSSS)は、トレーニング中にセグメンテーションマスクを代理することで、通常膨大なデータアノテーションコストを削減する。
本研究は,GAPの代替となる重要サンプリングと特徴類似性損失という,CAMを改善するための2つの手法に基づく。
複数の独立二項問題の後部二項問題に基づいて両手法を再構成する。
パフォーマンスが向上し、より一般的なものになり、事実上あらゆるWSSSメソッドを増強できるアドオンメソッドが出来上がります。
論文 参考訳(メタデータ) (2023-04-05T17:43:57Z) - Spatial-Aware Token for Weakly Supervised Object Localization [137.0570026552845]
タスク固有の空間認識トークンを,弱教師付き方式で条件定位に提案する。
実験の結果、SATはCUB-200とImageNetの両方で、98.45%と73.13%のGT-known Locで最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2023-03-18T15:38:17Z) - Background-aware Classification Activation Map for Weakly Supervised
Object Localization [14.646874544729426]
対象と背景の両方のローカライズスコアを同時に学習するための背景認識型分類活性化マップ(B-CAM)を提案する。
我々のB-CAMは、提案したスタガー分類損失に基づいてエンドツーエンドで訓練することができる。
実験の結果,我々のB-CAMはCUB-200,OpenImages,VOC2012データセット上で一段階WSOL法より優れていた。
論文 参考訳(メタデータ) (2021-12-29T03:12:09Z) - Discriminative Region-based Multi-Label Zero-Shot Learning [145.0952336375342]
マルチラベルゼロショット学習(Multi-label zero-shot Learning、ZSL)は、標準のシングルラベルZSLのより現実的な対位法である。
本稿では,地域別識別可能性保存型ZSLに対する代替アプローチを提案する。
論文 参考訳(メタデータ) (2021-08-20T17:56:47Z) - Spatially Consistent Representation Learning [12.120041613482558]
本研究では,空間的に一貫した表現学習アルゴリズム(SCRL)を提案する。
ランダムに切り抜かれた局所領域のコヒーレントな空間表現を作ろうとする新しい自己教師付き目的を考案する。
ベンチマークデータセットを用いた下流のローカライゼーションタスクでは、提案したSCRLは大幅な性能改善を示す。
論文 参考訳(メタデータ) (2021-03-10T15:23:45Z) - Isometric Propagation Network for Generalized Zero-shot Learning [72.02404519815663]
一般的な戦略は、クラス属性の意味空間と、見たクラスとそのデータに基づいて画像の視覚空間とのマッピングを学ぶことである。
本稿では,各空間内のクラス間の関係を強化し,2つの空間におけるクラス依存性を整合させるIsometric propagation Network (IPN)を提案する。
IPNは3つの人気のあるゼロショット学習ベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2021-02-03T12:45:38Z) - Cross-Descriptor Visual Localization and Mapping [81.16435356103133]
視覚のローカライゼーションとマッピングは、Mixed Realityとロボティクスシステムの大部分を支える重要な技術である。
特徴表現の連続的な更新を必要とする局所化とマッピングのための3つの新しいシナリオを提案する。
我々のデータ駆動型アプローチは特徴記述子型に非依存であり、計算要求が低く、記述アルゴリズムの数と線形にスケールする。
論文 参考訳(メタデータ) (2020-12-02T18:19:51Z) - Inter-Image Communication for Weakly Supervised Localization [77.2171924626778]
弱教師付きローカライゼーションは、画像レベルの監督のみを使用して対象対象領域を見つけることを目的としている。
我々は,より正確な物体位置を学習するために,異なる物体間の画素レベルの類似性を活用することを提案する。
ILSVRC検証セット上でトップ1のローカライズ誤差率45.17%を達成する。
論文 参考訳(メタデータ) (2020-08-12T04:14:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。