論文の概要: Model Guidance via Explanations Turns Image Classifiers into Segmentation Models
- arxiv url: http://arxiv.org/abs/2407.03009v1
- Date: Wed, 3 Jul 2024 11:10:23 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-04 14:35:46.923376
- Title: Model Guidance via Explanations Turns Image Classifiers into Segmentation Models
- Title(参考訳): 説明によるモデルガイダンスによる画像分類器のセグメンテーションモデルへの変換
- Authors: Xiaoyan Yu, Jannik Franzen, Wojciech Samek, Marina M. -C. Höhne, Dagmar Kainmueller,
- Abstract要約: 説明可能なAI手法による画像分類網の入力から生成した熱マップは、多くの場合、入力画像のセグメンテーションに類似している。
ヒートマップは、画像レベルの監督を伴う弱い教師付きセグメンテーションを達成するためにも活用されている。
差分型ヒートマップアーキテクチャは, 標準的なセグメンテーション損失のトレーニングにおいて, 競争力のある結果が得られることを示す。
- 参考スコア(独自算出の注目度): 13.85005321386124
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Heatmaps generated on inputs of image classification networks via explainable AI methods like Grad-CAM and LRP have been observed to resemble segmentations of input images in many cases. Consequently, heatmaps have also been leveraged for achieving weakly supervised segmentation with image-level supervision. On the other hand, losses can be imposed on differentiable heatmaps, which has been shown to serve for (1)~improving heatmaps to be more human-interpretable, (2)~regularization of networks towards better generalization, (3)~training diverse ensembles of networks, and (4)~for explicitly ignoring confounding input features. Due to the latter use case, the paradigm of imposing losses on heatmaps is often referred to as "Right for the right reasons". We unify these two lines of research by investigating semi-supervised segmentation as a novel use case for the Right for the Right Reasons paradigm. First, we show formal parallels between differentiable heatmap architectures and standard encoder-decoder architectures for image segmentation. Second, we show that such differentiable heatmap architectures yield competitive results when trained with standard segmentation losses. Third, we show that such architectures allow for training with weak supervision in the form of image-level labels and small numbers of pixel-level labels, outperforming comparable encoder-decoder models. Code is available at \url{https://github.com/Kainmueller-Lab/TW-autoencoder}.
- Abstract(参考訳): Grad-CAMやLRPのような説明可能なAI手法による画像分類ネットワークの入力から生成されたヒートマップは、多くの場合、入力画像のセグメンテーションに類似している。
その結果、画像レベルの監督を伴う弱教師付きセグメンテーションを実現するために、ヒートマップも活用されている。
一方、(1)より人間的に解釈可能なヒートマップの改善、(2)より優れた一般化に向けてのネットワークの正規化、(3)多様なネットワークのアンサンブルのトレーニング、(4)〜明示的に不明確な入力特徴を無視するためのヒートマップに損失を課すことができる。
後者のユースケースのため、ヒートマップに損失を与えるパラダイムは、しばしば「正しい理由の右」と呼ばれる。
右利権パラダイムの新たなユースケースとして,半教師付きセグメンテーションを探求することで,これらの2つの研究を統一する。
まず、画像分割のための微分可能ヒートマップアーキテクチャと標準エンコーダデコーダアーキテクチャの形式的並列性を示す。
第2に、このような微分可能なヒートマップアーキテクチャは、標準的なセグメンテーション損失でトレーニングされた場合、競合する結果が得られることを示す。
第3に,このようなアーキテクチャは,画像レベルラベルや少数のピクセルレベルラベルの形式で,弱い監督力を持つトレーニングを可能にし,同等のエンコーダ・デコーダモデルより優れていることを示す。
コードは \url{https://github.com/Kainmueller-Lab/TW-autoencoder} で入手できる。
関連論文リスト
- Triple-View Knowledge Distillation for Semi-Supervised Semantic
Segmentation [54.23510028456082]
半教師付きセマンティックセグメンテーションのためのトリプルビュー知識蒸留フレームワークTriKDを提案する。
このフレームワークは、トリプルビューエンコーダとデュアル周波数デコーダを含む。
論文 参考訳(メタデータ) (2023-09-22T01:02:21Z) - CorrMatch: Label Propagation via Correlation Matching for
Semi-Supervised Semantic Segmentation [73.89509052503222]
本稿では、CorrMatchと呼ばれる、単純だが実行可能な半教師付きセマンティックセマンティックセマンティックセマンティクス手法を提案する。
相関写像は、同一カテゴリのクラスタリングピクセルを容易に実現できるだけでなく、良好な形状情報も含んでいることを観察する。
我々は,高信頼画素を拡大し,さらに掘り出すために,画素の対の類似性をモデル化して画素伝搬を行う。
そして、相関地図から抽出した正確なクラス非依存マスクを用いて、領域伝搬を行い、擬似ラベルを強化する。
論文 参考訳(メタデータ) (2023-06-07T10:02:29Z) - Robust One-shot Segmentation of Brain Tissues via Image-aligned Style
Transformation [13.430851964063534]
本稿では,脳組織のワンショットセグメンテーションのための2モデル反復学習を強化するために,新しい画像整列型変換を提案する。
2つの公開データセットによる実験結果から,1)完全教師付き手法と比較して,提案手法の競合セグメンテーション性能が向上し,2)Diceの平均値が4.67%向上した他の最先端技術よりも優れた性能を示した。
論文 参考訳(メタデータ) (2022-11-26T09:14:01Z) - Label Refinement Network from Synthetic Error Augmentation for Medical
Image Segmentation [8.435559487504351]
画像分割のための深部畳み込みニューラルネットワークはラベル構造を明示的に学習しない。
初期セグメンテーションからそのような誤りを補正する新しいラベル改善手法を提案する。
論文 参考訳(メタデータ) (2022-09-14T00:25:32Z) - Learning Hierarchical Graph Representation for Image Manipulation
Detection [50.04902159383709]
画像操作検出の目的は、画像内の操作された領域を特定し、特定することである。
最近のアプローチでは、画像に残っている改ざんするアーティファクトをキャプチャするために、洗練された畳み込みニューラルネットワーク(CNN)が採用されている。
本稿では2つの並列分岐からなる階層型グラフ畳み込みネットワーク(HGCN-Net)を提案する。
論文 参考訳(メタデータ) (2022-01-15T01:54:25Z) - Weakly-supervised fire segmentation by visualizing intermediate CNN
layers [82.75113406937194]
画像やビデオにおける火の局所化は、火災事故に対処するための自律システムにとって重要なステップである。
我々は,ネットワークのトレーニングに画像ラベルのみを使用する,画像中の火の弱い制御セグメント化について検討する。
CNNの中間層における特徴量の平均値は,2値セグメンテーション問題である火災セグメンテーションの場合,従来のクラスアクティベーションマッピング(CAM)法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-16T11:56:28Z) - Crosslink-Net: Double-branch Encoder Segmentation Network via Fusing
Vertical and Horizontal Convolutions [58.71117402626524]
医用画像分割のための新しいダブルブランチエンコーダアーキテクチャを提案する。
1)正方形畳み込みカーネルによる特徴の識別をさらに改善する必要があるため,非正方形および水平畳み込みカーネルの利用を提案する。
実験では,4つのデータセット上でのモデルの有効性を検証した。
論文 参考訳(メタデータ) (2021-07-24T02:58:32Z) - Unsupervised Image Segmentation using Mutual Mean-Teaching [12.784209596867495]
より安定した結果を得るために,Mutual Mean-Teaching (MMT) フレームワークに基づく教師なし画像分割モデルを提案する。
実験結果から,提案モデルでは様々な画像の分割が可能であり,既存の手法よりも優れた性能が得られることが示された。
論文 参考訳(メタデータ) (2020-12-16T13:13:34Z) - Group-Wise Semantic Mining for Weakly Supervised Semantic Segmentation [49.90178055521207]
この研究は、画像レベルのアノテーションとピクセルレベルのセグメンテーションのギャップを埋めることを目標に、弱い監督されたセマンティックセグメンテーション(WSSS)に対処する。
画像群における意味的依存関係を明示的にモデル化し,より信頼性の高い擬似的基盤構造を推定する,新たなグループ学習タスクとしてWSSSを定式化する。
特に、入力画像がグラフノードとして表現されるグループ単位のセマンティックマイニングのためのグラフニューラルネットワーク(GNN)を考案する。
論文 参考訳(メタデータ) (2020-12-09T12:40:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。