論文の概要: High resolution weakly supervised localization architectures for medical
images
- arxiv url: http://arxiv.org/abs/2010.11475v1
- Date: Thu, 22 Oct 2020 06:42:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-04 06:48:45.985261
- Title: High resolution weakly supervised localization architectures for medical
images
- Title(参考訳): 医用画像のための高分解能弱教師付きローカライゼーションアーキテクチャ
- Authors: Konpat Preechakul, Sira Sriswasdi, Boonserm Kijsirikul, Ekapol
Chuangsuwanich
- Abstract要約: 我々は,NIH の Chest X-Ray 14 データセット上で平均点定位精度 0.62 を達成した,高精度な教師付きローカライゼーションのモデルを提案する。
実験の結果,グローバル平均プール (GAP) とグループ正規化 (Group Normalization) がCAMの局所化精度を低下させる主要な原因であることが示唆された。
- 参考スコア(独自算出の注目度): 3.7117844677482146
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In medical imaging, Class-Activation Map (CAM) serves as the main
explainability tool by pointing to the region of interest. Since the
localization accuracy from CAM is constrained by the resolution of the model's
feature map, one may expect that segmentation models, which generally have
large feature maps, would produce more accurate CAMs. However, we have found
that this is not the case due to task mismatch. While segmentation models are
developed for datasets with pixel-level annotation, only image-level annotation
is available in most medical imaging datasets. Our experiments suggest that
Global Average Pooling (GAP) and Group Normalization are the main culprits that
worsen the localization accuracy of CAM. To address this issue, we propose
Pyramid Localization Network (PYLON), a model for high-accuracy
weakly-supervised localization that achieved 0.62 average point localization
accuracy on NIH's Chest X-Ray 14 dataset, compared to 0.45 for a traditional
CAM model. Source code and extended results are available at
https://github.com/cmb-chula/pylon.
- Abstract(参考訳): 医学イメージングにおいて、クラスアクティベーションマップ(cam)は、興味のある領域を指し示すことによって、主要な説明可能性ツールとなる。
CAMの局所化精度はモデルの特徴写像の解像度に制約されているため、一般に大きな特徴写像を持つセグメンテーションモデルはより正確なCAMを生成すると期待できる。
しかし、これはタスクミスマッチによるものではないことが分かりました。
セグメンテーションモデルはピクセルレベルのアノテーションを持つデータセット向けに開発されたが、ほとんどの医療画像データセットでは画像レベルのアノテーションのみが利用できる。
実験の結果,グローバル平均プール (GAP) とグループ正規化 (Group Normalization) がCAMの局所化精度を低下させる主要な原因であることが示唆された。
この問題を解決するために,NIH の Chest X-Ray 14 データセットの平均点定位精度を 0.62 とし,従来の CAM モデルでは 0.45 であるのに対し,Pyamid Localization Network (PYLON) を提案する。
ソースコードと拡張された結果はhttps://github.com/cmb-chula/pylon.comで入手できる。
関連論文リスト
- Dimensionality Reduction and Nearest Neighbors for Improving Out-of-Distribution Detection in Medical Image Segmentation [1.2873975765521795]
この研究は、肝臓を分断する4つのSwin UNETRとnnU-netモデルのボトルネック特徴にマハラノビス距離(MD)ポストホックを適用した。
モデルが失敗した画像は、高性能で最小の計算負荷で検出された。
論文 参考訳(メタデータ) (2024-08-05T18:24:48Z) - DecomCAM: Advancing Beyond Saliency Maps through Decomposition and Integration [25.299607743268993]
クラスアクティベーションマップ(CAM)手法は、モデルの意思決定基準を明らかにする領域を強調するが、明確なサリエンシマップと詳細な解釈性は欠如している。
チャネル活性化マップから共有パターンを抽出する新しい分解分解分解法であるDecomCAMを提案する。
実験の結果,DecomCAMは精度を向上するだけでなく,解釈可能性と計算効率のバランスを最適化できることがわかった。
論文 参考訳(メタデータ) (2024-05-29T08:40:11Z) - BroadCAM: Outcome-agnostic Class Activation Mapping for Small-scale
Weakly Supervised Applications [69.22739434619531]
そこで我々はBroadCAMと呼ばれる結果に依存しないCAMアプローチを提案する。
VOC2012でBroadCAM、WSSSでBCSS-WSSS、WSOLでOpenImages30kを評価することで、BroadCAMは優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2023-09-07T06:45:43Z) - DETR Doesn't Need Multi-Scale or Locality Design [69.56292005230185]
本稿では,"プレーン"特性を維持できる改良型DETR検出器を提案する。
特定の局所性制約を伴わずに、単一スケールの機能マップとグローバルなクロスアテンション計算を使用する。
マルチスケールな特徴マップと局所性制約の欠如を補うために,2つの単純な技術が平易な設計において驚くほど効果的であることを示す。
論文 参考訳(メタデータ) (2023-08-03T17:59:04Z) - Localized Perturbations For Weakly-Supervised Segmentation of Glioma
Brain Tumours [0.5801621787540266]
本研究は,脳腫瘍のセグメンテーションマスクを事前訓練した3次元分類モデルから抽出するための,局所摂動を弱教師付きソリューションとして用いることを提案する。
また,U-netアーキテクチャを用いて,任意の分類において最も関連性の高い領域を見つけるために,3次元スーパーピクセルを利用する新しい摂動法を提案する。
論文 参考訳(メタデータ) (2021-11-29T21:01:20Z) - Explainable multiple abnormality classification of chest CT volumes with
AxialNet and HiResCAM [89.2175350956813]
本稿では,容積医用画像における多変量分類の課題について紹介する。
本稿では,複数のインスタンス学習型畳み込みニューラルネットワークであるAxialNetを提案する。
そして、HiResCAMと3D許容領域を利用した新しいマスクロスにより、モデルの学習を改善することを目指す。
論文 参考訳(メタデータ) (2021-11-24T01:14:33Z) - F-CAM: Full Resolution CAM via Guided Parametric Upscaling [20.609010268320013]
クラスアクティベーションマッピング(CAM)メソッドは、最近、弱い教師付きオブジェクトローカライゼーション(WSOL)タスクに多くの注目を集めている。
CAMメソッドは通常、ResNet50のような既製のCNNバックボーンに統合される。
完全分解能CAMを高精度に構築できるCAMのパラメトリックアップスケーリング法を提案する。
論文 参考訳(メタデータ) (2021-09-15T04:45:20Z) - PaDiM: a Patch Distribution Modeling Framework for Anomaly Detection and
Localization [64.39761523935613]
本稿では,画像中の異常を同時検出・ローカライズするPatch Distribution Modeling, PaDiMを提案する。
PaDiMは、パッチの埋め込みに事前訓練された畳み込みニューラルネットワーク(CNN)を使用している。
また、CNNの異なるセマンティックレベル間の相関を利用して、異常のローカライズも改善している。
論文 参考訳(メタデータ) (2020-11-17T17:29:18Z) - Collaborative Boundary-aware Context Encoding Networks for Error Map
Prediction [65.44752447868626]
本稿では,AEP-Net と呼ばれる協調的コンテキスト符号化ネットワークを提案する。
具体的には、画像とマスクのより優れた特徴融合のための協調的な特徴変換分岐と、エラー領域の正確な局所化を提案する。
AEP-Netはエラー予測タスクの平均DSCが0.8358,0.8164であり、ピアソン相関係数が0.9873である。
論文 参考訳(メタデータ) (2020-06-25T12:42:01Z) - Rethinking Localization Map: Towards Accurate Object Perception with
Self-Enhancement Maps [78.2581910688094]
本研究は, カテゴリーラベルのみを監督として, 正確な対象位置分布マップと対象境界を抽出する, 新たな自己強調手法を提案する。
特に、提案されたセルフエンハンスメントマップは、ILSVRC上で54.88%の最先端のローカライゼーション精度を達成する。
論文 参考訳(メタデータ) (2020-06-09T12:35:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。