論文の概要: PPCR: Learning Pyramid Pixel Context Recalibration Module for Medical
Image Classification
- arxiv url: http://arxiv.org/abs/2303.01917v1
- Date: Fri, 3 Mar 2023 13:36:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-06 15:07:31.833787
- Title: PPCR: Learning Pyramid Pixel Context Recalibration Module for Medical
Image Classification
- Title(参考訳): PPCR:医学画像分類のためのピラミッドコンテキスト修正モジュールの学習
- Authors: Xiaoqing Zhangand Zunjie Xiao and Xiao Wu and Jiansheng Fang and
Junyong Shen and Yan Hu and Risa Higashita and Jiang Liu
- Abstract要約: 深層畳み込みニューラルネットワーク(CNN)に広く組み込まれた空間的注意機構
実用的で軽量なアーキテクチャユニットであるPraamid Pixel Context Recalibration (PPCR) モジュールを提案する。
PPCRは、マルチスケールの画素コンテキスト情報を利用して、画素非依存の方法で画素位置を適応的に補正する。
- 参考スコア(独自算出の注目度): 9.099294414440283
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Spatial attention mechanism has been widely incorporated into deep
convolutional neural networks (CNNs) via long-range dependency capturing,
significantly lifting the performance in computer vision, but it may perform
poorly in medical imaging. Unfortunately, existing efforts are often unaware
that long-range dependency capturing has limitations in highlighting subtle
lesion regions, neglecting to exploit the potential of multi-scale pixel
context information to improve the representational capability of CNNs. In this
paper, we propose a practical yet lightweight architectural unit, Pyramid Pixel
Context Recalibration (PPCR) module, which exploits multi-scale pixel context
information to recalibrate pixel position in a pixel-independent manner
adaptively. PPCR first designs a cross-channel pyramid pooling to aggregate
multi-scale pixel context information, then eliminates the inconsistency among
them by the well-designed pixel normalization, and finally estimates per pixel
attention weight via a pixel context integration. PPCR can be flexibly plugged
into modern CNNs with negligible overhead. Extensive experiments on five
medical image datasets and CIFAR benchmarks empirically demonstrate the
superiority and generalization of PPCR over state-of-the-art attention methods.
The in-depth analyses explain the inherent behavior of PPCR in the
decision-making process, improving the interpretability of CNNs.
- Abstract(参考訳): 空間的注意機構は、遠距離依存性のキャプチャによって深層畳み込みニューラルネットワーク(CNN)に広く組み込まれており、コンピュータビジョンの性能を大幅に向上させるが、医療画像では不十分である。
残念ながら、これまでの努力は、長距離の依存関係キャプチャが微妙な病変領域の強調に限界があることに気付かず、多スケールのピクセルコンテキスト情報の可能性を利用してcnnの表現能力を向上させることを怠っている。
本稿では,多スケールの画素コンテキスト情報を利用して画素非依存的に画素位置をアダプティブに再構成する,実用的で軽量なアーキテクチャユニットであるピラミッド画素コンテキストリカバリ(ppcr)モジュールを提案する。
PPCRは、まず、マルチスケールの画素コンテキスト情報を集約するクロスチャネルピラミッドプーリングを設計し、その後、よく設計されたピクセル正規化により、それらの不整合を排除し、最後にピクセルコンテキスト統合による1ピクセルあたりの注目重量を推定する。
PPCRは柔軟に現代のCNNに挿入でき、オーバーヘッドは無視できる。
5つの医用画像データセットとcifarベンチマークに関する広範囲な実験は、最先端の注意手法に対するppcrの優位性と一般化を実証的に示している。
決定過程におけるppcrの固有の挙動を詳細に分析し,cnnの解釈性を改善した。
関連論文リスト
- Exploring Multi-view Pixel Contrast for General and Robust Image Forgery Localization [4.8454936010479335]
本稿では,画像フォージェリーローカライゼーションのための多視点Pixel-wise Contrastive Algorithm (MPC)を提案する。
具体的には、まず、教師付きコントラスト損失を伴うバックボーンネットワークを事前訓練する。
次に、クロスエントロピー損失を用いてローカライゼーションヘッドを微調整し、ピクセルローカライザを改良する。
論文 参考訳(メタデータ) (2024-06-19T13:51:52Z) - Parameter-Inverted Image Pyramid Networks [49.35689698870247]
Inverted Image Pyramid Networks (PIIP) と呼ばれる新しいネットワークアーキテクチャを提案する。
私たちの中核となる考え方は、パラメータサイズの異なるモデルを使用して、画像ピラミッドの解像度の異なるレベルを処理することです。
PIIPは、オブジェクト検出、セグメンテーション、画像分類などのタスクにおいて優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-06-06T17:59:10Z) - Pixel-Inconsistency Modeling for Image Manipulation Localization [59.968362815126326]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。
本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。
実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文 参考訳(メタデータ) (2023-09-30T02:54:51Z) - Self-supervised Semantic Segmentation: Consistency over Transformation [3.485615723221064]
Inception Large Kernel Attention (I-LKA) モジュールをベースとしたロバストなフレームワークを統合した新しい自己教師型アルゴリズム textbfS$3$-Net を提案する。
我々は、変形可能な畳み込みを積分成分として利用し、優れた物体境界定義のための歪み変形を効果的に捕捉し、デライン化する。
皮膚病変および肺臓器の分節タスクに関する実験結果から,SOTA法と比較して,本手法の優れた性能を示した。
論文 参考訳(メタデータ) (2023-08-31T21:28:46Z) - Lesion-aware Dynamic Kernel for Polyp Segmentation [49.63274623103663]
ポリープセグメンテーションのための障害対応動的ネットワーク(LDNet)を提案する。
従来のU字型エンコーダ・デコーダ構造であり、動的カーネル生成と更新スキームが組み込まれている。
この単純だが効果的なスキームは、我々のモデルに強力なセグメンテーション性能と一般化能力を与える。
論文 参考訳(メタデータ) (2023-01-12T09:53:57Z) - PCRLv2: A Unified Visual Information Preservation Framework for
Self-supervised Pre-training in Medical Image Analysis [56.63327669853693]
本稿では,ピクセルレベルの情報を高レベルなセマンティクスに明示的にエンコードするための画素復元タスクを提案する。
また,画像理解を支援する強力なツールであるスケール情報の保存についても検討する。
提案されている統合SSLフレームワークは、さまざまなタスクで自己管理されたフレームワークを超越している。
論文 参考訳(メタデータ) (2023-01-02T17:47:27Z) - Rethinking Unsupervised Neural Superpixel Segmentation [6.123324869194195]
CNNによるスーパーピクセルセグメンテーションのための教師なし学習が研究されている。
このようなネットワークの有効性を改善するために,3つの重要な要素を提案する。
BSDS500データセットを実験した結果,提案手法の意義を示す証拠が得られた。
論文 参考訳(メタデータ) (2022-06-21T09:30:26Z) - Class Balanced PixelNet for Neurological Image Segmentation [20.56747443955369]
画素レベルの畳み込みニューラルネットワーク(CNN)を用いた自動脳腫瘍分割法(PixelNetなど)を提案する。
提案モデルは脳腫瘍と虚血性脳梗塞のセグメンテーションデータセットにおいて有望な結果を得た。
論文 参考訳(メタデータ) (2022-04-23T10:57:54Z) - PSGR: Pixel-wise Sparse Graph Reasoning for COVID-19 Pneumonia
Segmentation in CT Images [83.26057031236965]
画像中の新型コロナウイルス感染領域セグメンテーションの長距離依存性のモデリングを強化するために,PSGRモジュールを提案する。
PSGRモジュールは不正確なピクセルからノードへの投影を回避し、グローバルな推論のために各ピクセル固有の情報を保存する。
このソリューションは、3つの公開データセット上の4つの広く使われているセグメンテーションモデルに対して評価されている。
論文 参考訳(メタデータ) (2021-08-09T04:58:23Z) - AINet: Association Implantation for Superpixel Segmentation [82.21559299694555]
今回提案する新しいtextbfAssociation textbfImplantation(AI)モジュールは、ネットワークがピクセルとその周辺グリッド間の関係を明示的にキャプチャすることを可能にする。
本手法は最先端性能を実現するだけでなく,十分な推論効率を維持することができた。
論文 参考訳(メタデータ) (2021-01-26T10:40:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。