論文の概要: PPCR: Learning Pyramid Pixel Context Recalibration Module for Medical
Image Classification
- arxiv url: http://arxiv.org/abs/2303.01917v1
- Date: Fri, 3 Mar 2023 13:36:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-06 15:07:31.833787
- Title: PPCR: Learning Pyramid Pixel Context Recalibration Module for Medical
Image Classification
- Title(参考訳): PPCR:医学画像分類のためのピラミッドコンテキスト修正モジュールの学習
- Authors: Xiaoqing Zhangand Zunjie Xiao and Xiao Wu and Jiansheng Fang and
Junyong Shen and Yan Hu and Risa Higashita and Jiang Liu
- Abstract要約: 深層畳み込みニューラルネットワーク(CNN)に広く組み込まれた空間的注意機構
実用的で軽量なアーキテクチャユニットであるPraamid Pixel Context Recalibration (PPCR) モジュールを提案する。
PPCRは、マルチスケールの画素コンテキスト情報を利用して、画素非依存の方法で画素位置を適応的に補正する。
- 参考スコア(独自算出の注目度): 9.099294414440283
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Spatial attention mechanism has been widely incorporated into deep
convolutional neural networks (CNNs) via long-range dependency capturing,
significantly lifting the performance in computer vision, but it may perform
poorly in medical imaging. Unfortunately, existing efforts are often unaware
that long-range dependency capturing has limitations in highlighting subtle
lesion regions, neglecting to exploit the potential of multi-scale pixel
context information to improve the representational capability of CNNs. In this
paper, we propose a practical yet lightweight architectural unit, Pyramid Pixel
Context Recalibration (PPCR) module, which exploits multi-scale pixel context
information to recalibrate pixel position in a pixel-independent manner
adaptively. PPCR first designs a cross-channel pyramid pooling to aggregate
multi-scale pixel context information, then eliminates the inconsistency among
them by the well-designed pixel normalization, and finally estimates per pixel
attention weight via a pixel context integration. PPCR can be flexibly plugged
into modern CNNs with negligible overhead. Extensive experiments on five
medical image datasets and CIFAR benchmarks empirically demonstrate the
superiority and generalization of PPCR over state-of-the-art attention methods.
The in-depth analyses explain the inherent behavior of PPCR in the
decision-making process, improving the interpretability of CNNs.
- Abstract(参考訳): 空間的注意機構は、遠距離依存性のキャプチャによって深層畳み込みニューラルネットワーク(CNN)に広く組み込まれており、コンピュータビジョンの性能を大幅に向上させるが、医療画像では不十分である。
残念ながら、これまでの努力は、長距離の依存関係キャプチャが微妙な病変領域の強調に限界があることに気付かず、多スケールのピクセルコンテキスト情報の可能性を利用してcnnの表現能力を向上させることを怠っている。
本稿では,多スケールの画素コンテキスト情報を利用して画素非依存的に画素位置をアダプティブに再構成する,実用的で軽量なアーキテクチャユニットであるピラミッド画素コンテキストリカバリ(ppcr)モジュールを提案する。
PPCRは、まず、マルチスケールの画素コンテキスト情報を集約するクロスチャネルピラミッドプーリングを設計し、その後、よく設計されたピクセル正規化により、それらの不整合を排除し、最後にピクセルコンテキスト統合による1ピクセルあたりの注目重量を推定する。
PPCRは柔軟に現代のCNNに挿入でき、オーバーヘッドは無視できる。
5つの医用画像データセットとcifarベンチマークに関する広範囲な実験は、最先端の注意手法に対するppcrの優位性と一般化を実証的に示している。
決定過程におけるppcrの固有の挙動を詳細に分析し,cnnの解釈性を改善した。
関連論文リスト
- Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Pixel-Inconsistency Modeling for Image Manipulation Localization [63.54342601757723]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。
本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。
実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文 参考訳(メタデータ) (2023-09-30T02:54:51Z) - Lesion-aware Dynamic Kernel for Polyp Segmentation [49.63274623103663]
ポリープセグメンテーションのための障害対応動的ネットワーク(LDNet)を提案する。
従来のU字型エンコーダ・デコーダ構造であり、動的カーネル生成と更新スキームが組み込まれている。
この単純だが効果的なスキームは、我々のモデルに強力なセグメンテーション性能と一般化能力を与える。
論文 参考訳(メタデータ) (2023-01-12T09:53:57Z) - Single-Image Super-Resolution Reconstruction based on the Differences of
Neighboring Pixels [3.257500143434429]
深層学習技術は、単一画像超解像(SISR)の性能向上に用いられた。
本稿では,推定画像と接地構造画像からグラフを構築することにより,CNNを正規化するための隣接画素の違いを提案する。
提案手法は, ベンチマークデータセットの定量的, 質的評価の観点から, 最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2022-12-28T07:30:07Z) - Rethinking Unsupervised Neural Superpixel Segmentation [6.123324869194195]
CNNによるスーパーピクセルセグメンテーションのための教師なし学習が研究されている。
このようなネットワークの有効性を改善するために,3つの重要な要素を提案する。
BSDS500データセットを実験した結果,提案手法の意義を示す証拠が得られた。
論文 参考訳(メタデータ) (2022-06-21T09:30:26Z) - Class Balanced PixelNet for Neurological Image Segmentation [20.56747443955369]
画素レベルの畳み込みニューラルネットワーク(CNN)を用いた自動脳腫瘍分割法(PixelNetなど)を提案する。
提案モデルは脳腫瘍と虚血性脳梗塞のセグメンテーションデータセットにおいて有望な結果を得た。
論文 参考訳(メタデータ) (2022-04-23T10:57:54Z) - Learning Enriched Features for Fast Image Restoration and Enhancement [166.17296369600774]
本稿では,ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とする。
我々は、高解像度の空間的詳細を同時に保存しながら、複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
提案手法は,デフォーカス・デブロアリング,画像デノイング,超解像,画像強調など,さまざまな画像処理タスクに対して,最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2022-04-19T17:59:45Z) - Enhancing Multi-Scale Implicit Learning in Image Super-Resolution with
Integrated Positional Encoding [4.781615891172263]
画像超解像コンテキストにおいて,各画素を局所領域からの信号の集約とみなす。
画素領域上の周波数情報を集約することで従来の位置符号化を拡張した位置符号化(IPE)を提案する。
IPE-LIIFの定量的および定性的評価による有効性を示し、さらに画像スケールへのIPEの一般化能力を示す。
論文 参考訳(メタデータ) (2021-12-10T06:09:55Z) - AINet: Association Implantation for Superpixel Segmentation [82.21559299694555]
今回提案する新しいtextbfAssociation textbfImplantation(AI)モジュールは、ネットワークがピクセルとその周辺グリッド間の関係を明示的にキャプチャすることを可能にする。
本手法は最先端性能を実現するだけでなく,十分な推論効率を維持することができた。
論文 参考訳(メタデータ) (2021-01-26T10:40:13Z) - Learning Enriched Features for Real Image Restoration and Enhancement [166.17296369600774]
畳み込みニューラルネットワーク(CNN)は、画像復元作業における従来のアプローチよりも劇的に改善されている。
ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とした,新しいアーキテクチャを提案する。
提案手法は,高解像度の空間的詳細を同時に保存しながら,複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
論文 参考訳(メタデータ) (2020-03-15T11:04:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。