Fugu-MT 論文翻訳(概要): PPCR: Learning Pyramid Pixel Context Recalibration Module for Medical Image Classification

論文の概要: PPCR: Learning Pyramid Pixel Context Recalibration Module for Medical Image Classification

arxiv url: http://arxiv.org/abs/2303.01917v1
Date: Fri, 3 Mar 2023 13:36:55 GMT
ステータス: 翻訳完了
システム内更新日: 2023-03-06 15:07:31.833787
Title: PPCR: Learning Pyramid Pixel Context Recalibration Module for Medical Image Classification
Title（参考訳）: PPCR:医学画像分類のためのピラミッドコンテキスト修正モジュールの学習
Authors: Xiaoqing Zhangand Zunjie Xiao and Xiao Wu and Jiansheng Fang and Junyong Shen and Yan Hu and Risa Higashita and Jiang Liu
Abstract要約: 深層畳み込みニューラルネットワーク(CNN)に広く組み込まれた空間的注意機構実用的で軽量なアーキテクチャユニットであるPraamid Pixel Context Recalibration (PPCR) モジュールを提案する。 PPCRは、マルチスケールの画素コンテキスト情報を利用して、画素非依存の方法で画素位置を適応的に補正する。
参考スコア（独自算出の注目度）: 9.099294414440283
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Spatial attention mechanism has been widely incorporated into deep convolutional neural networks (CNNs) via long-range dependency capturing, significantly lifting the performance in computer vision, but it may perform poorly in medical imaging. Unfortunately, existing efforts are often unaware that long-range dependency capturing has limitations in highlighting subtle lesion regions, neglecting to exploit the potential of multi-scale pixel context information to improve the representational capability of CNNs. In this paper, we propose a practical yet lightweight architectural unit, Pyramid Pixel Context Recalibration (PPCR) module, which exploits multi-scale pixel context information to recalibrate pixel position in a pixel-independent manner adaptively. PPCR first designs a cross-channel pyramid pooling to aggregate multi-scale pixel context information, then eliminates the inconsistency among them by the well-designed pixel normalization, and finally estimates per pixel attention weight via a pixel context integration. PPCR can be flexibly plugged into modern CNNs with negligible overhead. Extensive experiments on five medical image datasets and CIFAR benchmarks empirically demonstrate the superiority and generalization of PPCR over state-of-the-art attention methods. The in-depth analyses explain the inherent behavior of PPCR in the decision-making process, improving the interpretability of CNNs.
Abstract（参考訳）: 空間的注意機構は、遠距離依存性のキャプチャによって深層畳み込みニューラルネットワーク(CNN)に広く組み込まれており、コンピュータビジョンの性能を大幅に向上させるが、医療画像では不十分である。残念ながら、これまでの努力は、長距離の依存関係キャプチャが微妙な病変領域の強調に限界があることに気付かず、多スケールのピクセルコンテキスト情報の可能性を利用してcnnの表現能力を向上させることを怠っている。本稿では,多スケールの画素コンテキスト情報を利用して画素非依存的に画素位置をアダプティブに再構成する,実用的で軽量なアーキテクチャユニットであるピラミッド画素コンテキストリカバリ(ppcr)モジュールを提案する。 PPCRは、まず、マルチスケールの画素コンテキスト情報を集約するクロスチャネルピラミッドプーリングを設計し、その後、よく設計されたピクセル正規化により、それらの不整合を排除し、最後にピクセルコンテキスト統合による1ピクセルあたりの注目重量を推定する。 PPCRは柔軟に現代のCNNに挿入でき、オーバーヘッドは無視できる。 5つの医用画像データセットとcifarベンチマークに関する広範囲な実験は、最先端の注意手法に対するppcrの優位性と一般化を実証的に示している。決定過程におけるppcrの固有の挙動を詳細に分析し,cnnの解釈性を改善した。

関連論文リスト

AgentPolyp: Accurate Polyp Segmentation via Image Enhancement Agent [29.891645824604684]
AgentPolypはCLIPベースのセマンティックガイダンスと動的画像拡張をセグメンテーションのための軽量ニューラルネットワークに統合する新しいフレームワークである。このフレームワークは、様々な拡張アルゴリズムとセグメンテーションネットワークのためのプラグインとプレイの拡張をサポートし、内視鏡デバイスのデプロイメント要件を満たしている。
論文参考訳（メタデータ） (2025-04-15T08:39:35Z)
VITAL: More Understandable Feature Visualization through Distribution Alignment and Relevant Information Flow [57.96482272333649]
機能可視化(FV)は、ニューロンが応答している情報をデコードするための強力なツールである。本稿では,FVを原型画像の特徴の統計値と関連するネットワークフローの測定値を組み合わせることで,画像を生成することを提案する。我々のアプローチは、最先端のFVに対して質的かつ定量的に改善される人間の理解可能な可視化をもたらす。
論文参考訳（メタデータ） (2025-03-28T13:08:18Z)
From Pixels to Gigapixels: Bridging Local Inductive Bias and Long-Range Dependencies with Pixel-Mamba [16.19372261506739]
ギガピクセルWSIを効率的に扱うように設計された新しいディープラーニングアーキテクチャであるPixel-Mambaを紹介する。 Pixel-Mambaは、畳み込みニューラルネットワークに似たトークンを徐々に拡大することで、局所的な誘導バイアスを取り入れている。実験では、エンドツーエンドのWSI分析のための強力で効率的なフレームワークとして、Pixel-Mambaの有効性を示す。
論文参考訳（メタデータ） (2024-12-21T17:45:27Z)
Exploring Multi-view Pixel Contrast for General and Robust Image Forgery Localization [4.8454936010479335]
本稿では,画像フォージェリーローカライゼーションのための多視点Pixel-wise Contrastive Algorithm (MPC)を提案する。具体的には、まず、教師付きコントラスト損失を伴うバックボーンネットワークを事前訓練する。次に、クロスエントロピー損失を用いてローカライゼーションヘッドを微調整し、ピクセルローカライザを改良する。
論文参考訳（メタデータ） (2024-06-19T13:51:52Z)
Parameter-Inverted Image Pyramid Networks [49.35689698870247]
Inverted Image Pyramid Networks (PIIP) と呼ばれる新しいネットワークアーキテクチャを提案する。私たちの中核となる考え方は、パラメータサイズの異なるモデルを使用して、画像ピラミッドの解像度の異なるレベルを処理することです。 PIIPは、オブジェクト検出、セグメンテーション、画像分類などのタスクにおいて優れたパフォーマンスを達成する。
論文参考訳（メタデータ） (2024-06-06T17:59:10Z)
Pixel-Inconsistency Modeling for Image Manipulation Localization [59.968362815126326]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文参考訳（メタデータ） (2023-09-30T02:54:51Z)
Self-supervised Semantic Segmentation: Consistency over Transformation [3.485615723221064]
Inception Large Kernel Attention (I-LKA) モジュールをベースとしたロバストなフレームワークを統合した新しい自己教師型アルゴリズム textbfS$3$-Net を提案する。我々は、変形可能な畳み込みを積分成分として利用し、優れた物体境界定義のための歪み変形を効果的に捕捉し、デライン化する。皮膚病変および肺臓器の分節タスクに関する実験結果から,SOTA法と比較して,本手法の優れた性能を示した。
論文参考訳（メタデータ） (2023-08-31T21:28:46Z)
Lesion-aware Dynamic Kernel for Polyp Segmentation [49.63274623103663]
ポリープセグメンテーションのための障害対応動的ネットワーク(LDNet)を提案する。従来のU字型エンコーダ・デコーダ構造であり、動的カーネル生成と更新スキームが組み込まれている。この単純だが効果的なスキームは、我々のモデルに強力なセグメンテーション性能と一般化能力を与える。
論文参考訳（メタデータ） (2023-01-12T09:53:57Z)
PCRLv2: A Unified Visual Information Preservation Framework for Self-supervised Pre-training in Medical Image Analysis [56.63327669853693]
本稿では,ピクセルレベルの情報を高レベルなセマンティクスに明示的にエンコードするための画素復元タスクを提案する。また,画像理解を支援する強力なツールであるスケール情報の保存についても検討する。提案されている統合SSLフレームワークは、さまざまなタスクで自己管理されたフレームワークを超越している。
論文参考訳（メタデータ） (2023-01-02T17:47:27Z)
Rethinking Unsupervised Neural Superpixel Segmentation [6.123324869194195]
CNNによるスーパーピクセルセグメンテーションのための教師なし学習が研究されている。このようなネットワークの有効性を改善するために,3つの重要な要素を提案する。 BSDS500データセットを実験した結果,提案手法の意義を示す証拠が得られた。
論文参考訳（メタデータ） (2022-06-21T09:30:26Z)
Class Balanced PixelNet for Neurological Image Segmentation [20.56747443955369]
画素レベルの畳み込みニューラルネットワーク(CNN)を用いた自動脳腫瘍分割法(PixelNetなど)を提案する。提案モデルは脳腫瘍と虚血性脳梗塞のセグメンテーションデータセットにおいて有望な結果を得た。
論文参考訳（メタデータ） (2022-04-23T10:57:54Z)
PSGR: Pixel-wise Sparse Graph Reasoning for COVID-19 Pneumonia Segmentation in CT Images [83.26057031236965]
画像中の新型コロナウイルス感染領域セグメンテーションの長距離依存性のモデリングを強化するために,PSGRモジュールを提案する。 PSGRモジュールは不正確なピクセルからノードへの投影を回避し、グローバルな推論のために各ピクセル固有の情報を保存する。このソリューションは、3つの公開データセット上の4つの広く使われているセグメンテーションモデルに対して評価されている。
論文参考訳（メタデータ） (2021-08-09T04:58:23Z)
AINet: Association Implantation for Superpixel Segmentation [82.21559299694555]
今回提案する新しいtextbfAssociation textbfImplantation(AI)モジュールは、ネットワークがピクセルとその周辺グリッド間の関係を明示的にキャプチャすることを可能にする。本手法は最先端性能を実現するだけでなく,十分な推論効率を維持することができた。
論文参考訳（メタデータ） (2021-01-26T10:40:13Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。