Fugu-MT 論文翻訳(概要): Pyramid Pixel Context Adaption Network for Medical Image Classification with Supervised Contrastive Learning

論文の概要: Pyramid Pixel Context Adaption Network for Medical Image Classification with Supervised Contrastive Learning

arxiv url: http://arxiv.org/abs/2303.01917v3
Date: Thu, 2 May 2024 01:22:42 GMT
ステータス: 翻訳完了
システム内更新日: 2024-05-03 22:49:30.981371
Title: Pyramid Pixel Context Adaption Network for Medical Image Classification with Supervised Contrastive Learning
Title（参考訳）: 教師付きコントラスト学習を用いた医用画像分類のためのピラミッドコンテクスト適応ネットワーク
Authors: Xiaoqing Zhang, Zunjie Xiao, Xiao Wu, Yanlin Chen, Jilu Zhao, Yan Hu, Jiang Liu,
Abstract要約: 実用的で軽量なアーキテクチャユニットであるPraamid Pixel Context Adaption (PPCA) モジュールを提案する。 PPCAはマルチスケールの画素コンテキスト情報を利用して画素非依存の画素位置を補正する。 PPCANetは最先端の注目ネットワークや最近のディープニューラルネットワークよりも優れていることを示す。
参考スコア（独自算出の注目度）: 9.391271552098878
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Spatial attention mechanism has been widely incorporated into deep neural networks (DNNs), significantly lifting the performance in computer vision tasks via long-range dependency modeling. However, it may perform poorly in medical image analysis. Unfortunately, existing efforts are often unaware that long-range dependency modeling has limitations in highlighting subtle lesion regions. To overcome this limitation, we propose a practical yet lightweight architectural unit, Pyramid Pixel Context Adaption (PPCA) module, which exploits multi-scale pixel context information to recalibrate pixel position in a pixel-independent manner dynamically. PPCA first applies a well-designed cross-channel pyramid pooling to aggregate multi-scale pixel context information, then eliminates the inconsistency among them by the well-designed pixel normalization, and finally estimates per pixel attention weight via a pixel context integration. By embedding PPCA into a DNN with negligible overhead, the PPCANet is developed for medical image classification. In addition, we introduce supervised contrastive learning to enhance feature representation by exploiting the potential of label information via supervised contrastive loss. The extensive experiments on six medical image datasets show that PPCANet outperforms state-of-the-art attention-based networks and recent deep neural networks. We also provide visual analysis and ablation study to explain the behavior of PPCANet in the decision-making process.
Abstract（参考訳）: 空間的注意機構はディープニューラルネットワーク(DNN)に広く組み込まれており、長距離依存モデリングによるコンピュータビジョンタスクのパフォーマンスを大幅に向上させている。しかし、医用画像解析では不十分である。残念ながら、既存の取り組みはしばしば、長距離依存性モデリングが微妙な病変領域の強調に限界があることに気付いていない。この制限を克服するために,マルチスケールの画素コンテキスト情報を利用して画素位置を動的に動的に補正する,実用的で軽量なアーキテクチャユニットであるPraamid Pixel Context Adaption (PPCA) モジュールを提案する。 PPCAは、まず、マルチスケールの画素コンテキスト情報を集約するために、よく設計されたクロスチャネルピラミッドプーリングを適用し、その後、よく設計されたピクセル正規化により、それらの不整合を排除し、最後にピクセルコンテキスト統合により、ピクセル毎の注目重量を推定する。 DNNにPPCAを埋め込むことにより,医用画像分類のためのPPCANetを開発した。さらに,教師付きコントラスト学習を導入し,教師付きコントラスト損失によるラベル情報の可能性を利用して特徴表現を強化する。 6つの医用画像データセットに関する広範な実験は、PPCANetが最先端の注目ネットワークと最近のディープニューラルネットワークより優れていることを示している。また、意思決定過程におけるPPCANetの挙動を説明するために、視覚分析およびアブレーション研究を行った。

関連論文リスト

AgentPolyp: Accurate Polyp Segmentation via Image Enhancement Agent [29.891645824604684]
AgentPolypはCLIPベースのセマンティックガイダンスと動的画像拡張をセグメンテーションのための軽量ニューラルネットワークに統合する新しいフレームワークである。このフレームワークは、様々な拡張アルゴリズムとセグメンテーションネットワークのためのプラグインとプレイの拡張をサポートし、内視鏡デバイスのデプロイメント要件を満たしている。
論文参考訳（メタデータ） (2025-04-15T08:39:35Z)
VITAL: More Understandable Feature Visualization through Distribution Alignment and Relevant Information Flow [57.96482272333649]
機能可視化(FV)は、ニューロンが応答している情報をデコードするための強力なツールである。本稿では,FVを原型画像の特徴の統計値と関連するネットワークフローの測定値を組み合わせることで,画像を生成することを提案する。我々のアプローチは、最先端のFVに対して質的かつ定量的に改善される人間の理解可能な可視化をもたらす。
論文参考訳（メタデータ） (2025-03-28T13:08:18Z)
From Pixels to Gigapixels: Bridging Local Inductive Bias and Long-Range Dependencies with Pixel-Mamba [16.19372261506739]
ギガピクセルWSIを効率的に扱うように設計された新しいディープラーニングアーキテクチャであるPixel-Mambaを紹介する。 Pixel-Mambaは、畳み込みニューラルネットワークに似たトークンを徐々に拡大することで、局所的な誘導バイアスを取り入れている。実験では、エンドツーエンドのWSI分析のための強力で効率的なフレームワークとして、Pixel-Mambaの有効性を示す。
論文参考訳（メタデータ） (2024-12-21T17:45:27Z)
Exploring Multi-view Pixel Contrast for General and Robust Image Forgery Localization [4.8454936010479335]
本稿では,画像フォージェリーローカライゼーションのための多視点Pixel-wise Contrastive Algorithm (MPC)を提案する。具体的には、まず、教師付きコントラスト損失を伴うバックボーンネットワークを事前訓練する。次に、クロスエントロピー損失を用いてローカライゼーションヘッドを微調整し、ピクセルローカライザを改良する。
論文参考訳（メタデータ） (2024-06-19T13:51:52Z)
Parameter-Inverted Image Pyramid Networks [49.35689698870247]
Inverted Image Pyramid Networks (PIIP) と呼ばれる新しいネットワークアーキテクチャを提案する。私たちの中核となる考え方は、パラメータサイズの異なるモデルを使用して、画像ピラミッドの解像度の異なるレベルを処理することです。 PIIPは、オブジェクト検出、セグメンテーション、画像分類などのタスクにおいて優れたパフォーマンスを達成する。
論文参考訳（メタデータ） (2024-06-06T17:59:10Z)
Pixel-Inconsistency Modeling for Image Manipulation Localization [59.968362815126326]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文参考訳（メタデータ） (2023-09-30T02:54:51Z)
Self-supervised Semantic Segmentation: Consistency over Transformation [3.485615723221064]
Inception Large Kernel Attention (I-LKA) モジュールをベースとしたロバストなフレームワークを統合した新しい自己教師型アルゴリズム textbfS$3$-Net を提案する。我々は、変形可能な畳み込みを積分成分として利用し、優れた物体境界定義のための歪み変形を効果的に捕捉し、デライン化する。皮膚病変および肺臓器の分節タスクに関する実験結果から,SOTA法と比較して,本手法の優れた性能を示した。
論文参考訳（メタデータ） (2023-08-31T21:28:46Z)
Lesion-aware Dynamic Kernel for Polyp Segmentation [49.63274623103663]
ポリープセグメンテーションのための障害対応動的ネットワーク(LDNet)を提案する。従来のU字型エンコーダ・デコーダ構造であり、動的カーネル生成と更新スキームが組み込まれている。この単純だが効果的なスキームは、我々のモデルに強力なセグメンテーション性能と一般化能力を与える。
論文参考訳（メタデータ） (2023-01-12T09:53:57Z)
PCRLv2: A Unified Visual Information Preservation Framework for Self-supervised Pre-training in Medical Image Analysis [56.63327669853693]
本稿では,ピクセルレベルの情報を高レベルなセマンティクスに明示的にエンコードするための画素復元タスクを提案する。また,画像理解を支援する強力なツールであるスケール情報の保存についても検討する。提案されている統合SSLフレームワークは、さまざまなタスクで自己管理されたフレームワークを超越している。
論文参考訳（メタデータ） (2023-01-02T17:47:27Z)
Rethinking Unsupervised Neural Superpixel Segmentation [6.123324869194195]
CNNによるスーパーピクセルセグメンテーションのための教師なし学習が研究されている。このようなネットワークの有効性を改善するために,3つの重要な要素を提案する。 BSDS500データセットを実験した結果,提案手法の意義を示す証拠が得られた。
論文参考訳（メタデータ） (2022-06-21T09:30:26Z)
Class Balanced PixelNet for Neurological Image Segmentation [20.56747443955369]
画素レベルの畳み込みニューラルネットワーク(CNN)を用いた自動脳腫瘍分割法(PixelNetなど)を提案する。提案モデルは脳腫瘍と虚血性脳梗塞のセグメンテーションデータセットにおいて有望な結果を得た。
論文参考訳（メタデータ） (2022-04-23T10:57:54Z)
PSGR: Pixel-wise Sparse Graph Reasoning for COVID-19 Pneumonia Segmentation in CT Images [83.26057031236965]
画像中の新型コロナウイルス感染領域セグメンテーションの長距離依存性のモデリングを強化するために,PSGRモジュールを提案する。 PSGRモジュールは不正確なピクセルからノードへの投影を回避し、グローバルな推論のために各ピクセル固有の情報を保存する。このソリューションは、3つの公開データセット上の4つの広く使われているセグメンテーションモデルに対して評価されている。
論文参考訳（メタデータ） (2021-08-09T04:58:23Z)
AINet: Association Implantation for Superpixel Segmentation [82.21559299694555]
今回提案する新しいtextbfAssociation textbfImplantation(AI)モジュールは、ネットワークがピクセルとその周辺グリッド間の関係を明示的にキャプチャすることを可能にする。本手法は最先端性能を実現するだけでなく,十分な推論効率を維持することができた。
論文参考訳（メタデータ） (2021-01-26T10:40:13Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。