論文の概要: GRAFNet: Multiscale Retinal Processing via Guided Cortical Attention Feedback for Enhancing Medical Image Polyp Segmentation
- arxiv url: http://arxiv.org/abs/2602.15072v1
- Date: Sun, 15 Feb 2026 17:29:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-18 16:03:17.853511
- Title: GRAFNet: Multiscale Retinal Processing via Guided Cortical Attention Feedback for Enhancing Medical Image Polyp Segmentation
- Title(参考訳): GRAFNet:医療用画像ポリプセグメンテーションのためのガイド皮質注意フィードバックによるマルチスケール網膜プロセッシング
- Authors: Abdul Joseph Fofanah, Lian Wen, Alpha Alimamy Kamara, Zhongyi Zhang, David Chen, Albert Patrick Sankoh,
- Abstract要約: 本稿では,人間の視覚システムの階層構造を模倣する生物学的にインスパイアされたアーキテクチャであるGRAFNetを提案する。
GRAFNetは,(1)方向調整された皮質ニューロンをポリプ境界に模倣するガイド非対称注意モジュール(GAAM),(2)平行多機能解析のために網膜神経節細胞経路を複製するマルチスケール網膜モジュール(MSRM),(3)反復精製に予測符号化を適用するガイド非対称注意フィードバックモジュール(GCAFM)の3つの重要なモジュールを統合する。
- 参考スコア(独自算出の注目度): 6.834321209531585
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate polyp segmentation in colonoscopy is essential for cancer prevention but remains challenging due to: (1) high morphological variability (from flat to protruding lesions), (2) strong visual similarity to normal structures such as folds and vessels, and (3) the need for robust multi-scale detection. Existing deep learning approaches suffer from unidirectional processing, weak multi-scale fusion, and the absence of anatomical constraints, often leading to false positives (over-segmentation of normal structures) and false negatives (missed subtle flat lesions). We propose GRAFNet, a biologically inspired architecture that emulates the hierarchical organisation of the human visual system. GRAFNet integrates three key modules: (1) a Guided Asymmetric Attention Module (GAAM) that mimics orientation-tuned cortical neurones to emphasise polyp boundaries, (2) a MultiScale Retinal Module (MSRM) that replicates retinal ganglion cell pathways for parallel multi-feature analysis, and (3) a Guided Cortical Attention Feedback Module (GCAFM) that applies predictive coding for iterative refinement. These are unified in a Polyp Encoder-Decoder Module (PEDM) that enforces spatial-semantic consistency via resolution-adaptive feedback. Extensive experiments on five public benchmarks (Kvasir-SEG, CVC-300, CVC-ColonDB, CVC-Clinic, and PolypGen) demonstrate consistent state-of-the-art performance, with 3-8% Dice improvements and 10-20% higher generalisation over leading methods, while offering interpretable decision pathways. This work establishes a paradigm in which neural computation principles bridge the gap between AI accuracy and clinically trustworthy reasoning. Code is available at https://github.com/afofanah/GRAFNet.
- Abstract(参考訳): 大腸内視鏡検査における正確なポリープセグメンテーションは癌予防に必須であるが,(1) 形態学的変化(平坦から突出する病変まで),(2) 折り畳みや血管などの正常な構造と強い視覚的類似性,(3) 堅牢なマルチスケール検出の必要性により,依然として困難である。
既存のディープラーニングアプローチは、一方向処理、弱いマルチスケールの融合、解剖学的制約の欠如に悩まされ、しばしば偽陽性(正規構造の過剰な部分化)と偽陰性(微妙な平坦な病変が欠如している)に繋がる。
本稿では,人間の視覚システムの階層構造を模倣する生物学的にインスパイアされたアーキテクチャであるGRAFNetを提案する。
GRAFNetは、3つの重要なモジュールを統合している。(1)ポリプ境界を強調するために方向調整された皮質ニューロンを模倣するガイド非対称注意モジュール(GAAM)、(2)平行多機能解析のために網膜神経節細胞経路を複製するマルチスケール網膜モジュール(MSRM)、(3)反復改善のために予測符号化を適用するガイド非対称注意フィードバックモジュール(GCAFM)である。
それらはPolyp Encoder-Decoder Module (PEDM) に統合され、分解能適応フィードバックを通じて空間的セマンティックな一貫性を強制する。
5つの公開ベンチマーク(Kvasir-SEG、CVC-300、CVC-ColonDB、CVC-Clinic、PolypGen)の大規模な実験では、解釈可能な決定経路を提供しながら、38%のDiceの改善と10-20%の高次化が達成された。
この研究は、ニューラルネットワークの原理がAIの精度と臨床的に信頼できる推論のギャップを埋めるパラダイムを確立する。
コードはhttps://github.com/afofanah/GRAFNetで入手できる。
関連論文リスト
- Multimodal Visual Surrogate Compression for Alzheimer's Disease Classification [69.87877580725768]
MVSC(Multimodal Visual Surrogate Compression)は、大規模な3D sMRIボリュームをコンパクトな2D機能に圧縮し、適応させることを学ぶ。
MVSCには2つの重要なコンポーネントがある: テキストガイダンスの下でグローバルなクロススライスコンテキストをキャプチャするボリュームコンテキストと、テキストエンハンスでパッチワイズな方法でスライスレベルの情報を集約するAdaptive Slice Fusionモジュール。
論文 参考訳(メタデータ) (2026-01-29T13:05:46Z) - CMFDNet: Cross-Mamba and Feature Discovery Network for Polyp Segmentation [12.470058138730806]
自動大腸ポリープセグメンテーションのための革新的アーキテクチャCMFDNetが提案されている。
CMFDNetはCMDモジュール、MSAモジュール、FDモジュールで提案されている。
実験の結果,CMFDNetは6つのSOTA法より優れていることがわかった。
論文 参考訳(メタデータ) (2025-08-25T07:12:00Z) - HGNet: High-Order Spatial Awareness Hypergraph and Multi-Scale Context Attention Network for Colorectal Polyp Detection [8.385970320948024]
HGNetは高次空間認識ハイパーグラフとマルチスケールコンテキストアテンションを統合している。
HGNetは94%の精度、90.6%のリコール、90%のmAP@0.5を達成し、小さな病変の分化と臨床的解釈性を著しく改善した。
論文 参考訳(メタデータ) (2025-07-07T11:09:05Z) - LGPS: A Lightweight GAN-Based Approach for Polyp Segmentation in Colonoscopy Images [40.19053450600923]
ポリプセグメンテーションのための軽量なGANベースのフレームワークであるLGPSを提案する。
1) 改良された残留ブロックで強化されたMobileNetV2バックボーンと、効率的な特徴抽出のためのSqueeze-and-Excitationモジュールである。
最大かつ挑戦的なPolypGenテストデータセットでは、LGPSはDiceの0.7299とIoUの0.7867を達成し、全てのSOTAワークを上回り、堅牢な一般化を実証した。
論文 参考訳(メタデータ) (2025-03-24T02:41:53Z) - Prototype Learning Guided Hybrid Network for Breast Tumor Segmentation in DCE-MRI [58.809276442508256]
本稿では,畳み込みニューラルネットワーク(CNN)とトランスフォーマー層を組み合わせたハイブリッドネットワークを提案する。
プライベートおよびパブリックなDCE-MRIデータセットの実験結果から,提案したハイブリッドネットワークは最先端の手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-08-11T15:46:00Z) - Adaptation of Distinct Semantics for Uncertain Areas in Polyp Segmentation [11.646574658785362]
本研究は,ポリプ不確定領域に対する識別意味論の適応という新しいアーキテクチャを提示する。
ADSNetは、未分類の詳細を修正し、最終段階で消滅し、検出されない弱い特徴を回復する。
実験により,ポリプ画像分割作業における他の技術と比較して,セグメンテーション性能が向上することを示す。
論文 参考訳(メタデータ) (2024-05-13T07:41:28Z) - ECC-PolypDet: Enhanced CenterNet with Contrastive Learning for Automatic
Polyp Detection [88.4359020192429]
既存の手法では、計算コストのかかるコンテキストアグリゲーションが伴うか、ポリープの事前モデリングが欠如しているため、難解なケースでは性能が低下する。
本稿では,2段階のトレーニングとエンドツーエンド推論フレームワークである Enhanced CenterNet with Contrastive Learning (ECC-PolypDet) を提案する。
Box-assisted Contrastive Learning (BCL) は, クラス内差を最小限に抑え, 前庭ポリープと背景のクラス間差を最大化するため, 隠れポリープを捕捉する。
微調整段階におけるIoU誘導サンプル再重み付けの導入
論文 参考訳(メタデータ) (2024-01-10T07:03:41Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - Affine-Consistent Transformer for Multi-Class Cell Nuclei Detection [76.11864242047074]
本稿では, 原子核位置を直接生成する新しいアフィン一貫性変換器 (AC-Former) を提案する。
本稿では,AAT (Adaptive Affine Transformer) モジュールを導入し,ローカルネットワークトレーニングのためのオリジナル画像をワープするための重要な空間変換を自動学習する。
実験結果から,提案手法は様々なベンチマークにおいて既存の最先端アルゴリズムを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2023-10-22T02:27:02Z) - Lesion-aware Dynamic Kernel for Polyp Segmentation [49.63274623103663]
ポリープセグメンテーションのための障害対応動的ネットワーク(LDNet)を提案する。
従来のU字型エンコーダ・デコーダ構造であり、動的カーネル生成と更新スキームが組み込まれている。
この単純だが効果的なスキームは、我々のモデルに強力なセグメンテーション性能と一般化能力を与える。
論文 参考訳(メタデータ) (2023-01-12T09:53:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。