論文の概要: Bridging spatial awareness and global context in medical image segmentation
- arxiv url: http://arxiv.org/abs/2512.06560v1
- Date: Sat, 06 Dec 2025 20:25:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-09 22:03:54.408963
- Title: Bridging spatial awareness and global context in medical image segmentation
- Title(参考訳): 医用画像セグメンテーションにおけるブリッジング空間認識とグローバルコンテキスト
- Authors: Dalia Alzu'bi, A. Ben Hamza,
- Abstract要約: セグメント化性能を向上させるために,新しいU字型エンコーダデコーダネットワークであるU-CycleMLPを提案する。
エンコーダは、位置注意重みブロック、高密度アトラスブロック、ダウンサンプリング演算を用いて、マルチスケールのコンテキスト特徴を学習する。
デコーダは、アップサンプリング操作、高密度アトラスブロック、特徴融合機構を通じて高分解能セグメンテーションマスクを再構成する。
- 参考スコア(独自算出の注目度): 2.750124853532831
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Medical image segmentation is a fundamental task in computer-aided diagnosis, requiring models that balance segmentation accuracy and computational efficiency. However, existing segmentation models often struggle to effectively capture local and global contextual information, leading to boundary pixel loss and segmentation errors. In this paper, we propose U-CycleMLP, a novel U-shaped encoder-decoder network designed to enhance segmentation performance while maintaining a lightweight architecture. The encoder learns multiscale contextual features using position attention weight excitation blocks, dense atrous blocks, and downsampling operations, effectively capturing both local and global contextual information. The decoder reconstructs high-resolution segmentation masks through upsampling operations, dense atrous blocks, and feature fusion mechanisms, ensuring precise boundary delineation. To further refine segmentation predictions, channel CycleMLP blocks are incorporated into the decoder along the skip connections, enhancing feature integration while maintaining linear computational complexity relative to input size. Experimental results, both quantitative and qualitative, across three benchmark datasets demonstrate the competitive performance of U-CycleMLP in comparison with state-of-the-art methods, achieving better segmentation accuracy across all datasets, capturing fine-grained anatomical structures, and demonstrating robustness across different medical imaging modalities. Ablation studies further highlight the importance of the model's core architectural components in enhancing segmentation accuracy.
- Abstract(参考訳): 医用画像のセグメンテーションはコンピュータ支援診断の基本的な課題であり、セグメンテーションの精度と計算効率のバランスをとるモデルを必要とする。
しかし、既存のセグメンテーションモデルは、しばしば局所的およびグローバルな文脈情報を効果的に捉えるのに苦労し、境界画素の損失とセグメンテーションエラーにつながる。
本稿では,軽量アーキテクチャを維持しながらセグメンテーション性能を向上させることを目的とした,U字型エンコーダデコーダネットワークU-CycleMLPを提案する。
エンコーダは、位置注意重み励起ブロック、高密度アトラスブロック、ダウンサンプリング演算を用いて、マルチスケールのコンテキスト特徴を学習し、局所的およびグローバルなコンテキスト情報の両方を効果的にキャプチャする。
デコーダは、アップサンプリング操作、高密度アトラスブロック、特徴融合機構を通じて高分解能セグメンテーションマスクを再構成し、正確な境界デラインを確保する。
さらにセグメンテーション予測を洗練させるために、チャネルCycleMLPブロックがスキップ接続に沿ってデコーダに組み込まれ、入力サイズに対する線形計算複雑性を維持しながら機能統合が向上する。
3つのベンチマークデータセットの定量的および定性的な実験結果は、最先端の手法と比較して、U-CycleMLPの競合性能を示し、すべてのデータセットのセグメンテーション精度を向上し、きめ細かい解剖学的構造を捕捉し、異なる医用画像モダリティ間で堅牢性を実証する。
アブレーション研究は、セグメンテーションの精度を高める上で、モデルのコアアーキテクチャコンポーネントの重要性をさらに強調している。
関連論文リスト
- A Mutual Inclusion Mechanism for Precise Boundary Segmentation in Medical Images [2.9137615132901704]
医用画像の正確な境界セグメンテーションのための新しい深層学習手法MIPC-Netを提案する。
位置特徴抽出時のチャネル情報に重点を置くMIPCモジュールを提案する。
また,エンコーダとデコーダの統合性を高めるグローバルな残差接続であるGL-MIPC-Residueを提案する。
論文 参考訳(メタデータ) (2024-04-12T02:14:35Z) - BRAU-Net++: U-Shaped Hybrid CNN-Transformer Network for Medical Image Segmentation [11.986549780782724]
医用画像の正確な分割作業のために,BRAU-Net++ というハイブリッドで効果的な CNN-Transformer ネットワークを提案する。
具体的には、BRAU-Net++は、U字型エンコーダデコーダ構造を設計するために、コアビルディングブロックとしてバイレベルルーティングアテンションを使用する。
提案手法は,そのベースラインであるBRAU-Netを含む,最先端の手法を超越した手法である。
論文 参考訳(メタデータ) (2024-01-01T10:49:09Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - Self-supervised Semantic Segmentation: Consistency over Transformation [3.485615723221064]
Inception Large Kernel Attention (I-LKA) モジュールをベースとしたロバストなフレームワークを統合した新しい自己教師型アルゴリズム textbfS$3$-Net を提案する。
我々は、変形可能な畳み込みを積分成分として利用し、優れた物体境界定義のための歪み変形を効果的に捕捉し、デライン化する。
皮膚病変および肺臓器の分節タスクに関する実験結果から,SOTA法と比較して,本手法の優れた性能を示した。
論文 参考訳(メタデータ) (2023-08-31T21:28:46Z) - Multi-organ Segmentation Network with Adversarial Performance Validator [10.775440368500416]
本稿では,2次元から3次元のセグメンテーションフレームワークに対向的な性能検証ネットワークを導入する。
提案したネットワークは, 2次元粗い結果から3次元高品質なセグメンテーションマスクへの変換を行い, 共同最適化によりセグメンテーション精度が向上する。
NIH膵分節データセットの実験では、提案したネットワークが小臓器分節の最先端の精度を達成し、過去の最高性能を上回った。
論文 参考訳(メタデータ) (2022-04-16T18:00:29Z) - Real-Time Scene Text Detection with Differentiable Binarization and
Adaptive Scale Fusion [62.269219152425556]
セグメンテーションに基づくシーンテキスト検出手法はシーンテキスト検出分野において大きな注目を集めている。
本稿では,二項化処理をセグメンテーションネットワークに統合する分散二項化(DB)モジュールを提案する。
アダプティブ・スケール・フュージョン (ASF) モジュールは, 異なるスケールの特徴を適応的に融合させることにより, スケールのロバスト性を向上させる。
論文 参考訳(メタデータ) (2022-02-21T15:30:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。