論文の概要: An Enhanced Pyramid Feature Network Based on Long-Range Dependencies for Multi-Organ Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2509.24358v1
- Date: Mon, 29 Sep 2025 06:57:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 22:32:19.801497
- Title: An Enhanced Pyramid Feature Network Based on Long-Range Dependencies for Multi-Organ Medical Image Segmentation
- Title(参考訳): 多言語医用画像分割のための長距離依存性に基づくピラミッド特徴ネットワークの強化
- Authors: Dayu Tan, Cheng Kong, Yansen Su, Hai Chen, Dongliang Yang, Junfeng Xia, Chunhou Zheng,
- Abstract要約: 複数の臓器にまたがる細粒度セグメンテーションタスクのための,LamFormerと呼ばれる新しいディープラーニングネットワークを提案する。
LamFormerは、既存のセグメンテーションメソッドを7つの複雑で多様なデータセットで上回っている。
- 参考スコア(独自算出の注目度): 12.785846392087144
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the field of multi-organ medical image segmentation, recent methods frequently employ Transformers to capture long-range dependencies from image features. However, these methods overlook the high computational cost of Transformers and their deficiencies in extracting local detailed information. To address high computational costs and inadequate local detail information, we reassess the design of feature extraction modules and propose a new deep-learning network called LamFormer for fine-grained segmentation tasks across multiple organs. LamFormer is a novel U-shaped network that employs Linear Attention Mamba (LAM) in an enhanced pyramid encoder to capture multi-scale long-range dependencies. We construct the Parallel Hierarchical Feature Aggregation (PHFA) module to aggregate features from different layers of the encoder, narrowing the semantic gap among features while filtering information. Finally, we design the Reduced Transformer (RT), which utilizes a distinct computational approach to globally model up-sampled features. RRT enhances the extraction of detailed local information and improves the network's capability to capture long-range dependencies. LamFormer outperforms existing segmentation methods on seven complex and diverse datasets, demonstrating exceptional performance. Moreover, the proposed network achieves a balance between model performance and model complexity.
- Abstract(参考訳): マルチ組織医療画像セグメンテーションの分野では、近年の手法では、画像特徴から長距離依存関係をキャプチャするためにTransformerが頻繁に使用されている。
しかし、これらの手法は、トランスフォーマーの高計算コストと、局所的な詳細情報を抽出する際の欠点を見落としている。
高い計算コストと局所的な詳細情報に対処するため,我々は特徴抽出モジュールの設計を再評価し,複数の臓器にまたがる細粒度セグメンテーションタスクのためのLamFormerと呼ばれる新しいディープラーニングネットワークを提案する。
LamFormerは、Linear Attention Mamba(LAM)を拡張ピラミッドエンコーダに採用して、マルチスケールの長距離依存関係をキャプチャする新しいU字型ネットワークである。
並列階層的特徴集約(PHFA)モジュールを構築し,エンコーダの異なる層から特徴を集約し,特徴間のセマンティックギャップを狭める。
最後に,一意の計算手法を応用したReduced Transformer (RT) の設計を行った。
RRTは、詳細なローカル情報の抽出を強化し、長距離依存関係をキャプチャするネットワークの機能を改善する。
LamFormerは、7つの複雑で多様なデータセット上の既存のセグメンテーションメソッドより優れており、例外的なパフォーマンスを示している。
さらに,提案するネットワークは,モデル性能とモデル複雑性のバランスをとる。
関連論文リスト
- GCRPNet: Graph-Enhanced Contextual and Regional Perception Network for Salient Object Detection in Optical Remote Sensing Images [68.33481681452675]
本稿では,GCRPNet(Graph-enhanced contextual and Regional Recognition Network)を提案する。
これはMambaアーキテクチャの上に構築され、長距離依存関係を同時にキャプチャし、地域的特徴表現を強化する。
マルチスケールの畳み込みによって処理される特徴マップに対して適応的なパッチスキャンを行い、リッチなローカル領域情報をキャプチャする。
論文 参考訳(メタデータ) (2025-08-14T11:31:43Z) - Multi-scale Feature Enhancement in Multi-task Learning for Medical Image Analysis [1.6916040234975798]
医用画像における伝統的な深層学習法は、分割や分類にのみ焦点をあてることが多い。
このモデルでは,デコーダがセグメント化マスクを生成するのに対して,エンコーダによって抽出された特徴を分類ラベルの予測に利用する。
複数の医療データセットにまたがる実験結果から, セグメンテーションタスクと分類タスクの両方において, モデルの優れた性能が確認された。
論文 参考訳(メタデータ) (2024-11-30T04:20:05Z) - P-MSDiff: Parallel Multi-Scale Diffusion for Remote Sensing Image Segmentation [8.46409964236009]
拡散モデルとマルチスケール機能はセグメンテーションタスクにおいて不可欠な要素である。
並列なマルチスケール分岐を持つ拡散モデルとして知られるセマンティックセグメンテーションの新しいモデルを提案する。
我々のモデルは、UAVidとVayhingen Buildingのデータセットに基づいて、J1測定値に基づいて、優れたパフォーマンスを示す。
論文 参考訳(メタデータ) (2024-05-30T19:40:08Z) - Learning to Aggregate Multi-Scale Context for Instance Segmentation in
Remote Sensing Images [28.560068780733342]
特徴抽出のプロセスを改善するために,新しいコンテキスト集約ネットワーク(CATNet)を提案する。
提案モデルは,高密度特徴ピラミッドネットワーク(DenseFPN),空間コンテキストピラミッド(SCP),階層的関心抽出器(HRoIE)の3つの軽量プラグアンドプレイモジュールを利用する。
論文 参考訳(メタデータ) (2021-11-22T08:55:25Z) - PnP-DETR: Towards Efficient Visual Analysis with Transformers [146.55679348493587]
近年、DeTRはトランスフォーマーを用いたソリューションビジョンタスクの先駆者であり、画像特徴マップを直接オブジェクト結果に変換する。
最近の変圧器を用いた画像認識モデルとTTは、一貫した効率向上を示す。
論文 参考訳(メタデータ) (2021-09-15T01:10:30Z) - Polyp-PVT: Polyp Segmentation with Pyramid Vision Transformers [124.01928050651466]
本稿では,Polyp-PVTと呼ばれる新しいタイプのPolypセグメンテーション手法を提案する。
提案モデルであるPolyp-PVTは,特徴の雑音を効果的に抑制し,その表現能力を大幅に向上させる。
論文 参考訳(メタデータ) (2021-08-16T07:09:06Z) - Sequential Hierarchical Learning with Distribution Transformation for
Image Super-Resolution [83.70890515772456]
画像SRのための逐次階層学習型超解像ネットワーク(SHSR)を構築した。
特徴のスケール間相関を考察し、階層的情報を段階的に探索するシーケンシャルなマルチスケールブロック(SMB)を考案する。
実験結果から,SHSRは最先端手法に優れた定量的性能と視覚的品質が得られることが示された。
論文 参考訳(メタデータ) (2020-07-19T01:35:53Z) - Multi-organ Segmentation over Partially Labeled Datasets with
Multi-scale Feature Abstraction [14.92032083210668]
完全な注釈付きデータセットの短縮は、ディープラーニングベースのイメージセグメンテーションアルゴリズムを開発する上で、制限要因となっている。
本稿では,新しいマルチスケールディープニューラルネットワークを複数の部分ラベル付きデータセット上でトレーニング可能な統合トレーニング戦略を提案する。
論文 参考訳(メタデータ) (2020-01-01T13:51:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。