論文の概要: LGMSNet: Thinning a medical image segmentation model via dual-level multiscale fusion
- arxiv url: http://arxiv.org/abs/2508.15476v1
- Date: Thu, 21 Aug 2025 11:54:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-22 16:26:46.304312
- Title: LGMSNet: Thinning a medical image segmentation model via dual-level multiscale fusion
- Title(参考訳): LGMSNet:デュアルレベルマルチスケール核融合による医用画像分割モデルの薄型化
- Authors: Chengqi Dong, Fenghe Tang, Rongge Mao, Xinpei Gao, S. Kevin Zhou,
- Abstract要約: LGMSNetは、ローカルおよびグローバルなデュアルマルチスケールに基づく、新しい軽量フレームワークである。
計算オーバーヘッドを最小限に抑えて最先端のパフォーマンスを実現する。
4つの目に見えないデータセット上でゼロショットの一般化テストでは、例外的なパフォーマンスを維持している。
- 参考スコア(独自算出の注目度): 11.840009038495944
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Medical image segmentation plays a pivotal role in disease diagnosis and treatment planning, particularly in resource-constrained clinical settings where lightweight and generalizable models are urgently needed. However, existing lightweight models often compromise performance for efficiency and rarely adopt computationally expensive attention mechanisms, severely restricting their global contextual perception capabilities. Additionally, current architectures neglect the channel redundancy issue under the same convolutional kernels in medical imaging, which hinders effective feature extraction. To address these challenges, we propose LGMSNet, a novel lightweight framework based on local and global dual multiscale that achieves state-of-the-art performance with minimal computational overhead. LGMSNet employs heterogeneous intra-layer kernels to extract local high-frequency information while mitigating channel redundancy. In addition, the model integrates sparse transformer-convolutional hybrid branches to capture low-frequency global information. Extensive experiments across six public datasets demonstrate LGMSNet's superiority over existing state-of-the-art methods. In particular, LGMSNet maintains exceptional performance in zero-shot generalization tests on four unseen datasets, underscoring its potential for real-world deployment in resource-limited medical scenarios. The whole project code is in https://github.com/cq-dong/LGMSNet.
- Abstract(参考訳): 医用画像のセグメンテーションは病気の診断や治療計画において重要な役割を担い、特に軽量で一般化可能なモデルが緊急に必要となるリソース制約のある臨床環境では重要な役割を担っている。
しかし、既存の軽量モデルは効率性のために性能を損なうことが多く、計算的に高価な注意機構を採用することは稀であり、グローバルな文脈認識能力を著しく制限している。
さらに、現在のアーキテクチャは、医療画像における同じ畳み込みカーネルの下でチャネル冗長性の問題を無視しており、効果的な特徴抽出を妨げる。
これらの課題に対処するため,LGMSNetを提案する。これは局所的およびグローバルなマルチスケールに基づく,計算オーバーヘッドを最小限に抑えた最新性能を実現する軽量なフレームワークである。
LGMSNetは、チャネル冗長性を緩和しながら、局所的な高周波情報を抽出するために、異種層内カーネルを使用している。
さらに、このモデルはスパーストランスフォーマー-畳み込みハイブリッドブランチを統合し、低周波グローバル情報をキャプチャする。
6つの公開データセットにわたる大規模な実験は、既存の最先端メソッドよりもLGMSNetの方が優れていることを示している。
特にLGMSNetは、4つの目に見えないデータセットのゼロショット一般化テストにおいて例外的なパフォーマンスを維持しており、リソース制限された医療シナリオにおける現実的なデプロイメントの可能性を強調している。
プロジェクトコードは、https://github.com/cq-dong/LGMSNetにある。
関連論文リスト
- QuantVSR: Low-Bit Post-Training Quantization for Real-World Video Super-Resolution [53.13952833016505]
実世界のビデオ超解像(VSR)のための低ビット量子化モデルを提案する。
キャリブレーションデータセットを用いて各レイヤの空間的および時間的複雑さを計測する。
我々はFPおよび低ビット分岐を改良し、同時最適化を実現する。
論文 参考訳(メタデータ) (2025-08-06T14:35:59Z) - Mobile U-ViT: Revisiting large kernel and U-shaped ViT for efficient medical image segmentation [22.045663130551446]
医用画像分割に適した移動体U字型視覚変換器(Mobile U-ViT)を提案する。
この設計は、より軽量で高速なトランスフォーマーのような表現学習能力を示す。
計算要求が減っているにもかかわらず、我々のアーキテクチャは8つの公開2Dおよび3Dデータセットで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-08-01T20:45:42Z) - Any Image Restoration via Efficient Spatial-Frequency Degradation Adaptation [158.37640586809187]
劣化した画像を1つのモデルで効率的に復元することは、ますます重要になっている。
我々のアプローチはAnyIRと呼ばれ、様々な劣化にまたがる固有の類似性を活用する統一された経路をとっています。
劣化認識と文脈的注意を融合させるため,空間周波数並列融合戦略を提案する。
論文 参考訳(メタデータ) (2025-04-19T09:54:46Z) - Crane: Context-Guided Prompt Learning and Attention Refinement for Zero-Shot Anomaly Detection [50.343419243749054]
異常検出は、医学診断や工業的欠陥検出などの分野において重要である。
CLIPの粗粒化画像テキストアライメントは、微粒化異常に対する局所化と検出性能を制限する。
クレーンは最先端のZSADを2%から28%に改善し、画像レベルとピクセルレベルの両方で、推論速度では競争力を維持している。
論文 参考訳(メタデータ) (2025-04-15T10:42:25Z) - Memory-efficient High-resolution OCT Volume Synthesis with Cascaded Amortized Latent Diffusion Models [48.87160158792048]
本稿では,高分解能CTボリュームをメモリ効率よく合成できるCA-LDM(Cascaded amortized Latent diffusion model)を提案する。
公開高解像度OCTデータセットを用いた実験により、我々の合成データは、既存の手法の能力を超越した、現実的な高解像度かつグローバルな特徴を持つことが示された。
論文 参考訳(メタデータ) (2024-05-26T10:58:22Z) - PMFSNet: Polarized Multi-scale Feature Self-attention Network For
Lightweight Medical Image Segmentation [6.134314911212846]
現在の最先端の医用画像分割法は精度を優先するが、計算要求の増大とより大きなモデルサイズを犠牲にすることも多い。
計算冗長性を避けつつグローバルな局所特徴処理のバランスをとる新しい医用画像分割モデルPMFSNetを提案する。
長期依存関係をキャプチャするために,アテンション機構に基づいたマルチスケール機能拡張モジュールであるPMFSブロックをプラグインとして組み込んでいる。
論文 参考訳(メタデータ) (2024-01-15T10:26:47Z) - Leveraging Frequency Domain Learning in 3D Vessel Segmentation [50.54833091336862]
本研究では,Fourier領域学習を3次元階層分割モデルにおけるマルチスケール畳み込みカーネルの代用として活用する。
管状血管分割作業において,新しいネットワークは顕著なサイス性能(ASACA500が84.37%,ImageCASが80.32%)を示した。
論文 参考訳(メタデータ) (2024-01-11T19:07:58Z) - Affine-Consistent Transformer for Multi-Class Cell Nuclei Detection [76.11864242047074]
本稿では, 原子核位置を直接生成する新しいアフィン一貫性変換器 (AC-Former) を提案する。
本稿では,AAT (Adaptive Affine Transformer) モジュールを導入し,ローカルネットワークトレーニングのためのオリジナル画像をワープするための重要な空間変換を自動学習する。
実験結果から,提案手法は様々なベンチマークにおいて既存の最先端アルゴリズムを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2023-10-22T02:27:02Z) - CMUNeXt: An Efficient Medical Image Segmentation Network based on Large
Kernel and Skip Fusion [11.434576556863934]
CMUNeXtは、効率的な完全畳み込み軽量医療画像セグメンテーションネットワークである。
実際のシーンシナリオにおいて、迅速かつ正確な補助診断を可能にする。
論文 参考訳(メタデータ) (2023-08-02T15:54:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。