論文の概要: Med-2D SegNet: A Light Weight Deep Neural Network for Medical 2D Image Segmentation
- arxiv url: http://arxiv.org/abs/2504.14715v1
- Date: Sun, 20 Apr 2025 19:04:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-29 20:34:13.813263
- Title: Med-2D SegNet: A Light Weight Deep Neural Network for Medical 2D Image Segmentation
- Title(参考訳): Med-2D SegNet:医療用2次元画像セグメンテーションのための軽量ディープニューラルネットワーク
- Authors: Md. Sanaullah Chowdhury, Salauddin Tapu, Noyon Kumar Sarkar, Ferdous Bin Ali, Lameya Sabrin,
- Abstract要約: 我々は,新しい高効率セグメンテーションアーキテクチャであるMed-2D SegNetを紹介する。
Med-2D SegNetは、複数のベンチマークデータセットで最先端のパフォーマンスを実現する。
その成功の中心は、特殊なエンコーダ設計であるコンパクトなメドブロックである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate and efficient medical image segmentation is crucial for advancing clinical diagnostics and surgical planning, yet remains a complex challenge due to the variability in anatomical structures and the demand for low-complexity models. In this paper, we introduced Med-2D SegNet, a novel and highly efficient segmentation architecture that delivers outstanding accuracy while maintaining a minimal computational footprint. Med-2D SegNet achieves state-of-the-art performance across multiple benchmark datasets, including KVASIR-SEG, PH2, EndoVis, and GLAS, with an average Dice similarity coefficient (DSC) of 89.77% across 20 diverse datasets. Central to its success is the compact Med Block, a specialized encoder design that incorporates dimension expansion and parameter reduction, enabling precise feature extraction while keeping model parameters to a low count of just 2.07 million. Med-2D SegNet excels in cross-dataset generalization, particularly in polyp segmentation, where it was trained on KVASIR-SEG and showed strong performance on unseen datasets, demonstrating its robustness in zero-shot learning scenarios, even though we acknowledge that further improvements are possible. With top-tier performance in both binary and multi-class segmentation, Med-2D SegNet redefines the balance between accuracy and efficiency, setting a new benchmark for medical image analysis. This work paves the way for developing accessible, high-performance diagnostic tools suitable for clinical environments and resource-constrained settings, making it a step forward in the democratization of advanced medical technology.
- Abstract(参考訳): 正確な医用画像分割は、臨床診断や手術計画の進展に不可欠であるが、解剖学的構造の変化と低複雑さモデルの需要のため、依然として複雑な課題である。
本稿では,最小限の計算フットプリントを維持しつつ,優れた精度を実現する,新しい高効率セグメンテーションアーキテクチャであるMed-2D SegNetを紹介した。
Med-2D SegNetは、KVASIR-SEG、PH2、EndoVis、GLASを含む複数のベンチマークデータセットにおける最先端のパフォーマンスを達成し、20種類のデータセットで平均Dice類似度係数(DSC)は89.77%である。
コンパクトなメドブロックは、次元展開とパラメータ還元を取り入れた特殊なエンコーダ設計であり、モデルパラメータを2億7700万という低い数に保ちながら、正確な特徴抽出を可能にする。
Med-2D SegNetは、特にポリプセグメンテーションにおいて、KVASIR-SEGでトレーニングされ、目に見えないデータセットで強力なパフォーマンスを示し、さらなる改善が可能であることを認めながら、ゼロショット学習シナリオでの堅牢性を示している。
Med-2D SegNetは、バイナリとマルチクラスのセグメンテーションの両方でトップレベルのパフォーマンスで、精度と効率のバランスを再定義し、医療画像分析のための新しいベンチマークを設定している。
本研究は、臨床環境や資源制約のある環境に適した、アクセス可能な高性能な診断ツールを開発するための方法であり、先進的な医療技術の民主化への一歩となる。
関連論文リスト
- Multi-encoder nnU-Net outperforms Transformer models with self-supervised pretraining [0.0]
本研究は, 医用画像の解剖学的構造と病理的領域の自動同定と記述を含む, 医用画像セグメンテーションの課題に対処するものである。
本稿では,複数のMRIモダリティを別個のエンコーダで独立に処理するために設計された,自己教師型学習用マルチエンコーダnnU-Netアーキテクチャを提案する。
我々のマルチエンコーダnnU-Netは、Vanilla nnU-Net、SegResNet、Swin UNETRといった他のモデルを上回る93.72%のDice similarity Coefficient(DSC)を達成し、例外的な性能を示す。
論文 参考訳(メタデータ) (2025-04-04T14:31:06Z) - Assessing the Performance of the DINOv2 Self-supervised Learning Vision Transformer Model for the Segmentation of the Left Atrium from MRI Images [1.2499537119440245]
DINOv2は、MRIを用いたLAセグメンテーションのための自然画像に基づいて訓練された自己教師型学習視覚変換器である。
我々は、Diceスコアが.871で、Jaccard Indexが.792で、エンドツーエンドの微調整が可能な、正確で一貫したセグメンテーションを提供する能力を示す。
これらの結果は、DINOv2がMRIに限られたデータで効果的に適応し、セグメンテーションの競争ツールとしての可能性を強調し、医療画像の幅広い利用を促進することを示唆している。
論文 参考訳(メタデータ) (2024-11-14T17:15:51Z) - MedCLIP-SAMv2: Towards Universal Text-Driven Medical Image Segmentation [2.2585213273821716]
MedCLIP-SAMv2はCLIPとSAMモデルを統合して臨床スキャンのセグメンテーションを行う新しいフレームワークである。
提案手法は,DHN-NCE(Decoupled Hard Negative Noise Contrastive Estimation)によるBiomedCLIPモデルの微調整を含む。
また,ゼロショットセグメンテーションラベルを弱教師付きパラダイム内で使用することにより,セグメンテーション品質をさらに向上する。
論文 参考訳(メタデータ) (2024-09-28T23:10:37Z) - Prototype Learning Guided Hybrid Network for Breast Tumor Segmentation in DCE-MRI [58.809276442508256]
本稿では,畳み込みニューラルネットワーク(CNN)とトランスフォーマー層を組み合わせたハイブリッドネットワークを提案する。
プライベートおよびパブリックなDCE-MRIデータセットの実験結果から,提案したハイブリッドネットワークは最先端の手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-08-11T15:46:00Z) - A Mutual Inclusion Mechanism for Precise Boundary Segmentation in Medical Images [2.9137615132901704]
医用画像の正確な境界セグメンテーションのための新しい深層学習手法MIPC-Netを提案する。
位置特徴抽出時のチャネル情報に重点を置くMIPCモジュールを提案する。
また,エンコーダとデコーダの統合性を高めるグローバルな残差接続であるGL-MIPC-Residueを提案する。
論文 参考訳(メタデータ) (2024-04-12T02:14:35Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - LDMRes-Net: Enabling Efficient Medical Image Segmentation on IoT and
Edge Platforms [9.626726110488386]
本稿では,IoTおよびエッジプラットフォーム上での医用画像のセグメンテーションに適した,軽量なデュアルマルチスケール残差ブロック型ニューラルネットワークを提案する。
LDMRes-Netは、非常に少ない学習可能なパラメータ(0.072M)で制限を克服し、リソース制約のあるデバイスに非常に適している。
論文 参考訳(メタデータ) (2023-06-09T10:34:18Z) - Self-Supervised Correction Learning for Semi-Supervised Biomedical Image
Segmentation [84.58210297703714]
半教師付きバイオメディカルイメージセグメンテーションのための自己教師付き補正学習パラダイムを提案する。
共有エンコーダと2つの独立デコーダを含むデュアルタスクネットワークを設計する。
異なるタスクのための3つの医用画像分割データセットの実験により,本手法の優れた性能が示された。
論文 参考訳(メタデータ) (2023-01-12T08:19:46Z) - An Uncertainty-Driven GCN Refinement Strategy for Organ Segmentation [53.425900196763756]
本研究では,不確実性解析とグラフ畳み込みネットワークに基づくセグメンテーション改善手法を提案する。
半教師付きグラフ学習問題を定式化するために、特定の入力ボリュームにおける畳み込みネットワークの不確実性レベルを用いる。
本手法は膵臓で1%,脾臓で2%向上し,最先端のCRF改善法よりも優れていた。
論文 参考訳(メタデータ) (2020-12-06T18:55:07Z) - Volumetric Medical Image Segmentation: A 3D Deep Coarse-to-fine
Framework and Its Adversarial Examples [74.92488215859991]
本稿では,これらの課題に効果的に取り組むために,新しい3Dベースの粗粒度フレームワークを提案する。
提案した3Dベースのフレームワークは、3つの軸すべてに沿ってリッチな空間情報を活用できるため、2Dよりも大きなマージンで優れている。
我々は,3つのデータセット,NIH膵データセット,JHMI膵データセット,JHMI病理嚢胞データセットについて実験を行った。
論文 参考訳(メタデータ) (2020-10-29T15:39:19Z) - DONet: Dual Objective Networks for Skin Lesion Segmentation [77.9806410198298]
本稿では,皮膚病変のセグメンテーションを改善するために,Dual Objective Networks (DONet) という,シンプルで効果的なフレームワークを提案する。
我々のDONetは2つの対称デコーダを採用し、異なる目標に近づくための異なる予測を生成する。
皮膚内視鏡画像における多種多様な病変のスケールと形状の課題に対処するために,再帰的コンテキスト符号化モジュール(RCEM)を提案する。
論文 参考訳(メタデータ) (2020-08-19T06:02:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。