論文の概要: Medical Image Segmentation Using Advanced Unet: VMSE-Unet and VM-Unet CBAM+
- arxiv url: http://arxiv.org/abs/2507.00511v1
- Date: Tue, 01 Jul 2025 07:27:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-03 14:22:59.46352
- Title: Medical Image Segmentation Using Advanced Unet: VMSE-Unet and VM-Unet CBAM+
- Title(参考訳): VMSE-Unet と VM-Unet CBAM+ を用いた医用画像分割
- Authors: Sayandeep Kanrar, Raja Piyush, Qaiser Razi, Debanshi Chakraborty, Vikas Hassija, GSS Chalapathi,
- Abstract要約: 医用画像のセグメンテーションを強化するために,VMSE U-Net と VM-Unet CBAM+ モデルを提案する。
我々のアプローチは、従来のVM U-NetフレームワークにSqueeze-and-Excitation(SE)とConvolutional Block Attention Module(CBAM)技術を統合する。
どちらのモデルも、複数のデータセットにわたるベースラインVM-Unetよりも優れたパフォーマンスを示している。
- 参考スコア(独自算出の注目度): 1.1056622446799464
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we present the VMSE U-Net and VM-Unet CBAM+ model, two cutting-edge deep learning architectures designed to enhance medical image segmentation. Our approach integrates Squeeze-and-Excitation (SE) and Convolutional Block Attention Module (CBAM) techniques into the traditional VM U-Net framework, significantly improving segmentation accuracy, feature localization, and computational efficiency. Both models show superior performance compared to the baseline VM-Unet across multiple datasets. Notably, VMSEUnet achieves the highest accuracy, IoU, precision, and recall while maintaining low loss values. It also exhibits exceptional computational efficiency with faster inference times and lower memory usage on both GPU and CPU. Overall, the study suggests that the enhanced architecture VMSE-Unet is a valuable tool for medical image analysis. These findings highlight its potential for real-world clinical applications, emphasizing the importance of further research to optimize accuracy, robustness, and computational efficiency.
- Abstract(参考訳): 本稿では,VMSE U-NetとVM-Unet CBAM+モデルについて述べる。
提案手法では,Squeeze-and-Excitation (SE) と Convolutional Block Attention Module (CBAM) を従来の VM U-Net フレームワークに統合し,セグメンテーション精度,特徴ローカライゼーション,計算効率を大幅に向上させる。
どちらのモデルも、複数のデータセットにわたるベースラインVM-Unetよりも優れたパフォーマンスを示している。
特に、VMSEUnetは、低損失値を維持しながら、最高精度、IoU、精度、リコールを達成する。
また、GPUとCPUの両方で高速な推論時間とメモリ使用量の削減による計算効率も素晴らしい。
全体として、拡張アーキテクチャVMSE-Unetは医療画像解析に有用なツールであることが示唆されている。
これらの知見は、実際の臨床応用の可能性を強調し、精度、堅牢性、計算効率を最適化するさらなる研究の重要性を強調した。
関連論文リスト
- CIM-NET: A Video Denoising Deep Neural Network Model Optimized for Computing-in-Memory Architectures [4.1888033476195226]
CIMチップはメモリセルに統合することで、有望なソリューションを提供する。
既存のDNNモデルはCIMアーキテクチャの制約を考慮せずに設計されることが多い。
本稿では,2つのイノベーションを取り入れたハードウェア・アルゴリズム協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-23T02:26:56Z) - DyMU: Dynamic Merging and Virtual Unmerging for Efficient VLMs [124.52164183968145]
視覚言語モデル(VLM)の計算負担を軽減する,効率的なトレーニング不要なフレームワークであるDyMUを提案する。
まず、動的トークンマージ(DToMe)は、画像の複雑さに基づいて類似のトークンをマージすることで、視覚トークンの埋め込み数を削減します。
第二に、仮想トークンアンマージ(VTU)は、大きな言語モデル(LLM)の期待トークンシーケンスを、フルシーケンスの注意ダイナミクスを効率的に再構築することでシミュレートする。
論文 参考訳(メタデータ) (2025-04-23T18:38:18Z) - Granular Ball Twin Support Vector Machine with Universum Data [4.573310303307945]
大学データを用いた新しいグラニュラーボールツインサポートベクトルマシン(GBU-TSVM)を提案する。
提案したGBU-TSVMは,データインスタンスを特徴空間のポイントではなく,ハイパーボールとして表現する。
データポイントをグラニュラーボールにグループ化することにより、計算効率の向上、耐雑音性の向上、解釈可能性の向上を実現している。
論文 参考訳(メタデータ) (2024-12-04T15:02:28Z) - Improved Unet brain tumor image segmentation based on GSConv module and ECA attention mechanism [0.0]
U-Netアーキテクチャに基づく深層学習アルゴリズムである脳腫瘍に対する医用画像分割法の改良モデルについて述べる。
従来のU-Netに基づいて,医療画像分割作業におけるモデルの性能向上を目的としたGSConvモジュールとECAアテンション機構を導入する。
論文 参考訳(メタデータ) (2024-09-20T16:35:19Z) - PIM-Opt: Demystifying Distributed Optimization Algorithms on a Real-World Processing-In-Memory System [21.09681871279162]
大規模データセットに対するモダン機械学習(ML)トレーニングは、時間を要する作業量である。
最適化アルゴリズムであるGradient Descent (SGD) は、その効率性、単純さ、一般化性能に頼っている。
プロセッサ中心のアーキテクチャは、MLトレーニングワークロードの実行中に低パフォーマンスと高エネルギー消費に悩まされる。
Processing-In-Memory(PIM)は、データ移動のボトルネックを軽減するための有望なソリューションである。
論文 参考訳(メタデータ) (2024-04-10T17:00:04Z) - Vision Mamba: Efficient Visual Representation Learning with Bidirectional State Space Model [48.233300343211205]
We propose a new generic vision backbone with bidirectional Mamba block (Vim)。
Vimは画像列を位置埋め込みでマークし、視覚表現を双方向の状態空間モデルで圧縮する。
その結果,高解像度画像に対するTransformerスタイルの理解において,Vimは計算とメモリの制約を克服できることがわかった。
論文 参考訳(メタデータ) (2024-01-17T18:56:18Z) - A Heterogeneous In-Memory Computing Cluster For Flexible End-to-End
Inference of Real-World Deep Neural Networks [12.361842554233558]
最新のTinyMLタスクを小さなバッテリに制約されたIoTデバイスにデプロイするには、高い計算エネルギー効率が必要である。
非揮発性メモリ(NVM)を使用したアナログメモリコンピューティング(IMC)は、ディープニューラルネットワーク(DNN)推論の大幅な効率向上を実現する。
8つのRISC-Vコア、インメモリ・コンピューティング・アクセラレータ(IMA)、デジタル・アクセラレータを統合した異種密結合アーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-01-04T11:12:01Z) - KiU-Net: Towards Accurate Segmentation of Biomedical Images using
Over-complete Representations [59.65174244047216]
本稿では,高次元にデータを投影するオーバーコンプリートアーキテクチャ(Ki-Net)を提案する。
このネットワークは、U-Netで拡張されると、小さな解剖学的ランドマークを分割する場合に大幅に改善される。
早期新生児の2次元超音波による脳解剖学的セグメント化の課題について検討した。
論文 参考訳(メタデータ) (2020-06-08T18:59:24Z) - On Coresets for Support Vector Machines [61.928187390362176]
coresetは、元のデータポイントの小さな、代表的なサブセットである。
我々は,本アルゴリズムを用いて,既製のSVMソルバをストリーミング,分散,動的データ設定に適用可能であることを示す。
論文 参考訳(メタデータ) (2020-02-15T23:25:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。