論文の概要: SCRNet: Spatial-Channel Regulation Network for Medical Ultrasound Image Segmentation
- arxiv url: http://arxiv.org/abs/2508.13899v1
- Date: Tue, 19 Aug 2025 15:02:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-20 15:36:31.971573
- Title: SCRNet: Spatial-Channel Regulation Network for Medical Ultrasound Image Segmentation
- Title(参考訳): 医用超音波画像分割のための空間チャネル制御ネットワークSCRNet
- Authors: Weixin Xu, Ziliang Wang,
- Abstract要約: CNNベースのメソッドは長距離依存を無視する傾向があり、Transformerベースのメソッドはローカルなコンテキスト情報を見落としてしまう。
本稿では,前層から2つの入力特徴を処理するために設計された新しい特徴集約モジュール(FAM)を提案する。
この戦略により、モジュールは長距離依存とローカルコンテキスト情報の両方に同時に集中することができます。
- 参考スコア(独自算出の注目度): 1.4930126157970809
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Medical ultrasound image segmentation presents a formidable challenge in the realm of computer vision. Traditional approaches rely on Convolutional Neural Networks (CNNs) and Transformer-based methods to address the intricacies of medical image segmentation. Nevertheless, inherent limitations persist, as CNN-based methods tend to disregard long-range dependencies, while Transformer-based methods may overlook local contextual information. To address these deficiencies, we propose a novel Feature Aggregation Module (FAM) designed to process two input features from the preceding layer. These features are seamlessly directed into two branches of the Convolution and Cross-Attention Parallel Module (CCAPM) to endow them with different roles in each of the two branches to help establish a strong connection between the two input features. This strategy enables our module to focus concurrently on both long-range dependencies and local contextual information by judiciously merging convolution operations with cross-attention mechanisms. Moreover, by integrating FAM within our proposed Spatial-Channel Regulation Module (SCRM), the ability to discern salient regions and informative features warranting increased attention is enhanced. Furthermore, by incorporating the SCRM into the encoder block of the UNet architecture, we introduce a novel framework dubbed Spatial-Channel Regulation Network (SCRNet). The results of our extensive experiments demonstrate the superiority of SCRNet, which consistently achieves state-of-the-art (SOTA) performance compared to existing methods.
- Abstract(参考訳): 医用超音波画像のセグメンテーションは、コンピュータビジョンの領域において深刻な課題となる。
従来のアプローチは、医療画像セグメンテーションの複雑さに対処するために、畳み込みニューラルネットワーク(CNN)とトランスフォーマーベースの手法に依存していた。
それにもかかわらず、CNNベースのメソッドは長距離依存を無視する傾向があり、Transformerベースのメソッドはローカルなコンテキスト情報を見落としてしまう。
これらの欠陥に対処するために,前層から2つの入力特徴を処理するために設計された新しい特徴集約モジュール (FAM) を提案する。
これらの機能は、CCAPM(Convolution and Cross-Attention Parallel Module)の2つのブランチにシームレスに向けられ、それぞれのブランチで異なる役割を担い、2つの入力機能間の強い接続を確立するのに役立ちます。
この戦略により,コンボリューション操作とクロスアテンション機構を和らげることで,長期的依存関係と局所的コンテキスト情報の両方に同時に集中することが可能となる。
さらに、提案する空間チャネル制御モジュール(SCRM)にFAMを統合することにより、より注意を喚起する有能な地域と情報的特徴を識別する能力が向上する。
さらに、SCRMをUNetアーキテクチャのエンコーダブロックに組み込むことで、SCRNet(Spatial-Channel Regulation Network)と呼ばれる新しいフレームワークを導入する。
SCRNetは従来手法に比べて常にSOTA(State-of-the-art)性能を達成している。
関連論文リスト
- GCRPNet: Graph-Enhanced Contextual and Regional Perception Network For Salient Object Detection in Optical Remote Sensing Images [60.296124001189646]
本稿では,GCRPNet(Graph-enhanced contextual and Regional Recognition Network)を提案する。
これはMambaアーキテクチャの上に構築され、長距離依存関係を同時にキャプチャし、地域的特徴表現を強化する。
マルチスケールの畳み込みによって処理される特徴マップに対して適応的なパッチスキャンを行い、リッチなローカル領域情報をキャプチャする。
論文 参考訳(メタデータ) (2025-08-14T11:31:43Z) - Unleashing Vision Foundation Models for Coronary Artery Segmentation: Parallel ViT-CNN Encoding and Variational Fusion [12.839049648094893]
冠動脈セグメンテーションは冠動脈疾患(CAD)のコンピュータ診断に重要である
並列符号化アーキテクチャを用いて,視覚基盤モデル(VFM)のパワーを利用する新しいフレームワークを提案する。
提案手法は, 精度の高い冠動脈セグメンテーションにおいて, 最先端の手法よりも優れ, 優れた性能を発揮する。
論文 参考訳(メタデータ) (2025-07-17T09:25:00Z) - CENet: Context Enhancement Network for Medical Image Segmentation [3.4690322157094573]
本稿では,2つの重要なイノベーションを特徴とする新しいセグメンテーションフレームワークであるCENetを提案する。
まず、スキップ接続に統合されたDual Selective Enhancement Block(DSEB)は境界の詳細を高め、コンテキスト対応で小さな臓器の検出を改善する。
第二に、デコーダのContext Feature Attention Module (CFAM)は、空間的整合性を維持し、特徴の冗長性を低減し、過剰に拡張された表現を緩和するために、マルチスケールの設計を採用している。
論文 参考訳(メタデータ) (2025-05-23T23:22:18Z) - Rethinking Boundary Detection in Deep Learning-Based Medical Image Segmentation [29.37619692272332]
本稿では、畳み込みニューラルネットワーク(CNN)モデル、ビジョントランスフォーマー(ViT)モデル、明示的なエッジ検出演算子を組み合わせた、CTOという新しいネットワークアーキテクチャを提案する。
CTOはセグメンテーションの精度で既存のメソッドを超え、精度と効率のバランスを良くする。
7つの挑戦的な医用画像セグメンテーションデータセットで実施した広範な実験を通じて、CTOのパフォーマンスを検証する。
論文 参考訳(メタデータ) (2025-05-06T19:42:56Z) - QTSeg: A Query Token-Based Dual-Mix Attention Framework with Multi-Level Feature Distribution for Medical Image Segmentation [13.359001333361272]
医用画像のセグメンテーションは、正確な診断と自動診断プロセスの実現を医療専門家に支援する上で重要な役割を担っている。
従来の畳み込みニューラルネットワーク(CNN)は、長い範囲の依存関係をキャプチャするのに苦労することが多い。
近年の取り組みはCNNとトランスフォーマーを組み合わせて性能と効率のバランスをとることに重点を置いているが、既存の手法は計算コストを低く抑えながら高いセグメンテーション精度を達成するという課題に直面している。
ローカルおよびグローバルな情報を効果的に統合する医療画像セグメンテーションのための新しいアーキテクチャであるQTSegを提案する。
論文 参考訳(メタデータ) (2024-12-23T03:22:44Z) - A Hybrid Transformer-Mamba Network for Single Image Deraining [70.64069487982916]
既存のデラリング変換器では、固定レンジウィンドウやチャネル次元に沿って自己アテンション機構を採用している。
本稿では,多分岐型トランスフォーマー・マンバネットワーク(Transformer-Mamba Network,TransMamba Network,Transformer-Mamba Network)を提案する。
論文 参考訳(メタデータ) (2024-08-31T10:03:19Z) - MSA$^2$Net: Multi-scale Adaptive Attention-guided Network for Medical Image Segmentation [8.404273502720136]
MSA$2$Netは、スキップ接続を適切に設計した新しいディープセグメンテーションフレームワークである。
本稿では,空間的特徴を選択的に強調するために,MASAG(Multi-Scale Adaptive Space Attention Gate)を提案する。
MSA$2$Netは、最先端のSOTA(State-of-the-art)よりも優れています。
論文 参考訳(メタデータ) (2024-07-31T14:41:10Z) - Full-Duplex Strategy for Video Object Segmentation [141.43983376262815]
Full- Strategy Network (FSNet)はビデオオブジェクトセグメンテーション(VOS)のための新しいフレームワークである
我々のFSNetは、融合復号ステージの前に、クロスモーダルな機能パス(すなわち、送信と受信)を同時に実行します。
我々のFSNetは、VOSとビデオの有能なオブジェクト検出タスクの両方において、他の最先端技術よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-08-06T14:50:50Z) - Cross-modal Consensus Network for Weakly Supervised Temporal Action
Localization [74.34699679568818]
時間的行動局所化 (WS-TAL) は、ビデオレベルの分類的監督によって、ビデオ内のアクションインスタンスをローカライズすることを目的とした課題である。
この問題に対処するためのクロスモーダルコンセンサスネットワーク(CO2-Net)を提案する。
論文 参考訳(メタデータ) (2021-07-27T04:21:01Z) - Cross-Modality Brain Tumor Segmentation via Bidirectional
Global-to-Local Unsupervised Domain Adaptation [61.01704175938995]
本論文では,UDAスキームに基づくBiGL(Bidirectional Global-to-Local)適応フレームワークを提案する。
具体的には、脳腫瘍をセグメント化するために、双方向画像合成およびセグメンテーションモジュールを提案する。
提案手法は, 最先端の非教師なし領域適応法を大きなマージンで上回っている。
論文 参考訳(メタデータ) (2021-05-17T10:11:45Z) - Unsupervised Bidirectional Cross-Modality Adaptation via Deeply
Synergistic Image and Feature Alignment for Medical Image Segmentation [73.84166499988443]
我々は、Synergistic Image and Feature Alignment (SIFA)と名付けられた新しい教師なしドメイン適応フレームワークを提案する。
提案するSIFAは、画像と特徴の両方の観点から、ドメインの相乗的アライメントを行う。
2つの異なるタスクに対する実験結果から,SIFA法は未ラベル対象画像のセグメンテーション性能を向上させるのに有効であることが示された。
論文 参考訳(メタデータ) (2020-02-06T13:49:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。