論文の概要: Rethinking Boundary Detection in Deep Learning-Based Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2505.04652v1
- Date: Tue, 06 May 2025 19:42:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-09 21:43:49.61294
- Title: Rethinking Boundary Detection in Deep Learning-Based Medical Image Segmentation
- Title(参考訳): 深層学習に基づく医用画像分割における境界検出の再考
- Authors: Yi Lin, Dong Zhang, Xiao Fang, Yufan Chen, Kwang-Ting Cheng, Hao Chen,
- Abstract要約: 本稿では、畳み込みニューラルネットワーク(CNN)モデル、ビジョントランスフォーマー(ViT)モデル、明示的なエッジ検出演算子を組み合わせた、CTOという新しいネットワークアーキテクチャを提案する。
CTOはセグメンテーションの精度で既存のメソッドを超え、精度と効率のバランスを良くする。
7つの挑戦的な医用画像セグメンテーションデータセットで実施した広範な実験を通じて、CTOのパフォーマンスを検証する。
- 参考スコア(独自算出の注目度): 29.37619692272332
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Medical image segmentation is a pivotal task within the realms of medical image analysis and computer vision. While current methods have shown promise in accurately segmenting major regions of interest, the precise segmentation of boundary areas remains challenging. In this study, we propose a novel network architecture named CTO, which combines Convolutional Neural Networks (CNNs), Vision Transformer (ViT) models, and explicit edge detection operators to tackle this challenge. CTO surpasses existing methods in terms of segmentation accuracy and strikes a better balance between accuracy and efficiency, without the need for additional data inputs or label injections. Specifically, CTO adheres to the canonical encoder-decoder network paradigm, with a dual-stream encoder network comprising a mainstream CNN stream for capturing local features and an auxiliary StitchViT stream for integrating long-range dependencies. Furthermore, to enhance the model's ability to learn boundary areas, we introduce a boundary-guided decoder network that employs binary boundary masks generated by dedicated edge detection operators to provide explicit guidance during the decoding process. We validate the performance of CTO through extensive experiments conducted on seven challenging medical image segmentation datasets, namely ISIC 2016, PH2, ISIC 2018, CoNIC, LiTS17, and BTCV. Our experimental results unequivocally demonstrate that CTO achieves state-of-the-art accuracy on these datasets while maintaining competitive model complexity. The codes have been released at: https://github.com/xiaofang007/CTO.
- Abstract(参考訳): 医用画像のセグメンテーションは、医用画像分析とコンピュータビジョンの領域における重要な課題である。
現在の方法では、主要な関心領域を正確に区分けすることが約束されているが、境界領域の正確な区分けは依然として困難である。
本研究では,この課題に対処するために,畳み込みニューラルネットワーク(CNN)モデル,ビジョントランスフォーマー(ViT)モデル,明示的なエッジ検出演算子を組み合わせた新しいネットワークアーキテクチャであるCTOを提案する。
CTOはセグメンテーションの精度で既存のメソッドを超え、データインプットやラベルインジェクションを必要とせずに、精度と効率のバランスを改善する。
具体的には、CTOは標準的なエンコーダ-デコーダネットワークパラダイムに準拠しており、ローカル機能をキャプチャするメインストリームのCNNストリームと、長距離依存関係を統合するための補助的なStitchViTストリームで構成されるデュアルストリームエンコーダネットワークを備えている。
さらに、モデルが境界領域を学習する能力を高めるために、専用エッジ検出演算子によって生成されたバイナリ境界マスクを用いて、デコード処理中に明示的なガイダンスを提供する境界誘導デコーダネットワークを導入する。
我々は、ISIC 2016、PH2、ISIC 2018、CoNIC、LiTS17、BTCVという、挑戦的な医療画像セグメンテーションデータセット7つの実験を通じて、CTOのパフォーマンスを検証する。
実験の結果は、CTOが競合モデルの複雑さを維持しながら、これらのデータセットの最先端の精度を実現していることを示している。
コードは、https://github.com/xiaofang007/CTOでリリースされた。
関連論文リスト
- BRAU-Net++: U-Shaped Hybrid CNN-Transformer Network for Medical Image Segmentation [11.986549780782724]
医用画像の正確な分割作業のために,BRAU-Net++ というハイブリッドで効果的な CNN-Transformer ネットワークを提案する。
具体的には、BRAU-Net++は、U字型エンコーダデコーダ構造を設計するために、コアビルディングブロックとしてバイレベルルーティングアテンションを使用する。
提案手法は,そのベースラインであるBRAU-Netを含む,最先端の手法を超越した手法である。
論文 参考訳(メタデータ) (2024-01-01T10:49:09Z) - Feature Enhancer Segmentation Network (FES-Net) for Vessel Segmentation [19.455350961592742]
本稿では,画像強調ステップを必要とせずに正確な画素分割を実現する機能拡張セグメンテーションネットワーク(FES-Net)を提案する。
FES-Netは入力画像を直接処理し、ダウンサンプリング中に4つのプロンプト畳み込みブロック(PCB)を利用する。
DRIVE, STARE, CHASE, HRFの4つの公開技術データセット上でのFES-Netの性能を評価する。
論文 参考訳(メタデータ) (2023-09-07T07:46:46Z) - Rethinking Boundary Detection in Deep Learning Models for Medical Image
Segmentation [27.322629156662547]
Convolution, Transformer, Operator (CTO) と呼ばれる新しいネットワークアーキテクチャを提案する。
CTOは、高い認識精度を達成するために、畳み込みニューラルネットワーク(CNN)、ビジョントランスフォーマー(ViT)、および明示的な境界検出演算子を組み合わせている。
提案手法の性能を6つの挑戦的医用画像セグメンテーションデータセットで評価した。
論文 参考訳(メタデータ) (2023-05-01T06:13:08Z) - Focused Decoding Enables 3D Anatomical Detection by Transformers [64.36530874341666]
集束デコーダと呼ばれる3次元解剖学的構造検出のための新しい検出変換器を提案する。
Focused Decoderは、解剖学的領域のアトラスからの情報を活用して、クエリアンカーを同時にデプロイし、クロスアテンションの視野を制限する。
提案手法を利用可能な2つのCTデータセットに対して評価し、フォーカスドデコーダが強力な検出結果を提供するだけでなく、大量の注釈付きデータの必要性を軽減し、注意重みによる結果の例外的で直感的な説明性を示すことを示した。
論文 参考訳(メタデータ) (2022-07-21T22:17:21Z) - BCS-Net: Boundary, Context and Semantic for Automatic COVID-19 Lung
Infection Segmentation from CT Images [83.82141604007899]
BCS-Netは、CT画像から自動的に新型コロナウイルスの肺感染症を分離するための新しいネットワークである。
BCS-Netはエンコーダ-デコーダアーキテクチャに従っており、多くの設計はデコーダのステージに焦点を当てている。
BCSRブロックでは、アテンション誘導グローバルコンテキスト(AGGC)モジュールがデコーダの最も価値のあるエンコーダ機能を学ぶように設計されている。
論文 参考訳(メタデータ) (2022-07-17T08:54:07Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - InDuDoNet+: A Model-Driven Interpretable Dual Domain Network for Metal
Artifact Reduction in CT Images [53.4351366246531]
InDuDoNet+と呼ばれる新しい解釈可能な二重ドメインネットワークを構築し、CT画像の微細な埋め込みを行う。
異なる組織間のCT値を分析し,InDuDoNet+の事前観測ネットワークにマージすることで,その一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2021-12-23T15:52:37Z) - TransUNet: Transformers Make Strong Encoders for Medical Image
Segmentation [78.01570371790669]
医用画像のセグメンテーションは医療システムの開発に必須の前提条件である。
様々な医療画像セグメンテーションタスクにおいて、U-Netとして知られるu字型アーキテクチャがデファクトスタンダードとなっている。
医用画像セグメンテーションの強力な代替手段として,トランスフォーマーとU-Netの両方を有効活用するTransUNetを提案する。
論文 参考訳(メタデータ) (2021-02-08T16:10:50Z) - An Uncertainty-Driven GCN Refinement Strategy for Organ Segmentation [53.425900196763756]
本研究では,不確実性解析とグラフ畳み込みネットワークに基づくセグメンテーション改善手法を提案する。
半教師付きグラフ学習問題を定式化するために、特定の入力ボリュームにおける畳み込みネットワークの不確実性レベルを用いる。
本手法は膵臓で1%,脾臓で2%向上し,最先端のCRF改善法よりも優れていた。
論文 参考訳(メタデータ) (2020-12-06T18:55:07Z) - Boundary-aware Context Neural Network for Medical Image Segmentation [15.585851505721433]
医用画像のセグメンテーションは、さらなる臨床分析と疾患診断のための信頼性の高い基盤を提供することができる。
既存のCNNベースのほとんどの手法は、正確なオブジェクト境界のない不満足なセグメンテーションマスクを生成する。
本稿では,2次元医用画像分割のための境界認識コンテキストニューラルネットワーク(BA-Net)を定式化する。
論文 参考訳(メタデータ) (2020-05-03T02:35:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。