Fugu-MT 論文翻訳(概要): BRAU-Net++: U-Shaped Hybrid CNN-Transformer Network for Medical Image Segmentation

論文の概要: BRAU-Net++: U-Shaped Hybrid CNN-Transformer Network for Medical Image Segmentation

arxiv url: http://arxiv.org/abs/2401.00722v1
Date: Mon, 1 Jan 2024 10:49:09 GMT
ステータス: 翻訳完了
システム内更新日: 2024-01-03 16:09:25.864726
Title: BRAU-Net++: U-Shaped Hybrid CNN-Transformer Network for Medical Image Segmentation
Title（参考訳）: BRAU-Net++:医療画像分割のためのU字型ハイブリッドCNN-Transformer Network
Authors: Libin Lan, Pengzhou Cai, Lu Jiang, Xiaojuan Liu, Yongmei Li, and Yudong Zhang
Abstract要約: 医用画像の正確な分割作業のために,BRAU-Net++ というハイブリッドで効果的な CNN-Transformer ネットワークを提案する。具体的には、BRAU-Net++は、U字型エンコーダデコーダ構造を設計するために、コアビルディングブロックとしてバイレベルルーティングアテンションを使用する。提案手法は,そのベースラインであるBRAU-Netを含む,最先端の手法を超越した手法である。
参考スコア（独自算出の注目度）: 11.986549780782724
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Accurate medical image segmentation is essential for clinical quantification, disease diagnosis, treatment planning and many other applications. Both convolution-based and transformer-based u-shaped architectures have made significant success in various medical image segmentation tasks. The former can efficiently learn local information of images while requiring much more image-specific inductive biases inherent to convolution operation. The latter can effectively capture long-range dependency at different feature scales using self-attention, whereas it typically encounters the challenges of quadratic compute and memory requirements with sequence length increasing. To address this problem, through integrating the merits of these two paradigms in a well-designed u-shaped architecture, we propose a hybrid yet effective CNN-Transformer network, named BRAU-Net++, for an accurate medical image segmentation task. Specifically, BRAU-Net++ uses bi-level routing attention as the core building block to design our u-shaped encoder-decoder structure, in which both encoder and decoder are hierarchically constructed, so as to learn global semantic information while reducing computational complexity. Furthermore, this network restructures skip connection by incorporating channel-spatial attention which adopts convolution operations, aiming to minimize local spatial information loss and amplify global dimension-interaction of multi-scale features. Extensive experiments on three public benchmark datasets demonstrate that our proposed approach surpasses other state-of-the-art methods including its baseline: BRAU-Net under almost all evaluation metrics. We achieve the average Dice-Similarity Coefficient (DSC) of 82.47, 90.10, and 92.94 on Synapse multi-organ segmentation, ISIC-2018 Challenge, and CVC-ClinicDB, as well as the mIoU of 84.01 and 88.17 on ISIC-2018 Challenge and CVC-ClinicDB, respectively.
Abstract（参考訳）: 正確な医用画像分割は臨床定量化、疾患診断、治療計画など多くの応用に不可欠である。畳み込みベースとトランスフォーマーベースの両方のu字型アーキテクチャは、様々な医療画像セグメンテーションタスクで大きな成功を収めている。前者は、畳み込み操作固有の画像固有の帰納バイアスを多く必要としながら、画像の局所的な情報を効率的に学習することができる。後者は、自己アテンションを使用して異なる機能スケールでの長距離依存性を効果的にキャプチャするが、典型的には、シーケンス長が増加する2次計算とメモリ要求の課題に直面する。この問題に対処するために,この2つのパラダイムの利点をu字型アーキテクチャに組み込むことにより,医療画像の正確な分割作業のために,blu-net++ というハイブリッドかつ効果的な cnn-transformer network を提案する。特にbrau-net++では,u字型エンコーダ-デコーダ構造の設計に,u字型エンコーダ-デコーダ構造の設計において,計算複雑性を低減しつつ,グローバルな意味情報を学ぶために,双方向のルーティングを基本ブロックとして使用しています。さらに、畳み込み操作を取り入れ、局所的な空間的情報損失を最小化し、マルチスケール特徴のグローバル次元相互作用を増幅することにより、スキップ接続を再構築する。 3つのベンチマークデータセットに関する広範な実験は、提案手法がベースラインを含む他の最先端手法を上回っていることを示している。我々は,Synapse Multi-organ segmentation,ISIC-2018 Challenge,CVC-ClinicDBの平均Dice-Similarity Coefficient 82.47,90.10,92.94,およびISIC-2018 Challenge,CVC-ClinicDBのmIoU 84.01,88.17をそれぞれ達成した。

関連論文リスト

Rethinking Boundary Detection in Deep Learning-Based Medical Image Segmentation [29.37619692272332]
本稿では、畳み込みニューラルネットワーク(CNN)モデル、ビジョントランスフォーマー(ViT)モデル、明示的なエッジ検出演算子を組み合わせた、CTOという新しいネットワークアーキテクチャを提案する。 CTOはセグメンテーションの精度で既存のメソッドを超え、精度と効率のバランスを良くする。 7つの挑戦的な医用画像セグメンテーションデータセットで実施した広範な実験を通じて、CTOのパフォーマンスを検証する。
論文参考訳（メタデータ） (2025-05-06T19:42:56Z)
QTSeg: A Query Token-Based Dual-Mix Attention Framework with Multi-Level Feature Distribution for Medical Image Segmentation [13.359001333361272]
医用画像のセグメンテーションは、正確な診断と自動診断プロセスの実現を医療専門家に支援する上で重要な役割を担っている。従来の畳み込みニューラルネットワーク(CNN)は、長い範囲の依存関係をキャプチャするのに苦労することが多い。近年の取り組みはCNNとトランスフォーマーを組み合わせて性能と効率のバランスをとることに重点を置いているが、既存の手法は計算コストを低く抑えながら高いセグメンテーション精度を達成するという課題に直面している。ローカルおよびグローバルな情報を効果的に統合する医療画像セグメンテーションのための新しいアーキテクチャであるQTSegを提案する。
論文参考訳（メタデータ） (2024-12-23T03:22:44Z)
BEFUnet: A Hybrid CNN-Transformer Architecture for Precise Medical Image Segmentation [0.0]
本稿では,医療画像の正確な分割のために,身体情報とエッジ情報の融合を強化するBEFUnetという,革新的なU字型ネットワークを提案する。 BEFUnetは、新しいローカル・クロス・アテンション・フィーチャー(LCAF)融合モジュール、新しいダブル・レベル・フュージョン(DLF)モジュール、デュアルブランチ・エンコーダの3つの主要モジュールから構成されている。 LCAFモジュールは、2つのモダリティの間に空間的に近接する特徴に対して、局所的な相互注意を選択的に行うことにより、エッジとボディの特徴を効率よく融合させる。
論文参考訳（メタデータ） (2024-02-13T21:03:36Z)
ParaTransCNN: Parallelized TransCNN Encoder for Medical Image Segmentation [7.955518153976858]
本稿では,畳み込みニューラルネットワークとトランスフォーマーアーキテクチャを組み合わせた2次元特徴抽出手法を提案する。特に小臓器では, セグメンテーションの精度が向上した。
論文参考訳（メタデータ） (2024-01-27T05:58:36Z)
Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文参考訳（メタデータ） (2023-12-26T12:56:31Z)
M$^{2}$SNet: Multi-scale in Multi-scale Subtraction Network for Medical Image Segmentation [73.10707675345253]
医用画像から多様なセグメンテーションを仕上げるマルチスケールサブトラクションネットワーク(M$2$SNet)を提案する。本手法は,4つの異なる医用画像セグメンテーションタスクの11つのデータセットに対して,異なる評価基準の下で,ほとんどの最先端手法に対して好意的に機能する。
論文参考訳（メタデータ） (2023-03-20T06:26:49Z)
UNETR++: Delving into Efficient and Accurate 3D Medical Image Segmentation [93.88170217725805]
本稿では,高画質なセグメンテーションマスクと,パラメータ,計算コスト,推論速度の両面での効率性を提供するUNETR++という3次元医用画像セグメンテーション手法を提案する。我々の設計の核となるのは、空間的およびチャネル的な識別的特徴を効率的に学習する、新しい効率的な対注意ブロック(EPA)の導入である。 Synapse, BTCV, ACDC, BRaTs, Decathlon-Lungの5つのベンチマークで評価した結果, 効率と精度の両面で, コントリビューションの有効性が示された。
論文参考訳（メタデータ） (2022-12-08T18:59:57Z)
BCS-Net: Boundary, Context and Semantic for Automatic COVID-19 Lung Infection Segmentation from CT Images [83.82141604007899]
BCS-Netは、CT画像から自動的に新型コロナウイルスの肺感染症を分離するための新しいネットワークである。 BCS-Netはエンコーダ-デコーダアーキテクチャに従っており、多くの設計はデコーダのステージに焦点を当てている。 BCSRブロックでは、アテンション誘導グローバルコンテキスト(AGGC)モジュールがデコーダの最も価値のあるエンコーダ機能を学ぶように設計されている。
論文参考訳（メタデータ） (2022-07-17T08:54:07Z)
Two-Stream Graph Convolutional Network for Intra-oral Scanner Image Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。 TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文参考訳（メタデータ） (2022-04-19T10:41:09Z)
TransUNet: Transformers Make Strong Encoders for Medical Image Segmentation [78.01570371790669]
医用画像のセグメンテーションは医療システムの開発に必須の前提条件である。様々な医療画像セグメンテーションタスクにおいて、U-Netとして知られるu字型アーキテクチャがデファクトスタンダードとなっている。医用画像セグメンテーションの強力な代替手段として,トランスフォーマーとU-Netの両方を有効活用するTransUNetを提案する。
論文参考訳（メタデータ） (2021-02-08T16:10:50Z)
Multi-level Context Gating of Embedded Collective Knowledge for Medical Image Segmentation [32.96604621259756]
医用画像分割のためのU-Netの拡張を提案する。 U-Net, Squeeze and Excitation (SE) block, bi-directional ConvLSTM (BConvLSTM), and the mechanism of dense convolutions。提案モデルは6つのデータセットで評価される。
論文参考訳（メタデータ） (2020-03-10T12:29:59Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。