論文の概要: Benchmarking CNN-based Models against Transformer-based Models for Abdominal Multi-Organ Segmentation on the RATIC Dataset
- arxiv url: http://arxiv.org/abs/2603.18616v1
- Date: Thu, 19 Mar 2026 08:35:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-20 17:19:06.035485
- Title: Benchmarking CNN-based Models against Transformer-based Models for Abdominal Multi-Organ Segmentation on the RATIC Dataset
- Title(参考訳): RATICデータセットを用いた腹腔多臓器分割のためのCNNモデルと変圧器モデルとのベンチマーク
- Authors: Lukas Bayer, Sheethal Bhat, Andreas Maier,
- Abstract要約: 腹部CT検査における多臓器分画は, 診断・治療に不可欠である。
トランスフォーマーベースのアーキテクチャは、長距離依存関係をモデル化する能力により、最近注目を集めている。
本研究では,UNETR,SwinUNETR,UNETR++の3つのハイブリッドトランスフォーマーベースモデルと,強力なCNNベースラインであるSegResNetを比較検討した。
- 参考スコア(独自算出の注目度): 3.428885759047836
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate multi-organ segmentation in abdominal CT scans is essential for computer-aided diagnosis and treatment. While convolutional neural networks (CNNs) have long been the standard approach in medical image segmentation, transformer-based architectures have recently gained attention due to their ability to model long-range dependencies. In this study, we systematically benchmark the three hybrid transformer-based models UNETR, SwinUNETR, and UNETR++ against a strong CNN baseline, SegResNet, for volumetric multi-organ segmentation on the heterogeneous RATIC dataset. The dataset comprises 206 annotated CT scans from 23 institutions worldwide, covering five abdominal organs. All models were trained and evaluated under identical preprocessing and training conditions using the Dice Similarity Coefficient (DSC) as the primary metric. The results show that the CNN-based SegResNet achieves the highest overall performance, outperforming all hybrid transformer-based models across all organs. Among the transformer-based approaches, UNETR++ delivers the most competitive results, while UNETR demonstrates notably faster convergence with fewer training iterations. These findings suggest that, for small- to medium-sized heterogeneous datasets, well-optimized CNN architectures remain highly competitive and may outperform hybrid transformer-based designs.
- Abstract(参考訳): 腹部CT検査における精度の高い多臓器分画は,コンピュータ支援による診断と治療に不可欠である。
畳み込みニューラルネットワーク(CNN)は長い間、医療画像セグメンテーションの標準的なアプローチであったが、トランスフォーマーベースのアーキテクチャは、長距離依存をモデル化する能力によって、最近注目を集めている。
本研究では,UNETR,SwinUNETR,UNETR++の3つのハイブリッドトランスフォーマーモデルと,強力なCNNベースラインであるSegResNetとを,ヘテロジニアスRATICデータセット上のボリューム多臓器セグメンテーションのために,系統的にベンチマークする。
このデータセットは、世界中の23の機関から206の注釈付きCTスキャンで作成され、5つの腹部臓器をカバーしている。
全てのモデルは、Dice similarity Coefficient (DSC) を主指標として、同じ前処理および訓練条件下で訓練され評価された。
その結果、CNNベースのSegResNetは、全臓器にわたるハイブリッドトランスフォーマーベースモデルよりも高いパフォーマンスを実現していることがわかった。
トランスフォーマーベースのアプローチの中で、UNETR++は最も競争力のある結果をもたらす。
これらの結果は、小型から中規模の異種データセットの場合、最適化されたCNNアーキテクチャは競争力が高く、ハイブリッドトランスフォーマーベースの設計よりも優れていることを示唆している。
関連論文リスト
- When CNNs Outperform Transformers and Mambas: Revisiting Deep Architectures for Dental Caries Segmentation [9.108764893521526]
コンボリューションニューラルネットワーク,ビジョントランスフォーマー,および状態空間のマンバアーキテクチャを,DC1000データセットによるパノラマX線写真による自動歯列セグメンテーションのために,初めて包括的なベンチマークを行った。
その結果、CNNベースのDoubleU-Netは、複雑な注意に基づくアーキテクチャの傾向とは対照的に、最も高いダイス係数は0.7345、mIoUは0.5978、精度は0.8145となり、全ての変圧器やマンバの変圧器よりも優れていることがわかった。
論文 参考訳(メタデータ) (2025-11-18T19:16:21Z) - When Swin Transformer Meets KANs: An Improved Transformer Architecture for Medical Image Segmentation [10.656996937993199]
我々は,有理機能に基づくKAN(Kolmogorov-Arnold Networks)をSwin Transformerエンコーダに統合したU-NetライクアーキテクチャであるUKASTを紹介する。
UKASTは、4つの異なる2Dおよび3D医療画像セグメンテーションベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-11-06T05:44:57Z) - CNN-Transformer Rectified Collaborative Learning for Medical Image Segmentation [60.08541107831459]
本稿では,医用画像セグメンテーションのための強力なCNNベースモデルとトランスフォーマーベースモデルを学習するための,CNN-Transformer修正協調学習フレームワークを提案する。
具体的には,学生ソフトラベルの誤り領域を適応的に選択・修正する基礎的真理を取り入れた修正ロジット・ワイド・コラボレーティブ・ラーニング(RLCL)戦略を提案する。
また,機能空間におけるCNNベースモデルとTransformerベースモデル間の効果的な知識伝達を実現するために,クラス認識型特徴量協調学習(CFCL)戦略を提案する。
論文 参考訳(メタデータ) (2024-08-25T01:27:35Z) - Deep models for stroke segmentation: do complex architectures always perform better? [1.4651272514940197]
ストロークセグメンテーションは脳卒中患者の診断と治療において重要な役割を担っている。
一般的な医用画像分割のためのディープモデルが導入された。
本研究では,最近提案された4種類の深部モデルを選択し,脳卒中セグメンテーションの性能評価を行った。
論文 参考訳(メタデータ) (2024-03-25T20:44:01Z) - Affine-Consistent Transformer for Multi-Class Cell Nuclei Detection [76.11864242047074]
本稿では, 原子核位置を直接生成する新しいアフィン一貫性変換器 (AC-Former) を提案する。
本稿では,AAT (Adaptive Affine Transformer) モジュールを導入し,ローカルネットワークトレーニングのためのオリジナル画像をワープするための重要な空間変換を自動学習する。
実験結果から,提案手法は様々なベンチマークにおいて既存の最先端アルゴリズムを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2023-10-22T02:27:02Z) - nnFormer: Interleaved Transformer for Volumetric Segmentation [50.10441845967601]
本稿では,自己意図と畳み込みを実証的に組み合わせた,インターリーブアーキテクチャを備えた強力なセグメンテーションモデルであるnnFormerを紹介する。
nnFormerは、SynapseとACDCの2つの一般的なデータセットで、以前のTransformerベースのメソッドよりも大幅に改善されている。
論文 参考訳(メタデータ) (2021-09-07T17:08:24Z) - Spherical coordinates transformation pre-processing in Deep Convolution
Neural Networks for brain tumor segmentation in MRI [0.0]
深層畳み込みニューラルネットワーク(DCNN)は、最近非常に有望な結果を示している。
DCNNモデルは、優れたパフォーマンスを達成するために、大きな注釈付きデータセットが必要です。
本研究では,DCNNモデルの精度を向上させるために3次元球面座標変換を仮定した。
論文 参考訳(メタデータ) (2020-08-17T05:11:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。