論文の概要: D-TrAttUnet: Toward Hybrid CNN-Transformer Architecture for Generic and Subtle Segmentation in Medical Images
- arxiv url: http://arxiv.org/abs/2405.04169v1
- Date: Tue, 7 May 2024 10:09:41 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-08 14:29:58.659845
- Title: D-TrAttUnet: Toward Hybrid CNN-Transformer Architecture for Generic and Subtle Segmentation in Medical Images
- Title(参考訳): D-TrAttUnet: 医用画像におけるジェネリックおよびサブトルセグメンテーションのためのハイブリッドCNN変換器アーキテクチャを目指して
- Authors: Fares Bougourzi, Fadi Dornaika, Cosimo Distante, Abdelmalik Taleb-Ahmed,
- Abstract要約: D-TrAttUnetアーキテクチャは、異なる疾患がしばしば特定の臓器をターゲットにしているという観察に基づいている。
我々のアーキテクチャは、複合CNNエンコーダとデュアルデコーダを備えたエンコーダ・デコーダ構造を含む。
アプローチを検証するため,Covid-19および骨転移セグメンテーションタスクの評価を行った。
- 参考スコア(独自算出の注目度): 18.087365906278013
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Over the past two decades, machine analysis of medical imaging has advanced rapidly, opening up significant potential for several important medical applications. As complicated diseases increase and the number of cases rises, the role of machine-based imaging analysis has become indispensable. It serves as both a tool and an assistant to medical experts, providing valuable insights and guidance. A particularly challenging task in this area is lesion segmentation, a task that is challenging even for experienced radiologists. The complexity of this task highlights the urgent need for robust machine learning approaches to support medical staff. In response, we present our novel solution: the D-TrAttUnet architecture. This framework is based on the observation that different diseases often target specific organs. Our architecture includes an encoder-decoder structure with a composite Transformer-CNN encoder and dual decoders. The encoder includes two paths: the Transformer path and the Encoders Fusion Module path. The Dual-Decoder configuration uses two identical decoders, each with attention gates. This allows the model to simultaneously segment lesions and organs and integrate their segmentation losses. To validate our approach, we performed evaluations on the Covid-19 and Bone Metastasis segmentation tasks. We also investigated the adaptability of the model by testing it without the second decoder in the segmentation of glands and nuclei. The results confirmed the superiority of our approach, especially in Covid-19 infections and the segmentation of bone metastases. In addition, the hybrid encoder showed exceptional performance in the segmentation of glands and nuclei, solidifying its role in modern medical image analysis.
- Abstract(参考訳): 過去20年間で、医療画像の機械分析は急速に進歩し、いくつかの重要な医療応用の可能性を秘めている。
複雑な疾患の増加と症例数の増加に伴い、マシンベース画像解析の役割は欠かせないものとなっている。
医療専門家のツールとアシスタントとして機能し、貴重な洞察とガイダンスを提供する。
この領域で特に困難な課題は病変の分節であり、経験豊富な放射線技師にとっても難しい課題である。
このタスクの複雑さは、医療スタッフをサポートするための堅牢な機械学習アプローチの緊急の必要性を強調している。
そこで本研究では,D-TrAttUnetアーキテクチャを提案する。
この枠組みは、異なる疾患がしばしば特定の臓器を標的とするという観察に基づいている。
我々のアーキテクチャは、複合トランスフォーマー-CNNエンコーダとデュアルデコーダを備えたエンコーダ-デコーダ構造を含む。
エンコーダには、TransformerパスとEncoders Fusion Moduleパスの2つのパスが含まれている。
Dual-Decoder構成は2つの同一のデコーダを使用しており、それぞれにアテンションゲートがある。
これにより、モデルが病変と臓器を同時に分節し、その分節損失を統合することができる。
アプローチを検証するため,Covid-19および骨転移セグメンテーションタスクの評価を行った。
また,腺と核のセグメンテーションにおいて,第2デコーダを使わずに,モデルの適応性についても検討した。
その結果,Covid-19感染や骨転移の分節化など,アプローチの優位性が確認された。
さらに、ハイブリッドエンコーダは、腺と核のセグメンテーションにおいて例外的な性能を示し、現代の医用画像解析においてその役割を固めた。
関連論文リスト
- Rethinking Attention Gated with Hybrid Dual Pyramid Transformer-CNN for Generalized Segmentation in Medical Imaging [17.07490339960335]
本稿では,強力なCNN-Transformerエンコーダを効率的に構築するためのハイブリッドCNN-Transformerセグメンテーションアーキテクチャ(PAG-TransYnet)を提案する。
我々のアプローチは、デュアルピラミッドハイブリッドエンコーダ内のアテンションゲートを利用する。
論文 参考訳(メタデータ) (2024-04-28T14:37:10Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - G-CASCADE: Efficient Cascaded Graph Convolutional Decoding for 2D
Medical Image Segmentation [8.550528610846456]
我々は、新しいグラフ畳み込みに基づくデコーダ、すなわちカスケードグラフ畳み込みアテンションデコーダ(G-CASCADE)を提案する。
G-CASCADEは、効率的なグラフ畳み込みブロックを持つ階層変換器エンコーダによって生成される多段特徴写像を徐々に洗練する。
我々のデコーダは他の階層エンコーダと簡単に使用でき、汎用的セマンティックおよび医用画像セグメンテーションタスクに利用できる。
論文 参考訳(メタデータ) (2023-10-24T20:41:04Z) - 3D TransUNet: Advancing Medical Image Segmentation through Vision
Transformers [40.21263511313524]
医療画像のセグメンテーションは、疾患診断と治療計画のための医療システムの発展に重要な役割を担っている。
U-Netとして知られるU字型アーキテクチャは、様々な医療画像セグメンテーションタスクで高い成功を収めている。
これらの制限に対処するため、研究者たちはトランスフォーマー(Transformer)に転換した。
論文 参考訳(メタデータ) (2023-10-11T18:07:19Z) - Dilated-UNet: A Fast and Accurate Medical Image Segmentation Approach
using a Dilated Transformer and U-Net Architecture [0.6445605125467572]
本稿では,Dilated-UNetについて紹介する。Dilated-UNetはDilated TransformerブロックとU-Netアーキテクチャを組み合わせることで,高精度かつ高速な医用画像セグメンテーションを実現する。
実験の結果,Dilated-UNetはいくつかの挑戦的な医用画像セグメンテーションデータセットにおいて,他のモデルよりも優れていた。
論文 参考訳(メタデータ) (2023-04-22T17:20:13Z) - D-TrAttUnet: Dual-Decoder Transformer-Based Attention Unet Architecture
for Binary and Multi-classes Covid-19 Infection Segmentation [18.231677739397977]
我々はCTスライスからのCovid-19感染症分離のためのTransformer-CNNベースの新しいアプローチを提案する。
Transformer-CNNエンコーダはTransformerレイヤ、UpResBlocks、ResBlocks、max-poolingレイヤを使って構築されている。
The proposed D-TrAttUnet architecture is evaluate for both Binary and Multi-classes Covid-19 infection segmentation。
論文 参考訳(メタデータ) (2023-03-27T20:05:09Z) - Self-Supervised Correction Learning for Semi-Supervised Biomedical Image
Segmentation [84.58210297703714]
半教師付きバイオメディカルイメージセグメンテーションのための自己教師付き補正学習パラダイムを提案する。
共有エンコーダと2つの独立デコーダを含むデュアルタスクネットワークを設計する。
異なるタスクのための3つの医用画像分割データセットの実験により,本手法の優れた性能が示された。
論文 参考訳(メタデータ) (2023-01-12T08:19:46Z) - Learning from partially labeled data for multi-organ and tumor
segmentation [102.55303521877933]
本稿では,トランスフォーマーに基づく動的オンデマンドネットワーク(TransDoDNet)を提案する。
動的ヘッドにより、ネットワークは複数のセグメンテーションタスクを柔軟に達成することができる。
我々はMOTSと呼ばれる大規模にラベル付けされたMulti-Organ and tumorベンチマークを作成し、他の競合相手よりもTransDoDNetの方が優れた性能を示す。
論文 参考訳(メタデータ) (2022-11-13T13:03:09Z) - Focused Decoding Enables 3D Anatomical Detection by Transformers [64.36530874341666]
集束デコーダと呼ばれる3次元解剖学的構造検出のための新しい検出変換器を提案する。
Focused Decoderは、解剖学的領域のアトラスからの情報を活用して、クエリアンカーを同時にデプロイし、クロスアテンションの視野を制限する。
提案手法を利用可能な2つのCTデータセットに対して評価し、フォーカスドデコーダが強力な検出結果を提供するだけでなく、大量の注釈付きデータの必要性を軽減し、注意重みによる結果の例外的で直感的な説明性を示すことを示した。
論文 参考訳(メタデータ) (2022-07-21T22:17:21Z) - Crosslink-Net: Double-branch Encoder Segmentation Network via Fusing
Vertical and Horizontal Convolutions [58.71117402626524]
医用画像分割のための新しいダブルブランチエンコーダアーキテクチャを提案する。
1)正方形畳み込みカーネルによる特徴の識別をさらに改善する必要があるため,非正方形および水平畳み込みカーネルの利用を提案する。
実験では,4つのデータセット上でのモデルの有効性を検証した。
論文 参考訳(メタデータ) (2021-07-24T02:58:32Z) - TransUNet: Transformers Make Strong Encoders for Medical Image
Segmentation [78.01570371790669]
医用画像のセグメンテーションは医療システムの開発に必須の前提条件である。
様々な医療画像セグメンテーションタスクにおいて、U-Netとして知られるu字型アーキテクチャがデファクトスタンダードとなっている。
医用画像セグメンテーションの強力な代替手段として,トランスフォーマーとU-Netの両方を有効活用するTransUNetを提案する。
論文 参考訳(メタデータ) (2021-02-08T16:10:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。