論文の概要: Automated MRI Tumor Segmentation using hybrid U-Net with Transformer and Efficient Attention
- arxiv url: http://arxiv.org/abs/2506.15562v1
- Date: Wed, 18 Jun 2025 15:36:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-19 19:35:51.720016
- Title: Automated MRI Tumor Segmentation using hybrid U-Net with Transformer and Efficient Attention
- Title(参考訳): TransformerとEfficient Attentionを併用したハイブリッドU-Netを用いたMRI腫瘍郭清
- Authors: Syed Haider Ali, Asrar Ahmad, Muhammad Ali, Asifullah Khan, Muhammad Shahban, Nadeem Shaukat,
- Abstract要約: 癌は異常な増殖であり、局所的に浸潤し、遠くの臓器に転移する可能性がある。
最近のAIベースのセグメンテーションモデルは一般的に、大規模な公開データセットでトレーニングされている。
本研究は,AI腫瘍セグメンテーションモデルを病院ソフトウェアに直接組み込んで,効率的な腫瘍治療計画と実施を行う。
- 参考スコア(独自算出の注目度): 0.7037008937757392
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cancer is an abnormal growth with potential to invade locally and metastasize to distant organs. Accurate auto-segmentation of the tumor and surrounding normal tissues is required for radiotherapy treatment plan optimization. Recent AI-based segmentation models are generally trained on large public datasets, which lack the heterogeneity of local patient populations. While these studies advance AI-based medical image segmentation, research on local datasets is necessary to develop and integrate AI tumor segmentation models directly into hospital software for efficient and accurate oncology treatment planning and execution. This study enhances tumor segmentation using computationally efficient hybrid UNet-Transformer models on magnetic resonance imaging (MRI) datasets acquired from a local hospital under strict privacy protection. We developed a robust data pipeline for seamless DICOM extraction and preprocessing, followed by extensive image augmentation to ensure model generalization across diverse clinical settings, resulting in a total dataset of 6080 images for training. Our novel architecture integrates UNet-based convolutional neural networks with a transformer bottleneck and complementary attention modules, including efficient attention, Squeeze-and-Excitation (SE) blocks, Convolutional Block Attention Module (CBAM), and ResNeXt blocks. To accelerate convergence and reduce computational demands, we used a maximum batch size of 8 and initialized the encoder with pretrained ImageNet weights, training the model on dual NVIDIA T4 GPUs via checkpointing to overcome Kaggle's runtime limits. Quantitative evaluation on the local MRI dataset yielded a Dice similarity coefficient of 0.764 and an Intersection over Union (IoU) of 0.736, demonstrating competitive performance despite limited data and underscoring the importance of site-specific model development for clinical deployment.
- Abstract(参考訳): 癌は異常な増殖であり、局所的に浸潤し、遠くの臓器に転移する可能性がある。
放射線治療計画の最適化には腫瘍とその周囲の正常組織を正確に自動分離する必要がある。
最近のAIベースのセグメンテーションモデルは一般に、局所的な患者集団の不均一性に欠ける大規模な公開データセットに基づいて訓練されている。
これらの研究は、AIベースの医用画像セグメンテーションを進展させる一方、局所データセットの研究は、AI腫瘍セグメンテーションモデルを病院のソフトウェアに直接組み込んで、効率的に正確な腫瘍治療計画と実行を行うために必要である。
本研究は, 厳密なプライバシ保護の下で, 局所病院から取得したMRIデータセットを用いた, 計算効率の良いハイブリッドUNet-Transformerモデルを用いた腫瘍セグメンテーションを強化する。
シームレスなDICOM抽出と前処理のためのロバストなデータパイプラインを開発し、さらに様々な臨床環境におけるモデルの一般化を保証するため、広範囲な画像拡張を行い、結果としてトレーニング用6080イメージのデータセットが得られた。
我々の新しいアーキテクチャは、UNetベースの畳み込みニューラルネットワークとトランスフォーマーのボトルネックと補完的な注意モジュールを統合し、効率的な注意、Squeeze-and-Excitation(SE)ブロック、CBAM(Convolutional Block Attention Module)ブロック、ResNeXtブロックを含む。
コンバージェンスを高速化し,計算要求を低減するために,最大バッチサイズ8を使用し,事前トレーニングしたImageNet重み付きエンコーダを初期化し,チェックポインティングにより2台のNVIDIA T4 GPU上でモデルをトレーニングし,Kaggleのランタイム限界を克服した。
局所MRIデータセットの定量的評価により、Dice類似度係数は0.764、Intersection over Union(IoU)は0.736となり、限られたデータにもかかわらず競争性能を示し、臨床展開においてサイト固有のモデル開発の重要性が強調された。
関連論文リスト
- Machine-agnostic Automated Lumbar MRI Segmentation using a Cascaded Model Based on Generative Neurons [0.22198209072577352]
MRI画像から腰椎椎間板と椎間板を分離する新しい機械診断手法を提案する。
12のスキャナーと34の被験者の画像からなるユニークなデータセットを、戦略的前処理とデータ拡張技術によって強化した。
本モデルとDenseNet121エンコーダの併用により, 腰椎椎間板断面積が83.66%, 感度が91.44%, Dice similarity Coefficient (DSC) が91.03%, 腰椎椎間板断面積が良好であった。
論文 参考訳(メタデータ) (2024-11-23T21:34:29Z) - Towards a Benchmark for Colorectal Cancer Segmentation in Endorectal Ultrasound Videos: Dataset and Model Development [59.74920439478643]
本稿では,多様なERUSシナリオをカバーする最初のベンチマークデータセットを収集し,注釈付けする。
ERUS-10Kデータセットは77の動画と10,000の高解像度アノテートフレームで構成されています。
本稿では,ASTR (Adaptive Sparse-context TRansformer) という大腸癌セグメンテーションのベンチマークモデルを提案する。
論文 参考訳(メタデータ) (2024-08-19T15:04:42Z) - Prototype Learning Guided Hybrid Network for Breast Tumor Segmentation in DCE-MRI [58.809276442508256]
本稿では,畳み込みニューラルネットワーク(CNN)とトランスフォーマー層を組み合わせたハイブリッドネットワークを提案する。
プライベートおよびパブリックなDCE-MRIデータセットの実験結果から,提案したハイブリッドネットワークは最先端の手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-08-11T15:46:00Z) - LATUP-Net: A Lightweight 3D Attention U-Net with Parallel Convolutions for Brain Tumor Segmentation [7.1789008189318455]
LATUP-Netは、並列畳み込みを備えた軽量な3DアテンションU-Netである。
高いセグメンテーション性能を維持しつつ、計算要求を大幅に削減するように設計されている。
BraTS 2020データセットの平均Diceスコアは88.41%、83.82%、73.67%であり、BraTS 2021データセットでは、それぞれ90.29%、89.54%、83.92%である。
論文 参考訳(メタデータ) (2024-04-09T00:05:45Z) - CAFCT-Net: A CNN-Transformer Hybrid Network with Contextual and Attentional Feature Fusion for Liver Tumor Segmentation [3.8952128960495638]
肝腫瘍分節化のためのコンテクスト・アテンショナル機能FusionsEnhanced Convolutional Network (CNN) と Transformer Hybrid Network (CAFCT-Net) を提案する。
実験の結果,提案モデルの平均断面積は76.54%,Dice係数は84.29%であった。
論文 参考訳(メタデータ) (2024-01-30T10:42:11Z) - Leveraging Frequency Domain Learning in 3D Vessel Segmentation [50.54833091336862]
本研究では,Fourier領域学習を3次元階層分割モデルにおけるマルチスケール畳み込みカーネルの代用として活用する。
管状血管分割作業において,新しいネットワークは顕著なサイス性能(ASACA500が84.37%,ImageCASが80.32%)を示した。
論文 参考訳(メタデータ) (2024-01-11T19:07:58Z) - Breast Ultrasound Tumor Classification Using a Hybrid Multitask
CNN-Transformer Network [63.845552349914186]
胸部超音波(BUS)画像分類において,グローバルな文脈情報の収集が重要な役割を担っている。
ビジョントランスフォーマーは、グローバルなコンテキスト情報をキャプチャする能力が改善されているが、トークン化操作によって局所的なイメージパターンを歪めてしまう可能性がある。
本研究では,BUS腫瘍分類とセグメンテーションを行うハイブリッドマルチタスクディープニューラルネットワークであるHybrid-MT-ESTANを提案する。
論文 参考訳(メタデータ) (2023-08-04T01:19:32Z) - Integrative Imaging Informatics for Cancer Research: Workflow Automation
for Neuro-oncology (I3CR-WANO) [0.12175619840081271]
我々は,多系列ニューロオンコロジーMRIデータの集約と処理のための人工知能ベースのソリューションを提案する。
エンド・ツー・エンドのフレームワーク i) アンサンブル分類器を用いてMRIの配列を分類し, i) 再現可能な方法でデータを前処理し, iv) 腫瘍組織サブタイプを規定する。
欠落したシーケンスに対して堅牢であり、専門的なループアプローチを採用しており、セグメンテーションの結果は放射線学者によって手動で洗練される可能性がある。
論文 参考訳(メタデータ) (2022-10-06T18:23:42Z) - Negligible effect of brain MRI data preprocessing for tumor segmentation [36.89606202543839]
我々は3つの公開データセットの実験を行い、ディープニューラルネットワークにおける異なる前処理ステップの効果を評価する。
その結果、最も一般的な標準化手順は、ネットワーク性能に何の価値も与えないことが示されている。
画像の規格化に伴う信号分散の低減のため,画像強度正規化手法はモデル精度に寄与しない。
論文 参考訳(メタデータ) (2022-04-11T17:29:36Z) - EMT-NET: Efficient multitask network for computer-aided diagnosis of
breast cancer [58.720142291102135]
乳腺腫瘍の分類と分別を同時に行うための,効率的で軽量な学習アーキテクチャを提案する。
腫瘍分類ネットワークにセグメンテーションタスクを組み込むことにより,腫瘍領域に着目したバックボーンネットワークで表現を学習する。
腫瘍分類の精度、感度、特異性はそれぞれ88.6%、94.1%、85.3%である。
論文 参考訳(メタデータ) (2022-01-13T05:24:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。