論文の概要: Adaptive Transformer Attention and Multi-Scale Fusion for Spine 3D Segmentation
- arxiv url: http://arxiv.org/abs/2503.12853v1
- Date: Mon, 17 Mar 2025 06:27:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-18 12:33:47.444277
- Title: Adaptive Transformer Attention and Multi-Scale Fusion for Spine 3D Segmentation
- Title(参考訳): 3次元椎間板分割における適応型変圧器の注意とマルチスケール核融合
- Authors: Yanlin Xiang, Qingyuan He, Ting Xu, Ran Hao, Jiacheng Hu, Hanchao Zhang,
- Abstract要約: 本研究では,改良SwinUNETRに基づく脊椎の3次元セマンティックセマンティックセグメンテーション法を提案する。
本稿では, 脊椎画像の複雑な解剖構造に着目し, 特徴抽出能力を高めるため, マルチスケール融合機構を提案する。
実験結果から,3次元CNN,3次元U-Net,3次元U-Net + Transformerと比較して,本研究のモデルは大幅に改善された。
- 参考スコア(独自算出の注目度): 3.1862885335359095
- License:
- Abstract: This study proposes a 3D semantic segmentation method for the spine based on the improved SwinUNETR to improve segmentation accuracy and robustness. Aiming at the complex anatomical structure of spinal images, this paper introduces a multi-scale fusion mechanism to enhance the feature extraction capability by using information of different scales, thereby improving the recognition accuracy of the model for the target area. In addition, the introduction of the adaptive attention mechanism enables the model to dynamically adjust the attention to the key area, thereby optimizing the boundary segmentation effect. The experimental results show that compared with 3D CNN, 3D U-Net, and 3D U-Net + Transformer, the model of this study has achieved significant improvements in mIoU, mDice, and mAcc indicators, and has better segmentation performance. The ablation experiment further verifies the effectiveness of the proposed improved method, proving that multi-scale fusion and adaptive attention mechanism have a positive effect on the segmentation task. Through the visualization analysis of the inference results, the model can better restore the real anatomical structure of the spinal image. Future research can further optimize the Transformer structure and expand the data scale to improve the generalization ability of the model. This study provides an efficient solution for the task of medical image segmentation, which is of great significance to intelligent medical image analysis.
- Abstract(参考訳): 本研究では,SwinUNETRを改良したスピンの3次元セマンティックセマンティックセマンティックセマンティクス法を提案し,セマンティクスの精度と堅牢性を向上させる。
本稿では, 脊椎画像の複雑な解剖構造に着目し, 異なる規模の情報を用いて特徴抽出能力を向上し, 対象領域に対するモデルの認識精度を向上させるため, マルチスケール融合機構を提案する。
さらに、適応的注意機構の導入により、モデルがキー領域への注意を動的に調整し、境界セグメンテーション効果を最適化することができる。
実験の結果, 3D CNN, 3D U-Net, 3D U-Net + Transformerと比較すると, mIoU, mDice, mAccインジケータの精度が向上し, セグメンテーション性能が向上した。
アブレーション実験では,提案手法の有効性をさらに検証し,マルチスケール融合と適応的注意機構がセグメンテーションタスクに肯定的な効果があることを証明した。
推論結果の可視化解析により、モデルは脊髄画像の実際の解剖学的構造をよりよく復元することができる。
将来の研究は、トランスフォーマー構造をさらに最適化し、データスケールを拡張して、モデルの一般化能力を向上させることができる。
本研究は, 医用画像セグメンテーションの課題に対する効率的な解決法として, インテリジェントな医用画像解析において重要な課題である。
関連論文リスト
- Multi-Scale Transformer Architecture for Accurate Medical Image Classification [4.578375402082224]
本研究では,トランスフォーマーアーキテクチャを改良したAIによる皮膚病変分類アルゴリズムを提案する。
マルチスケールな特徴融合機構の統合と自己認識プロセスの洗練により、このモデルはグローバルな特徴とローカルな特徴の両方を効果的に抽出する。
ISIC 2017データセットのパフォーマンス評価は、改良されたTransformerが既存のAIモデルを上回ることを示している。
論文 参考訳(メタデータ) (2025-02-10T08:22:25Z) - J-CaPA : Joint Channel and Pyramid Attention Improves Medical Image Segmentation [2.503388496100123]
本稿では,Channel Attention と Pyramid Attention を併用したマルチスケール特徴抽出手法を提案する。
提案モデルでは, 複雑な解剖学的構造に対するセグメンテーション精度が向上し, 既存の最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2024-11-25T16:52:21Z) - Improved Unet brain tumor image segmentation based on GSConv module and ECA attention mechanism [0.0]
U-Netアーキテクチャに基づく深層学習アルゴリズムである脳腫瘍に対する医用画像分割法の改良モデルについて述べる。
従来のU-Netに基づいて,医療画像分割作業におけるモデルの性能向上を目的としたGSConvモジュールとECAアテンション機構を導入する。
論文 参考訳(メタデータ) (2024-09-20T16:35:19Z) - Optimizing Universal Lesion Segmentation: State Space Model-Guided Hierarchical Networks with Feature Importance Adjustment [0.0]
我々は,MAMBAフレームワークにステートスペースモデル(SSM)とアドバンスト階層ネットワーク(AHNet)を統合したMamba-Ahnetを紹介する。
Mamba-Ahnetは、SSMの特徴抽出と理解をAHNetの注意機構と画像再構成と組み合わせ、セグメンテーションの精度と堅牢性を高めることを目的としている。
論文 参考訳(メタデータ) (2024-04-26T08:15:43Z) - Deep Learning-Based Brain Image Segmentation for Automated Tumour Detection [0.0]
目的は、最先端の畳み込みニューラルネットワーク(CNN)を、セグメント化のための脳MRIスキャンの大規模なデータセットに活用することである。
提案手法は,性能向上と一般化性向上のために前処理技術を適用した。
論文 参考訳(メタデータ) (2024-04-06T15:09:49Z) - SDR-Former: A Siamese Dual-Resolution Transformer for Liver Lesion
Classification Using 3D Multi-Phase Imaging [59.78761085714715]
本研究は肝病変分類のための新しいSDR-Formerフレームワークを提案する。
提案フレームワークは2つの臨床データセットに関する総合的な実験を通じて検証された。
科学コミュニティを支援するため,肝病変解析のための多段階MRデータセットを公開しています。
論文 参考訳(メタデータ) (2024-02-27T06:32:56Z) - S^2Former-OR: Single-Stage Bi-Modal Transformer for Scene Graph Generation in OR [50.435592120607815]
外科手術のシーングラフ生成(SGG)は、手術室(OR)におけるホモロジー認知知能の増強に不可欠である
これまでの研究は主に多段階学習に依存しており、生成したセマンティックシーングラフはポーズ推定とオブジェクト検出を伴う中間プロセスに依存している。
本研究では,S2Former-OR(S2Former-OR)と呼ばれるORにおけるSGGのための新しいシングルステージバイモーダルトランスフォーマフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-22T11:40:49Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - View-Disentangled Transformer for Brain Lesion Detection [50.4918615815066]
より正確な腫瘍検出のためのMRI特徴抽出のための新しいビューディペンタングル変換器を提案する。
まず, 3次元脳スキャンにおいて, 異なる位置の長距離相関を求める。
第二に、トランスフォーマーはスライス機能のスタックを複数の2Dビューとしてモデル化し、これらの機能をビュー・バイ・ビューとして拡張する。
第三に、提案したトランスモジュールをトランスのバックボーンに展開し、脳病変を取り巻く2D領域を効果的に検出する。
論文 参考訳(メタデータ) (2022-09-20T11:58:23Z) - Revisiting 3D Context Modeling with Supervised Pre-training for
Universal Lesion Detection in CT Slices [48.85784310158493]
CTスライスにおける普遍的病変検出のための3Dコンテキスト強化2D特徴を効率的に抽出するための修飾擬似3次元特徴ピラミッドネットワーク(MP3D FPN)を提案する。
新たな事前学習手法により,提案したMP3D FPNは,DeepLesionデータセット上での最先端検出性能を実現する。
提案された3Dプリトレーニングウェイトは、他の3D医療画像分析タスクのパフォーマンスを高めるために使用できる。
論文 参考訳(メタデータ) (2020-12-16T07:11:16Z) - Unsupervised Instance Segmentation in Microscopy Images via Panoptic
Domain Adaptation and Task Re-weighting [86.33696045574692]
病理組織像における教師なし核分割のためのCycle Consistency Panoptic Domain Adaptive Mask R-CNN(CyC-PDAM)アーキテクチャを提案する。
まず,合成画像中の補助的な生成物を除去するための核塗布機構を提案する。
第二に、ドメイン識別器を持つセマンティックブランチは、パンプトレベルのドメイン適応を実現するように設計されている。
論文 参考訳(メタデータ) (2020-05-05T11:08:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。