論文の概要: ATM-Net: Anatomy-Aware Text-Guided Multi-Modal Fusion for Fine-Grained Lumbar Spine Segmentation
- arxiv url: http://arxiv.org/abs/2504.03476v1
- Date: Fri, 04 Apr 2025 14:36:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-07 14:48:06.310342
- Title: ATM-Net: Anatomy-Aware Text-Guided Multi-Modal Fusion for Fine-Grained Lumbar Spine Segmentation
- Title(参考訳): ATM-Net:細粒化腰椎椎間板分割のための解剖学的テキストガイド型マルチモーダルフュージョン
- Authors: Sheng Lian, Dengfeng Pan, Jianlong Cai, Guang-Yong Chen, Zhun Zhong, Zhiming Luo, Shen Zhao, Shuo Li,
- Abstract要約: ATM-Netは, 解剖学的, テキスト誘導, マルチモーダル融合機構を用いて, 腰椎部分構造のきめ細かなセグメンテーションを行う, 革新的なフレームワークである。
ATM-Net は SPIDER の 9.91 ピクセルの 79.39% と HD95 を達成し、競合する SpineParseNet をそれぞれ 8.31% と 4.14 ピクセルで上回っている。
- 参考スコア(独自算出の注目度): 38.04249138515548
- License:
- Abstract: Accurate lumbar spine segmentation is crucial for diagnosing spinal disorders. Existing methods typically use coarse-grained segmentation strategies that lack the fine detail needed for precise diagnosis. Additionally, their reliance on visual-only models hinders the capture of anatomical semantics, leading to misclassified categories and poor segmentation details. To address these limitations, we present ATM-Net, an innovative framework that employs an anatomy-aware, text-guided, multi-modal fusion mechanism for fine-grained segmentation of lumbar substructures, i.e., vertebrae (VBs), intervertebral discs (IDs), and spinal canal (SC). ATM-Net adopts the Anatomy-aware Text Prompt Generator (ATPG) to adaptively convert image annotations into anatomy-aware prompts in different views. These insights are further integrated with image features via the Holistic Anatomy-aware Semantic Fusion (HASF) module, building a comprehensive anatomical context. The Channel-wise Contrastive Anatomy-Aware Enhancement (CCAE) module further enhances class discrimination and refines segmentation through class-wise channel-level multi-modal contrastive learning. Extensive experiments on the MRSpineSeg and SPIDER datasets demonstrate that ATM-Net significantly outperforms state-of-the-art methods, with consistent improvements regarding class discrimination and segmentation details. For example, ATM-Net achieves Dice of 79.39% and HD95 of 9.91 pixels on SPIDER, outperforming the competitive SpineParseNet by 8.31% and 4.14 pixels, respectively.
- Abstract(参考訳): 脊椎疾患の診断には, 正確な腰椎椎間板分割術が重要である。
既存の手法では、精密な診断に必要な細部を欠いた粗粒化戦略を用いるのが一般的である。
さらに、視覚のみのモデルへの依存は解剖学的意味論の獲得を妨げるため、分類の誤りやセグメンテーションの細部が不明確になる。
このような制約に対処するため, ATM-Netは解剖学的, テキスト誘導, マルチモーダル融合機構を応用し, 脊椎(VB), 椎間板(ID), 脊椎(SC)の細粒化を図った。
ATM-Net は Anatomy-aware Text Prompt Generator (ATPG) を採用し、画像アノテーションを異なるビューで anatomy-aware プロンプトに適応的に変換する。
これらの洞察は、包括的な解剖学的コンテキストを構築するために、ホロスティック解剖学的に認識されたセマンティックフュージョン(HASF)モジュールを介して、イメージ機能とさらに統合される。
Channel-wise Contrastive Anatomy-Aware Enhancement (CCAE)モジュールは、クラス識別をさらに強化し、クラスレベルのマルチモーダルコントラスト学習を通じてセグメンテーションを洗練する。
MRSpineSegとSPIDERデータセットの大規模な実験により、ATM-Netは最先端の手法よりも優れており、クラス識別やセグメンテーションの詳細に関して一貫した改善がなされている。
例えば、ATM-Net は SPIDER の 9.91 ピクセルの 79.39% と HD95 を達成し、競合する SpineParseNet をそれぞれ 8.31%、HD95 を 4.14 ピクセルで上回っている。
関連論文リスト
- MGFI-Net: A Multi-Grained Feature Integration Network for Enhanced Medical Image Segmentation [0.3108011671896571]
医用画像のセグメンテーションにおける大きな課題は、ノイズ、低コントラスト、複雑な解剖学的構造の存在に対する関心領域の正確な記述を実現することである。
既存のセグメンテーションモデルは、多粒度情報の統合を無視し、エッジの詳細を保存できないことが多い。
我々は,Multi-Grained Feature Integration Network (MGFI-Net)と呼ばれる新しい画像セマンティックセマンティクスモデルを提案する。
私たちのMGFI-Netは、これらの問題に対処するための2つの専用のモジュールで設計されています。
論文 参考訳(メタデータ) (2025-02-19T15:24:34Z) - SMAFormer: Synergistic Multi-Attention Transformer for Medical Image Segmentation [28.490211130600702]
SMAFormerはトランスフォーマーをベースとしたアーキテクチャで,腫瘍や臓器のセグメンテーションを強化するために複数の注意機構を融合する。
SMAFormerは、医療画像セグメンテーションのローカル機能とグローバル機能の両方をキャプチャできる。
われわれは多臓器,肝腫瘍,膀胱腫瘍の分節化など,様々な医療画像の分節化作業について広範な実験を行い,その結果を得た。
論文 参考訳(メタデータ) (2024-08-31T04:23:33Z) - Teaching AI the Anatomy Behind the Scan: Addressing Anatomical Flaws in Medical Image Segmentation with Learnable Prior [34.54360931760496]
臓器の数、形状、相対的な位置などの重要な解剖学的特徴は、堅牢な多臓器分割モデルの構築に不可欠である。
我々は Anatomy-Informed Network (AIC-Net) と呼ばれる新しいアーキテクチャを導入する。
AIC-Netは、患者固有の解剖学に適応できる「解剖学的事前」と呼ばれる学習可能な入力を組み込んでいる。
論文 参考訳(メタデータ) (2024-03-27T10:46:24Z) - M3BUNet: Mobile Mean Max UNet for Pancreas Segmentation on CT-Scans [25.636974007788986]
我々は,M3BUNetを提案する。M3BUNetはMobileNetとU-Netニューラルネットワークの融合で,2段階に分けて膵CT像を段階的に分割する,新しい平均値(MM)アテンションを備える。
細かなセグメンテーションの段階では、ウェーブレット分解フィルタを用いてマルチインプット画像を作成することにより、膵のセグメンテーション性能が向上することがわかった。
提案手法は,最大89.53%のDice similarity Coefficient(DSC)値と最大81.16のIntersection Over Union(IOU)スコアをNIH pancreasデータセットで達成する。
論文 参考訳(メタデータ) (2024-01-18T23:10:08Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - Scale-aware Super-resolution Network with Dual Affinity Learning for
Lesion Segmentation from Medical Images [50.76668288066681]
低解像度医用画像から様々な大きさの病変を適応的に分割する,スケールアウェアな超解像ネットワークを提案する。
提案するネットワークは,他の最先端手法と比較して一貫した改善を実現した。
論文 参考訳(メタデータ) (2023-05-30T14:25:55Z) - Implicit Anatomical Rendering for Medical Image Segmentation with
Stochastic Experts [11.007092387379078]
医用画像セグメンテーションの学習を支援するために,解剖学的レベルで設計された汎用的な暗黙的ニューラルネットワークレンダリングフレームワークであるMORSEを提案する。
医用画像のセグメンテーションをエンドツーエンドのレンダリング問題として定式化する。
実験の結果,MORSEは異なる医療セグメントのバックボーンでうまく機能することが示された。
論文 参考訳(メタデータ) (2023-04-06T16:44:03Z) - Self-Supervised Correction Learning for Semi-Supervised Biomedical Image
Segmentation [84.58210297703714]
半教師付きバイオメディカルイメージセグメンテーションのための自己教師付き補正学習パラダイムを提案する。
共有エンコーダと2つの独立デコーダを含むデュアルタスクネットワークを設計する。
異なるタスクのための3つの医用画像分割データセットの実験により,本手法の優れた性能が示された。
論文 参考訳(メタデータ) (2023-01-12T08:19:46Z) - Reliable Joint Segmentation of Retinal Edema Lesions in OCT Images [55.83984261827332]
本稿では,信頼性の高いマルチスケールウェーブレットエンハンストランスネットワークを提案する。
本研究では,ウェーブレット型特徴抽出器ネットワークとマルチスケール変圧器モジュールを統合したセグメンテーションバックボーンを開発した。
提案手法は,他の最先端セグメンテーション手法と比較して信頼性の高いセグメンテーション精度を実現する。
論文 参考訳(メタデータ) (2022-12-01T07:32:56Z) - Few-shot Medical Image Segmentation using a Global Correlation Network
with Discriminative Embedding [60.89561661441736]
医療画像分割のための新しい手法を提案する。
深層畳み込みネットワークを用いた数ショット画像セグメンタを構築します。
深層埋め込みの識別性を高め,同一クラスの特徴領域のクラスタリングを促進する。
論文 参考訳(メタデータ) (2020-12-10T04:01:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。