論文の概要: MOSAIC: A Multi-View 2.5D Organ Slice Selector with Cross-Attentional Reasoning for Anatomically-Aware CT Localization in Medical Organ Segmentation
- arxiv url: http://arxiv.org/abs/2505.10672v1
- Date: Thu, 15 May 2025 19:32:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-19 14:36:13.472527
- Title: MOSAIC: A Multi-View 2.5D Organ Slice Selector with Cross-Attentional Reasoning for Anatomically-Aware CT Localization in Medical Organ Segmentation
- Title(参考訳): MOSAIC : 解剖学的CT像定位のための多視点2.5D臓器スライスセレクタ
- Authors: Hania Ghouse, Muzammil Behzad,
- Abstract要約: 既存の3Dセグメンテーションアプローチは計算的かつメモリ集約的であり、多くの場合、多くの解剖学的に無関係なスライスを含む全ボリュームを処理する。
セグメント化に先立って入力量を削減できる新しい解剖学的スライスセレクタパイプラインを提案する。
提案モデルでは, 構造的関連性の高いスライスを選択的に保持する多視点表現を前提として, 解剖学的局所化の「専門家」として機能する。
- 参考スコア(独自算出の注目度): 0.8747606955991707
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Efficient and accurate multi-organ segmentation from abdominal CT volumes is a fundamental challenge in medical image analysis. Existing 3D segmentation approaches are computationally and memory intensive, often processing entire volumes that contain many anatomically irrelevant slices. Meanwhile, 2D methods suffer from class imbalance and lack cross-view contextual awareness. To address these limitations, we propose a novel, anatomically-aware slice selector pipeline that reduces input volume prior to segmentation. Our unified framework introduces a vision-language model (VLM) for cross-view organ presence detection using fused tri-slice (2.5D) representations from axial, sagittal, and coronal planes. Our proposed model acts as an "expert" in anatomical localization, reasoning over multi-view representations to selectively retain slices with high structural relevance. This enables spatially consistent filtering across orientations while preserving contextual cues. More importantly, since standard segmentation metrics such as Dice or IoU fail to measure the spatial precision of such slice selection, we introduce a novel metric, Slice Localization Concordance (SLC), which jointly captures anatomical coverage and spatial alignment with organ-centric reference slices. Unlike segmentation-specific metrics, SLC provides a model-agnostic evaluation of localization fidelity. Our model offers substantial improvement gains against several baselines across all organs, demonstrating both accurate and reliable organ-focused slice filtering. These results show that our method enables efficient and spatially consistent organ filtering, thereby significantly reducing downstream segmentation cost while maintaining high anatomical fidelity.
- Abstract(参考訳): 腹部CTボリュームからの高効率かつ高精度な多臓器分画は,医用画像解析の基本的な課題である。
既存の3Dセグメンテーションアプローチは計算的かつメモリ集約的であり、多くの場合、多くの解剖学的に無関係なスライスを含む全ボリュームを処理する。
一方、2D手法はクラス不均衡に悩まされ、コンテキスト間の認識が欠如している。
これらの制約に対処するため,セグメント化前の入力量を削減できる新しい解剖学的スライスセレクタパイプラインを提案する。
統合された枠組みでは, 軸, 矢状面, コロナ面からの融合三分割(2.5D)表現を用いた臓器位置検出のための視覚言語モデル(VLM)を導入している。
提案モデルでは, 構造的関連性の高いスライスを選択的に保持する多視点表現を前提として, 解剖学的局所化の「専門家」として機能する。
これにより、コンテキストキューを保持しながら、向きをまたいだ空間的に一貫したフィルタリングが可能になる。
さらに,Dice や IoU などの標準的なセグメンテーション指標では,このようなスライス選択の空間的精度を測ることができないため,解剖学的カバレッジと臓器中心の参照スライスとの空間的アライメントを併用した新しいメトリクス Slice Localization Concordance (SLC) を導入する。
セグメンテーション固有のメトリクスとは異なり、SLCは局所化の忠実度をモデルに依存しない評価を提供する。
本モデルでは, 臓器のスライスフィルタリングの精度と信頼性を両立させ, 全臓器にまたがるいくつかのベースラインに対して, 大幅な改善が期待できる。
これらの結果から,本手法は効率よく空間的に整合した臓器フィルタリングを可能にし,解剖学的忠実度を維持しつつ下流の分節コストを著しく低減できることがわかった。
関連論文リスト
- A Continual Learning-driven Model for Accurate and Generalizable Segmentation of Clinically Comprehensive and Fine-grained Whole-body Anatomies in CT [67.34586036959793]
完全に注釈付きCTデータセットは存在せず、すべての解剖学がトレーニングのために記述されている。
完全解剖を分割できる連続学習駆動CTモデルを提案する。
単体CT分割モデルCL-Netは, 臨床的に包括的に包括的に235個の粒状体解剖の集合を高精度に分割することができる。
論文 参考訳(メタデータ) (2025-03-16T23:55:02Z) - GASA-UNet: Global Axial Self-Attention U-Net for 3D Medical Image Segmentation [8.939740171704388]
本稿では,GTA(Global Axial Self-Attention)ブロックを特徴とする改良されたU-Net型モデルを提案する。
このブロックは、異なる解剖学的断面を表す各2次元平面で、画像データを3次元実体として処理する。
我々のモデルは,特に小解剖学的構造に対して,セグメンテーション性能の有望な改善を証明した。
論文 参考訳(メタデータ) (2024-09-20T01:23:53Z) - CT-based brain ventricle segmentation via diffusion Schrödinger Bridge without target domain ground truths [0.9720086191214947]
クリニカルCTスキャンによる高効率かつ正確な脳室分画は、腹腔鏡下手術のような緊急手術には不可欠である。
我々は,CTセグメント化の真偽を必要とせず,新しい不確実性に留意した心室分画法を導入する。
提案手法では拡散型Schr"odinger Bridgeと残像U-Netを併用し,画像診断とMRI検査を併用した。
論文 参考訳(メタデータ) (2024-05-28T15:17:58Z) - Teaching AI the Anatomy Behind the Scan: Addressing Anatomical Flaws in Medical Image Segmentation with Learnable Prior [34.54360931760496]
臓器の数、形状、相対的な位置などの重要な解剖学的特徴は、堅牢な多臓器分割モデルの構築に不可欠である。
我々は Anatomy-Informed Network (AIC-Net) と呼ばれる新しいアーキテクチャを導入する。
AIC-Netは、患者固有の解剖学に適応できる「解剖学的事前」と呼ばれる学習可能な入力を組み込んでいる。
論文 参考訳(メタデータ) (2024-03-27T10:46:24Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - Accurate Fine-Grained Segmentation of Human Anatomy in Radiographs via
Volumetric Pseudo-Labeling [66.75096111651062]
我々は,10,021個の胸部CTと157個のラベルの大規模データセットを作成した。
解剖学的擬似ラベル抽出のために3次元解剖分類モデルのアンサンブルを適用した。
得られたセグメンテーションモデルはCXRで顕著な性能を示した。
論文 参考訳(メタデータ) (2023-06-06T18:01:08Z) - Med-Query: Steerable Parsing of 9-DoF Medical Anatomies with Query Embedding [14.901279446640393]
我々は,CTスキャンにおける解剖の検出,識別,セグメント化のための,安定かつ堅牢で効率的な計算フレームワークを提案する。
解剖学の複雑な形状、大きさ、配向を考えると、完全な3次元空間における9自由度(9-DoF)のポーズ推定解が提示される。
胸骨,脊椎,腹部臓器の3つの画像解析作業について,本法の有効性を検証した。
論文 参考訳(メタデータ) (2022-12-05T04:04:21Z) - Multi-organ Segmentation Network with Adversarial Performance Validator [10.775440368500416]
本稿では,2次元から3次元のセグメンテーションフレームワークに対向的な性能検証ネットワークを導入する。
提案したネットワークは, 2次元粗い結果から3次元高品質なセグメンテーションマスクへの変換を行い, 共同最適化によりセグメンテーション精度が向上する。
NIH膵分節データセットの実験では、提案したネットワークが小臓器分節の最先端の精度を達成し、過去の最高性能を上回った。
論文 参考訳(メタデータ) (2022-04-16T18:00:29Z) - A unified 3D framework for Organs at Risk Localization and Segmentation
for Radiation Therapy Planning [56.52933974838905]
現在の医療ワークフローは、OAR(Organs-at-risk)のマニュアル記述を必要とする
本研究は,OARローカライゼーション・セグメンテーションのための統合された3Dパイプラインの導入を目的とする。
提案手法は医用画像に固有の3Dコンテキスト情報の活用を可能にする。
論文 参考訳(メタデータ) (2022-03-01T17:08:41Z) - Rethinking the Extraction and Interaction of Multi-Scale Features for
Vessel Segmentation [53.187152856583396]
網膜血管と主要動脈を2次元基底画像と3次元CTアンギオグラフィー(CTA)スキャンで分割する,PC-Netと呼ばれる新しいディープラーニングモデルを提案する。
PC-Netでは、ピラミッド圧縮励起(PSE)モジュールが各畳み込みブロックに空間情報を導入し、より効果的なマルチスケール特徴を抽出する能力を高めている。
論文 参考訳(メタデータ) (2020-10-09T08:22:54Z) - Deep Reinforcement Learning for Organ Localization in CT [59.23083161858951]
我々はCTにおける臓器局所化のための深層強化学習手法を提案する。
この研究において、人工エージェントは、その主張や誤りから学習することで、CT内の臓器の局所化を積極的に行う。
本手法は,任意の臓器をローカライズするためのプラグイン・アンド・プレイモジュールとして利用できる。
論文 参考訳(メタデータ) (2020-05-11T10:06:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。