論文の概要: MasHeNe: A Benchmark for Head and Neck CT Mass Segmentation using Window-Enhanced Mamba with Frequency-Domain Integration
- arxiv url: http://arxiv.org/abs/2512.01563v1
- Date: Mon, 01 Dec 2025 11:38:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.825602
- Title: MasHeNe: A Benchmark for Head and Neck CT Mass Segmentation using Window-Enhanced Mamba with Frequency-Domain Integration
- Title(参考訳): MasHeNe: Window-Enhanced Mamba を用いた頭部・頸部CTマスセグメンテーションのベンチマーク
- Authors: Thao Thi Phuong Dao, Tan-Cong Nguyen, Nguyen Chi Thanh, Truong Hoang Viet, Trong-Le Do, Mai-Khiem Tran, Minh-Khoi Pham, Trung-Nghia Le, Minh-Triet Tran, Thanh Dinh Le,
- Abstract要約: MasHeNeは3,779個の造影CTスライスの最初のデータセットである。
MasHeNeは、悪性度のみのデータセットを超えて、ヘッド・アンド・ネックのマスセグメンテーションのベンチマークを提供する。
- 参考スコア(独自算出の注目度): 9.365368832347402
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Head and neck masses are space-occupying lesions that can compress the airway and esophagus and may affect nerves and blood vessels. Available public datasets primarily focus on malignant lesions and often overlook other space-occupying conditions in this region. To address this gap, we introduce MasHeNe, an initial dataset of 3,779 contrast-enhanced CT slices that includes both tumors and cysts with pixel-level annotations. We also establish a benchmark using standard segmentation baselines and report common metrics to enable fair comparison. In addition, we propose the Windowing-Enhanced Mamba with Frequency integration (WEMF) model. WEMF applies tri-window enhancement to enrich the input appearance before feature extraction. It further uses multi-frequency attention to fuse information across skip connections within a U-shaped Mamba backbone. On MasHeNe, WEMF attains the best performance among evaluated methods, with a Dice of 70.45%, IoU of 66.89%, NSD of 72.33%, and HD95 of 5.12 mm. This model indicates stable and strong results on this challenging task. MasHeNe provides a benchmark for head-and-neck mass segmentation beyond malignancy-only datasets. The observed error patterns also suggest that this task remains challenging and requires further research. Our dataset and code are available at https://github.com/drthaodao3101/MasHeNe.git.
- Abstract(参考訳): 頭部と頸部の腫瘤は、気道と食道を圧迫し、神経や血管に影響を及ぼす、空間的に占有する病変である。
利用可能な公開データセットは主に悪性病変に焦点を当てており、しばしばこの地域の他の空間占有状態を見落としている。
このギャップに対処するために,3,779個の造影CTスライスの最初のデータセットであるMasHeNeを紹介した。
また、標準セグメンテーションベースラインを使用してベンチマークを作成し、共通メトリクスを報告し、公正な比較を可能にする。
さらに,WEMFモデルを用いたウィンドウ機能強化型マンバを提案する。
WEMFは、特徴抽出の前に入力外観を強化するためにトリウィンドウ拡張を適用している。
さらに、U字型のマンバのバックボーン内のスキップ接続間で情報を融合するために、多周波の注意を使用する。
MasHeNeでは、WEMFは評価された方法の中で最高の性能を示し、Diceは70.45%、IoUは66.89%、SDは72.33%、HD95は5.12mmである。
このモデルは、この挑戦的なタスクにおいて安定的で強力な結果を示す。
MasHeNeは、悪性度のみのデータセットを超えて、ヘッド・アンド・ネックのマスセグメンテーションのベンチマークを提供する。
観察されたエラーパターンは、このタスクが依然として困難であり、さらなる研究が必要であることを示唆している。
私たちのデータセットとコードはhttps://github.com/drthaodao3101/MasHeNe.gitで公開されています。
関連論文リスト
- MambaNetLK: Enhancing Colonoscopy Point Cloud Registration with Mamba [3.505757483260119]
本稿では,内視鏡ナビゲーションに適した新しい3Dレジストレーション手法と,高品質な臨床応用データセットを提案する。
MambaNetLKは通信不要の登録フレームワークで、Mamba State Space Modelを統合することでPointNetLKアーキテクチャを強化する。
臨床データセットであるC3VD-Raycasting-10kでは、MambaNetLKは最先端の手法と比較して最高のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-10-31T21:14:25Z) - U-Mamba2: Scaling State Space Models for Dental Anatomy Segmentation in CBCT [44.3806898357896]
CBCT (Cone-Beam Computed Tomography) は歯科用3次元イメージング技術として広く用いられている。
U-Mamba2は、マルチ解剖学的CBCTセグメンテーションのために設計された新しいニューラルネットワークアーキテクチャである。
論文 参考訳(メタデータ) (2025-09-15T15:52:43Z) - DeSamba: Decoupled Spectral Adaptive Framework for 3D Multi-Sequence MRI Lesion Classification [0.6749750044497732]
DeSambaは、分離された表現を抽出し、病変分類のための空間的特徴とスペクトル的特徴を適応的に融合するように設計されたフレームワークである。
DeSambaは62.10%のTop-1精度、63.62%のF1スコア、87.71%のAUC、93.55%のTop-3精度を達成した。
論文 参考訳(メタデータ) (2025-07-21T10:42:21Z) - SMILE-UHURA Challenge -- Small Vessel Segmentation at Mesoscopic Scale from Ultra-High Resolution 7T Magnetic Resonance Angiograms [60.35639972035727]
公開されている注釈付きデータセットの欠如は、堅牢で機械学習駆動のセグメンテーションアルゴリズムの開発を妨げている。
SMILE-UHURAチャレンジは、7T MRIで取得したTime-of-Flightアンジオグラフィーの注釈付きデータセットを提供することで、公開されている注釈付きデータセットのギャップに対処する。
Diceスコアは、それぞれのデータセットで0.838 $pm$0.066と0.716 $pm$ 0.125まで到達し、平均パフォーマンスは0.804 $pm$ 0.15までになった。
論文 参考訳(メタデータ) (2024-11-14T17:06:00Z) - MedSegMamba: 3D CNN-Mamba Hybrid Architecture for Brain Segmentation [15.514511820130474]
我々は皮質下脳分割のための3DパッチベースのハイブリッドCNN-Mambaモデルを開発した。
モデルの性能をいくつかのベンチマークで検証した。
論文 参考訳(メタデータ) (2024-09-12T02:19:19Z) - Improving Vision Anomaly Detection with the Guidance of Language
Modality [64.53005837237754]
本稿では,マルチモーダルの観点から視覚モダリティの課題に取り組む。
本稿では,冗長な情報問題とスパース空間問題に対処するために,クロスモーダルガイダンス(CMG)を提案する。
視覚異常検出のためのよりコンパクトな潜在空間を学習するために、CMLEは言語モダリティから相関構造行列を学習する。
論文 参考訳(メタデータ) (2023-10-04T13:44:56Z) - Image-level supervision and self-training for transformer-based
cross-modality tumor segmentation [2.29206349318258]
そこで本研究では,MoDATTSと呼ばれる半教師付きトレーニング戦略を提案する。
MoDATTSは、未実装のバイモーダルデータセット上の正確な3D腫瘍セグメンテーションのために設計されている。
この最大性能の99%と100%は、目標データの20%と50%が注釈付きであれば達成できると報告している。
論文 参考訳(メタデータ) (2023-09-17T11:50:12Z) - Multiple Instance Ensembling For Paranasal Anomaly Classification In The
Maxillary Sinus [46.1292414445895]
副鼻腔奇形は幅広い形態学的特徴を持つ。
副鼻腔異常分類への現在のアプローチは、一度に1つの異常を特定することに制約されている。
3次元畳み込みニューラルネットワーク(CNN)を用いて正常上顎骨(MS)とMSをポリープや嚢胞で分類する可能性を検討した。
論文 参考訳(メタデータ) (2023-03-31T09:23:27Z) - Hepatic vessel segmentation based on 3Dswin-transformer with inductive
biased multi-head self-attention [46.46365941681487]
Indu BIased Multi-Head Attention Vessel Net という,堅牢なエンドツーエンドのコンテナセグメンテーションネットワークを提案する。
正確な肝血管のボクセルを見つけるために,パッチワイド埋め込みよりもボクセルワイド埋め込みを導入する。
一方,絶対位置埋め込みから帰納的バイアス付き相対的位置埋め込みを学習する帰納的バイアス付きマルチヘッド自己アテンションを提案する。
論文 参考訳(メタデータ) (2021-11-05T10:17:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。