論文の概要: MambaNetLK: Enhancing Colonoscopy Point Cloud Registration with Mamba
- arxiv url: http://arxiv.org/abs/2511.00260v1
- Date: Fri, 31 Oct 2025 21:14:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 16:37:26.696241
- Title: MambaNetLK: Enhancing Colonoscopy Point Cloud Registration with Mamba
- Title(参考訳): MambaNetLK: Mambaによる大腸内視鏡的ポイントクラウド登録の強化
- Authors: Linzhe Jiang, Jiayuan Huang, Sophia Bano, Matthew J. Clarkson, Zhehua Mao, Mobarak I. Hoque,
- Abstract要約: 本稿では,内視鏡ナビゲーションに適した新しい3Dレジストレーション手法と,高品質な臨床応用データセットを提案する。
MambaNetLKは通信不要の登録フレームワークで、Mamba State Space Modelを統合することでPointNetLKアーキテクチャを強化する。
臨床データセットであるC3VD-Raycasting-10kでは、MambaNetLKは最先端の手法と比較して最高のパフォーマンスを実現している。
- 参考スコア(独自算出の注目度): 3.505757483260119
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate 3D point cloud registration underpins reliable image-guided colonoscopy, directly affecting lesion localization, margin assessment, and navigation safety. However, biological tissue exhibits repetitive textures and locally homogeneous geometry that cause feature degeneracy, while substantial domain shifts between pre-operative anatomy and intra-operative observations further degrade alignment stability. To address these clinically critical challenges, we introduce a novel 3D registration method tailored for endoscopic navigation and a high-quality, clinically grounded dataset to support rigorous and reproducible benchmarking. We introduce C3VD-Raycasting-10k, a large-scale benchmark dataset with 10,014 geometrically aligned point cloud pairs derived from clinical CT data. We propose MambaNetLK, a novel correspondence-free registration framework, which enhances the PointNetLK architecture by integrating a Mamba State Space Model (SSM) as a cross-modal feature extractor. As a result, the proposed framework efficiently captures long-range dependencies with linear-time complexity. The alignment is achieved iteratively using the Lucas-Kanade algorithm. On the clinical dataset, C3VD-Raycasting-10k, MambaNetLK achieves the best performance compared with the state-of-the-art methods, reducing median rotation error by 56.04% and RMSE translation error by 26.19% over the second-best method. The model also demonstrates strong generalization on ModelNet40 and superior robustness to initial pose perturbations. MambaNetLK provides a robust foundation for 3D registration in surgical navigation. The combination of a globally expressive SSM-based feature extractor and a large-scale clinical dataset enables more accurate and reliable guidance systems in minimally invasive procedures like colonoscopy.
- Abstract(参考訳): 正確な3Dポイントクラウド登録は、画像誘導型大腸内視鏡の基盤となり、病変の局在、マージン評価、ナビゲーション安全性に直接影響を及ぼす。
しかし、生物学的組織は反復的なテクスチャや局所的に均質な形状が特徴的退化を引き起こす一方で、術前解剖学と術中観察の間の領域のかなりの変化はアライメントの安定性をさらに低下させる。
これらの臨床的に重要な課題に対処するために、内視鏡ナビゲーションに適した新しい3D登録法と、厳密で再現可能なベンチマークをサポートするための高品質な臨床基盤データセットを導入する。
C3VD-Raycasting-10kは,臨床CTデータから得られた10,014点の雲対を持つ大規模ベンチマークデータセットである。
我々は,Mamba State Space Model (SSM)をクロスモーダルな特徴抽出器として統合することにより,PointNetLKアーキテクチャを向上する新しい通信自由登録フレームワークであるMambaNetLKを提案する。
その結果,提案フレームワークは線形時間複雑度で長距離依存性を効率的に捕捉する。
このアライメントはLucas-Kanadeアルゴリズムを用いて反復的に達成される。
臨床データセットのC3VD-Raycasting-10kでは、MambaNetLKは最先端の手法と比較して最高の性能を達成し、中央値の回転誤差を56.04%、RMSE翻訳誤差を26.19%削減した。
モデルはまた、ModelNet40の強力な一般化と、最初のポーズ摂動に対する優れた堅牢性を示す。
MambaNetLKは、手術ナビゲーションにおける3D登録のための堅牢な基盤を提供する。
グローバルに表現可能なSSMベースの特徴抽出器と大規模な臨床データセットを組み合わせることで、大腸内視鏡のような最小侵襲の手順において、より正確で信頼性の高いガイダンスシステムを実現することができる。
関連論文リスト
- Cross3DReg: Towards a Large-scale Real-world Cross-source Point Cloud Registration Benchmark [57.42211080221526]
異なるセンサーからのポイントクラウドデータを整列することを目的とした、クロスソースのポイントクラウド登録は、3Dビジョンの基本的なタスクである。
ディープ登録モデルをトレーニングするための大規模な実世界のデータセットが公開されていないことや、複数のセンサーによってキャプチャされたポイントクラウド固有の違いが課題となっている。
現在世界最大のマルチモーダル・クロスソース・クラウド登録データセットであるCross3DRegを構築している。
クロスソース・ポイント・クラウド機能の整合性を高めるために,ビジュアル・ジオメトリ・アテンションガイド付きマッチングモジュールを提案する。
論文 参考訳(メタデータ) (2025-09-08T09:01:13Z) - A Novel Attention-Augmented Wavelet YOLO System for Real-time Brain Vessel Segmentation on Transcranial Color-coded Doppler [49.03919553747297]
我々は,脳動脈を効率よく捉えることができるAIを利用したリアルタイムCoW自動分割システムを提案する。
Transcranial Color-coded Doppler (TCCD) を用いたAIによる脳血管セグメンテーションの事前研究は行われていない。
提案したAAW-YOLOは, 異方性および対側性CoW容器のセグメンテーションにおいて高い性能を示した。
論文 参考訳(メタデータ) (2025-08-19T14:41:22Z) - DeSamba: Decoupled Spectral Adaptive Framework for 3D Multi-Sequence MRI Lesion Classification [0.6749750044497732]
DeSambaは、分離された表現を抽出し、病変分類のための空間的特徴とスペクトル的特徴を適応的に融合するように設計されたフレームワークである。
DeSambaは62.10%のTop-1精度、63.62%のF1スコア、87.71%のAUC、93.55%のTop-3精度を達成した。
論文 参考訳(メタデータ) (2025-07-21T10:42:21Z) - ReCoGNet: Recurrent Context-Guided Network for 3D MRI Prostate Segmentation [11.248082139905865]
アノテーション付きデータとしてMRIシーケンスをモデル化するハイブリッドアーキテクチャを提案する。
本手法では, 深層保存型DeepVLab3バックボーンを用いて, それぞれのMRIスライスから高レベルなセマンティック特徴を抽出し, コンブLSTM層で構築した再帰的畳み込みヘッドを用いて, スライス間の情報統合を行う。
現状の2D, 3Dセグメンテーションモデルと比較して, 精度, リコール, IoU, Dice similarity Coefficient (DSC) およびロバストネスの点で優れた性能を示す。
論文 参考訳(メタデータ) (2025-06-24T14:56:55Z) - KaLDeX: Kalman Filter based Linear Deformable Cross Attention for Retina Vessel Segmentation [46.57880203321858]
カルマンフィルタを用いた線形変形型クロスアテンション(LDCA)モジュールを用いた血管セグメンテーションのための新しいネットワーク(KaLDeX)を提案する。
我々のアプローチは、カルマンフィルタ(KF)ベースの線形変形可能な畳み込み(LD)とクロスアテンション(CA)モジュールの2つの重要なコンポーネントに基づいている。
提案手法は,網膜基底画像データセット(DRIVE,CHASE_BD1,STARE)とOCTA-500データセットの3mm,6mmを用いて評価した。
論文 参考訳(メタデータ) (2024-10-28T16:00:42Z) - MedSegMamba: 3D CNN-Mamba Hybrid Architecture for Brain Segmentation [15.514511820130474]
我々は皮質下脳分割のための3DパッチベースのハイブリッドCNN-Mambaモデルを開発した。
モデルの性能をいくつかのベンチマークで検証した。
論文 参考訳(メタデータ) (2024-09-12T02:19:19Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - SCPM-Net: An Anchor-free 3D Lung Nodule Detection Network using Sphere
Representation and Center Points Matching [47.79483848496141]
3次元球面表現に基づく中心点マッチング検出ネットワーク(SCPM-Net)を提案する。
アンカーフリーで、nodule/anchorパラメータを手動で設計することなく、nodulesの位置、半径、オフセットを自動的に予測する。
提案するSCPM-Netフレームワークは,既存のアンカーベースおよびアンカーフリーの肺結節検出法と比較して,優れた性能を示すことを示す。
論文 参考訳(メタデータ) (2021-04-12T05:51:29Z) - Deep Implicit Statistical Shape Models for 3D Medical Image Delineation [47.78425002879612]
解剖学的構造の3次元デライン化は、医用画像解析の基本的な目標である。
ディープラーニング以前は、解剖学的制約を課し高品質の表面を作り出す統計的形状モデルはコア技術だった。
我々は,CNNの表現力とSSMの頑健さを合体させるデライン化の新しい手法であるディープ暗黙的統計的形状モデル(DISSMs)を提案する。
論文 参考訳(メタデータ) (2021-04-07T01:15:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。