論文の概要: SPRMamba: Surgical Phase Recognition for Endoscopic Submucosal Dissection with Mamba
- arxiv url: http://arxiv.org/abs/2409.12108v2
- Date: Wed, 21 May 2025 08:18:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-22 15:42:56.905064
- Title: SPRMamba: Surgical Phase Recognition for Endoscopic Submucosal Dissection with Mamba
- Title(参考訳): マンバを用いた内視鏡下粘膜下郭清術におけるSPRMamba
- Authors: Xiangning Zhang, Qingwei Zhang, Jinnan Chen, Chengfeng Zhou, Yaqi Wang, Zhengjie Zhang, Xiaobo Li, Dahong Qian,
- Abstract要約: リアルタイムの外科的位相認識のための新しいフレームワークであるSPRMambaを提案する。
MambaアーキテクチャとScaled Residual TranMambaブロックを統合して、時間的モデリングと局所的な詳細抽出を相乗化する。
最先端のパフォーマンス(ESD385では87.64%、以前の方法では1.0%)を達成し、外科手術全体にわたって堅牢な一般化性を示す。
- 参考スコア(独自算出の注目度): 6.531066045206769
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Endoscopic Submucosal Dissection (ESD) is a minimally invasive procedure initially developed for early gastric cancer treatment and has expanded to address diverse gastrointestinal lesions. While computer-assisted surgery (CAS) systems enhance ESD precision and safety, their efficacy hinges on accurate real-time surgical phase recognition, a task complicated by ESD's inherent complexity, including heterogeneous lesion characteristics and dynamic tissue interactions. Existing video-based phase recognition algorithms, constrained by inefficient temporal context modeling, exhibit limited performance in capturing fine-grained phase transitions and long-range dependencies. To overcome these limitations, we propose SPRMamba, a novel framework integrating a Mamba-based architecture with a Scaled Residual TranMamba (SRTM) block to synergize long-term temporal modeling and localized detail extraction. SPRMamba further introduces the Hierarchical Sampling Strategy to optimize computational efficiency, enabling real-time processing critical for clinical deployment. Evaluated on the ESD385 dataset and the cholecystectomy benchmark Cholec80, SPRMamba achieves state-of-the-art performance (87.64% accuracy on ESD385, +1.0% over prior methods), demonstrating robust generalizability across surgical workflows. This advancement bridges the gap between computational efficiency and temporal sensitivity, offering a transformative tool for intraoperative guidance and skill assessment in ESD surgery. The code is accessible at https://github.com/Zxnyyyyy/SPRMamba.
- Abstract(参考訳): 内視鏡的粘膜下郭清術 (ESD) は早期胃癌治療のために開発された最小侵襲の手術である。
コンピュータ支援手術システム(CAS)は、ESDの精度と安全性を高める一方で、その効果は正確なリアルタイムの外科的位相認識(異種病変の特徴や動的組織相互作用を含む、ESD固有の複雑さによって複雑化されるタスク)に左右される。
既存のビデオベースの位相認識アルゴリズムは、非効率な時間的文脈モデリングによって制約され、微細な位相遷移と長距離依存を捕捉する際の限られた性能を示す。
これらの制約を克服するために,SPRMambaを提案する。SPRMambaは,長期時間モデルと局所的詳細抽出を相乗化するために,MambaベースのアーキテクチャをSRTM(Scaled Residual TranMamba)ブロックに統合する新しいフレームワークである。
SPRMambaはさらに、計算効率を最適化し、臨床展開に不可欠なリアルタイム処理を可能にする階層サンプリング戦略を導入した。
ESD385データセットと胆嚢摘出ベンチマークであるCholec80に基づいて評価され、SPRMambaは最先端のパフォーマンス(ESD385では87.64%、以前の方法では+1.0%)を達成し、外科的ワークフロー全体にわたって堅牢な一般化性を示す。
この進歩は計算効率と時間感度のギャップを埋め、ESD手術における術中指導と技能評価のための変換ツールを提供する。
コードはhttps://github.com/Zxnyyyyy/SPRMamba.comでアクセスできる。
関連論文リスト
- Topology-based deep-learning segmentation method for deep anterior lamellar keratoplasty (DALK) surgical guidance using M-mode OCT data [0.0]
本研究では,トポロジ的損失関数と改良型ネットワークアーキテクチャを統合した,トポロジに基づくディープラーニングセグメンテーション手法を提案する。
このアプローチは、ノイズの効果を効果的に低減し、セグメンテーション速度、精度、安定性を改善する。
論文 参考訳(メタデータ) (2025-01-07T19:57:15Z) - Benchmarking and Enhancing Surgical Phase Recognition Models for Robotic-Assisted Esophagectomy [1.0807134580166777]
食道癌に対する低侵襲食道切除術(RAMIE)を施行した。
我々の目標は, 外科的位相認識に深層学習を活用することであり, 術中支援を外科医に提供することである。
この複雑な手順の時間的ダイナミクスをより効果的に捉えるために,エンコーダ・デコーダ構造を特徴とする新しいディープラーニングモデルを開発した。
論文 参考訳(メタデータ) (2024-12-05T10:23:16Z) - Deep intra-operative illumination calibration of hyperspectral cameras [73.08443963791343]
ハイパースペクトルイメージング (HSI) は, 様々な手術応用に期待できる新しい画像モダリティとして出現している。
手術室における照明条件の動的変化がHSIアプリケーションの性能に劇的な影響を及ぼすことを示す。
手術中におけるハイパースペクトル画像の自動再構成のための新しい学習ベースアプローチを提案する。
論文 参考訳(メタデータ) (2024-09-11T08:30:03Z) - SR-Mamba: Effective Surgical Phase Recognition with State Space Model [42.766718651973726]
SR-マンバ(SR-Mamba)は、外科的位相認識の課題を満たすために特別に設計された、新しい無注意モデルである。
SR-Mambaでは、双方向のMambaデコーダを用いて、時間的コンテキストをオーバーロングシーケンスで効果的にモデル化する。
SR-Mambaは、Colec80とCATARACTS Challengeデータセットで最先端のパフォーマンスを示すことによって、外科的ビデオ分析の新たなベンチマークを確立する。
論文 参考訳(メタデータ) (2024-07-11T09:34:31Z) - Friends Across Time: Multi-Scale Action Segmentation Transformer for
Surgical Phase Recognition [2.10407185597278]
オフライン手術相認識のためのMS-AST(Multi-Scale Action Causal Transformer)とオンライン手術相認識のためのMS-ASCT(Multi-Scale Action Causal Transformer)を提案する。
オンラインおよびオフラインの外科的位相認識のためのColec80データセットでは,95.26%,96.15%の精度が得られる。
論文 参考訳(メタデータ) (2024-01-22T01:34:03Z) - Action Recognition in Video Recordings from Gynecologic Laparoscopy [4.002010889177872]
行動認識は腹腔鏡画像解析における多くの応用の前提条件である。
本研究では,CNN-RNNアーキテクチャと,カスタマイズしたトレーニング推論フレームワークの設計と評価を行う。
論文 参考訳(メタデータ) (2023-11-30T16:15:46Z) - Phase-Specific Augmented Reality Guidance for Microscopic Cataract
Surgery Using Long-Short Spatiotemporal Aggregation Transformer [14.568834378003707]
乳化白内障手術(英: Phaemulsification cataract surgery, PCS)は、外科顕微鏡を用いた外科手術である。
PCS誘導システムは、手術用顕微鏡映像から貴重な情報を抽出し、熟練度を高める。
既存のPCSガイダンスシステムでは、位相特異なガイダンスに悩まされ、冗長な視覚情報に繋がる。
本稿では,認識された手術段階に対応するAR情報を提供する,新しい位相特異的拡張現実(AR)誘導システムを提案する。
論文 参考訳(メタデータ) (2023-09-11T02:56:56Z) - GLSFormer : Gated - Long, Short Sequence Transformer for Step
Recognition in Surgical Videos [57.93194315839009]
本稿では,シーケンスレベルのパッチから時間的特徴を直接学習するための視覚変換器に基づくアプローチを提案する。
本研究では,白内障手術用ビデオデータセットである白内障-101とD99に対するアプローチを広範に評価し,各種の最先端手法と比較して優れた性能を示した。
論文 参考訳(メタデータ) (2023-07-20T17:57:04Z) - Learning-Based Keypoint Registration for Fetoscopic Mosaicking [65.02392513942533]
ツイン・トゥ・ツイン輸血症候群(TTTS)では、単子葉胎盤の血管系異常な血管性無痛が両胎児の間に不均一な血流を生じさせる。
本研究では,フィールド・オブ・ビュー展開のためのフェトスコープフレーム登録のための学習ベースフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-26T21:21:12Z) - A Long Short-term Memory Based Recurrent Neural Network for
Interventional MRI Reconstruction [50.1787181309337]
本稿では,畳み込み長短期記憶(Conv-LSTM)に基づくリカレントニューラルネットワーク(Recurrent Neural Network, RNN)を提案する。
提案アルゴリズムは,DBSのリアルタイムi-MRIを実現する可能性があり,汎用的なMR誘導介入に使用できる。
論文 参考訳(メタデータ) (2022-03-28T14:03:45Z) - Trans-SVNet: Accurate Phase Recognition from Surgical Videos via Hybrid
Embedding Aggregation Transformer [57.18185972461453]
本稿では,手術ワークフロー解析トランスフォーマーを初めて導入し,正確な位相認識のための時間的特徴と時間的特徴の無視された補完効果を再考する。
我々のフレームワークは軽量であり、高い推論速度を達成するためにハイブリッド埋め込みを並列に処理します。
論文 参考訳(メタデータ) (2021-03-17T15:12:55Z) - TeCNO: Surgical Phase Recognition with Multi-Stage Temporal
Convolutional Networks [43.95869213955351]
外科的位相認識のための階層的予測補正を行う多段階時間畳み込みネットワーク(MS-TCN)を提案する。
本手法は腹腔鏡下胆嚢摘出術ビデオの2つのデータセットに対して,追加の外科的ツール情報を用いずに徹底的に評価した。
論文 参考訳(メタデータ) (2020-03-24T10:12:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。