論文の概要: SPRMamba: Surgical Phase Recognition for Endoscopic Submucosal Dissection with Mamba
- arxiv url: http://arxiv.org/abs/2409.12108v1
- Date: Wed, 18 Sep 2024 16:26:56 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-19 16:45:43.723180
- Title: SPRMamba: Surgical Phase Recognition for Endoscopic Submucosal Dissection with Mamba
- Title(参考訳): マンバを用いた内視鏡下粘膜下郭清術におけるSPRMamba
- Authors: Xiangning Zhang, Jinnan Chen, Qingwei Zhang, Chengfeng Zhou, Zhengjie Zhang, Xiaobo Li, Dahong Qian,
- Abstract要約: 本研究では,ESD外科的位相認識のための新しいマンバベースのフレームワークであるSPRMambaを提案する。
本研究では,SPRMambaが既存の最先端手法を超越し,各種の外科的位相認識タスクにおいてより堅牢性を示すことを示す。
- 参考スコア(独自算出の注目度): 4.37495931705689
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Endoscopic Submucosal Dissection (ESD) is a minimally invasive procedure initially designed for the treatment of early gastric cancer but is now widely used for various gastrointestinal lesions. Computer-assisted Surgery systems have played a crucial role in improving the precision and safety of ESD procedures, however, their effectiveness is limited by the accurate recognition of surgical phases. The intricate nature of ESD, with different lesion characteristics and tissue structures, presents challenges for real-time surgical phase recognition algorithms. Existing surgical phase recognition algorithms struggle to efficiently capture temporal contexts in video-based scenarios, leading to insufficient performance. To address these issues, we propose SPRMamba, a novel Mamba-based framework for ESD surgical phase recognition. SPRMamba leverages the strengths of Mamba for long-term temporal modeling while introducing the Scaled Residual TranMamba block to enhance the capture of fine-grained details, overcoming the limitations of traditional temporal models like Temporal Convolutional Networks and Transformers. Moreover, a Temporal Sample Strategy is introduced to accelerate the processing, which is essential for real-time phase recognition in clinical settings. Extensive testing on the ESD385 dataset and the cholecystectomy Cholec80 dataset demonstrates that SPRMamba surpasses existing state-of-the-art methods and exhibits greater robustness across various surgical phase recognition tasks.
- Abstract(参考訳): 内視鏡的粘膜下郭清術 (ESD) は, 早期胃癌の治療を目的とした最小侵襲の手術である。
コンピュータ支援手術システムはESD手術の精度と安全性を向上させる上で重要な役割を担っているが、その効果は手術段階の正確な認識によって制限されている。
病変の特徴や組織構造が異なるESDの複雑な性質は、リアルタイムの外科的位相認識アルゴリズムの課題を提起する。
既存の外科的位相認識アルゴリズムは、ビデオベースのシナリオで時間的コンテキストを効率的に捉えるのに苦労し、性能は不十分である。
これらの課題に対処するために,ESD手術相認識のための新しいMambaベースのフレームワークであるSPRMambaを提案する。
SPRMambaは、テンポラル・コンボリューショナル・ネットワーク(英語版)やトランスフォーマー(英語版)といった伝統的なテンポラル・テンポラル・モデル(英語版)の限界を克服し、きめ細かな細部を捉えるためにスケールド・リシダル・トランマバ・ブロックを導入しながら、長期のテンポラル・モデリングにマンバの強みを活用している。
さらに, リアルタイムの位相認識に欠かせない処理を加速するために, 時間サンプル戦略を導入している。
ESD385データセットと胆嚢摘出術のColec80データセットの大規模なテストは、SPRMambaが既存の最先端の手法を超越し、様々な外科的位相認識タスクにおいてより堅牢性を示すことを示している。
関連論文リスト
- Deep intra-operative illumination calibration of hyperspectral cameras [73.08443963791343]
ハイパースペクトルイメージング (HSI) は, 様々な手術応用に期待できる新しい画像モダリティとして出現している。
手術室における照明条件の動的変化がHSIアプリケーションの性能に劇的な影響を及ぼすことを示す。
手術中におけるハイパースペクトル画像の自動再構成のための新しい学習ベースアプローチを提案する。
論文 参考訳(メタデータ) (2024-09-11T08:30:03Z) - SR-Mamba: Effective Surgical Phase Recognition with State Space Model [42.766718651973726]
SR-マンバ(SR-Mamba)は、外科的位相認識の課題を満たすために特別に設計された、新しい無注意モデルである。
SR-Mambaでは、双方向のMambaデコーダを用いて、時間的コンテキストをオーバーロングシーケンスで効果的にモデル化する。
SR-Mambaは、Colec80とCATARACTS Challengeデータセットで最先端のパフォーマンスを示すことによって、外科的ビデオ分析の新たなベンチマークを確立する。
論文 参考訳(メタデータ) (2024-07-11T09:34:31Z) - Friends Across Time: Multi-Scale Action Segmentation Transformer for
Surgical Phase Recognition [2.10407185597278]
オフライン手術相認識のためのMS-AST(Multi-Scale Action Causal Transformer)とオンライン手術相認識のためのMS-ASCT(Multi-Scale Action Causal Transformer)を提案する。
オンラインおよびオフラインの外科的位相認識のためのColec80データセットでは,95.26%,96.15%の精度が得られる。
論文 参考訳(メタデータ) (2024-01-22T01:34:03Z) - Action Recognition in Video Recordings from Gynecologic Laparoscopy [4.002010889177872]
行動認識は腹腔鏡画像解析における多くの応用の前提条件である。
本研究では,CNN-RNNアーキテクチャと,カスタマイズしたトレーニング推論フレームワークの設計と評価を行う。
論文 参考訳(メタデータ) (2023-11-30T16:15:46Z) - Phase-Specific Augmented Reality Guidance for Microscopic Cataract
Surgery Using Long-Short Spatiotemporal Aggregation Transformer [14.568834378003707]
乳化白内障手術(英: Phaemulsification cataract surgery, PCS)は、外科顕微鏡を用いた外科手術である。
PCS誘導システムは、手術用顕微鏡映像から貴重な情報を抽出し、熟練度を高める。
既存のPCSガイダンスシステムでは、位相特異なガイダンスに悩まされ、冗長な視覚情報に繋がる。
本稿では,認識された手術段階に対応するAR情報を提供する,新しい位相特異的拡張現実(AR)誘導システムを提案する。
論文 参考訳(メタデータ) (2023-09-11T02:56:56Z) - GLSFormer : Gated - Long, Short Sequence Transformer for Step
Recognition in Surgical Videos [57.93194315839009]
本稿では,シーケンスレベルのパッチから時間的特徴を直接学習するための視覚変換器に基づくアプローチを提案する。
本研究では,白内障手術用ビデオデータセットである白内障-101とD99に対するアプローチを広範に評価し,各種の最先端手法と比較して優れた性能を示した。
論文 参考訳(メタデータ) (2023-07-20T17:57:04Z) - Learning-Based Keypoint Registration for Fetoscopic Mosaicking [65.02392513942533]
ツイン・トゥ・ツイン輸血症候群(TTTS)では、単子葉胎盤の血管系異常な血管性無痛が両胎児の間に不均一な血流を生じさせる。
本研究では,フィールド・オブ・ビュー展開のためのフェトスコープフレーム登録のための学習ベースフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-26T21:21:12Z) - A Long Short-term Memory Based Recurrent Neural Network for
Interventional MRI Reconstruction [50.1787181309337]
本稿では,畳み込み長短期記憶(Conv-LSTM)に基づくリカレントニューラルネットワーク(Recurrent Neural Network, RNN)を提案する。
提案アルゴリズムは,DBSのリアルタイムi-MRIを実現する可能性があり,汎用的なMR誘導介入に使用できる。
論文 参考訳(メタデータ) (2022-03-28T14:03:45Z) - Trans-SVNet: Accurate Phase Recognition from Surgical Videos via Hybrid
Embedding Aggregation Transformer [57.18185972461453]
本稿では,手術ワークフロー解析トランスフォーマーを初めて導入し,正確な位相認識のための時間的特徴と時間的特徴の無視された補完効果を再考する。
我々のフレームワークは軽量であり、高い推論速度を達成するためにハイブリッド埋め込みを並列に処理します。
論文 参考訳(メタデータ) (2021-03-17T15:12:55Z) - TeCNO: Surgical Phase Recognition with Multi-Stage Temporal
Convolutional Networks [43.95869213955351]
外科的位相認識のための階層的予測補正を行う多段階時間畳み込みネットワーク(MS-TCN)を提案する。
本手法は腹腔鏡下胆嚢摘出術ビデオの2つのデータセットに対して,追加の外科的ツール情報を用いずに徹底的に評価した。
論文 参考訳(メタデータ) (2020-03-24T10:12:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。