論文の概要: Real-time Instance Segmentation of Surgical Instruments using Attention
and Multi-scale Feature Fusion
- arxiv url: http://arxiv.org/abs/2111.04911v2
- Date: Wed, 10 Nov 2021 03:08:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-11 12:45:09.182720
- Title: Real-time Instance Segmentation of Surgical Instruments using Attention
and Multi-scale Feature Fusion
- Title(参考訳): 留意点とマルチスケール特徴融合を用いた手術器具のリアルタイムインスタンス分割
- Authors: Juan Carlos Angeles-Ceron, Gilberto Ochoa-Ruiz, Leonardo Chang, Sharib
Ali
- Abstract要約: ディープラーニングは、大規模な手術シーン環境から複雑な環境を学ぶ機会を与えてくれる。
本稿では,畳み込みブロックアテンションモジュールを補完する軽量単一ステージセグメンテーションモデルを用いる。
ROBUST-MISチャレンジでは,地域単位のMI_DSCと距離単位のMI_NSDを44%以上改善した。
- 参考スコア(独自算出の注目度): 0.5735035463793008
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Precise instrument segmentation aid surgeons to navigate the body more easily
and increase patient safety. While accurate tracking of surgical instruments in
real-time plays a crucial role in minimally invasive computer-assisted
surgeries, it is a challenging task to achieve, mainly due to 1) complex
surgical environment, and 2) model design with both optimal accuracy and speed.
Deep learning gives us the opportunity to learn complex environment from large
surgery scene environments and placements of these instruments in real world
scenarios. The Robust Medical Instrument Segmentation 2019 challenge
(ROBUST-MIS) provides more than 10,000 frames with surgical tools in different
clinical settings. In this paper, we use a light-weight single stage instance
segmentation model complemented with a convolutional block attention module for
achieving both faster and accurate inference. We further improve accuracy
through data augmentation and optimal anchor localisation strategies. To our
knowledge, this is the first work that explicitly focuses on both real-time
performance and improved accuracy. Our approach out-performed top team
performances in the ROBUST-MIS challenge with over 44% improvement on both
area-based metric MI_DSC and distance-based metric MI_NSD. We also demonstrate
real-time performance (> 60 frames-per-second) with different but competitive
variants of our final approach.
- Abstract(参考訳): 精密機器のセグメンテーションは、外科医がより容易に体をナビゲートし、患者の安全を高めるのに役立つ。
手術器具のリアルタイム正確な追跡は, 最小侵襲型コンピュータ支援手術において重要な役割を担っているが, 主に課題である。
1)複雑な手術環境,及び
2)最適精度と速度の両立したモデル設計。
ディープラーニングは、大規模な手術シーン環境から複雑な環境を学ぶ機会を与え、これらの機器を現実世界のシナリオで配置する。
Robust Medical Instrument Segmentation 2019 Challenge (ROBUST-MIS)は、1万フレーム以上の手術器具を異なる臨床環境で提供する。
本稿では,畳み込みブロックアテンションモジュールを補完する軽量単段インスタンスセグメンテーションモデルを用いて,高速かつ高精度な推論を実現する。
データ拡張と最適なアンカーローカライゼーション戦略により、精度をさらに向上する。
私たちの知る限り、これはリアルタイムパフォーマンスと精度向上の両方に明示的に焦点をあてた最初の作業です。
ROBUST-MISチャレンジでは,地域単位のMI_DSCと距離単位のMI_NSDを44%以上改善した。
また、最終アプローチの異なるが競合的なバリエーションでリアルタイムパフォーマンス(60フレーム/秒)を実演しています。
関連論文リスト
- Phase-Informed Tool Segmentation for Manual Small-Incision Cataract Surgery [5.346116837157231]
白内障手術は世界中で最も一般的な手術であり、発展途上国では非常に高い負担がかかる。
白内障-MSICSは,18の手術相と3,527のフレームに,13の手術ツールを画素レベルで付加した53の手術ビデオを含む,最初の総合的データセットである。
ファウンデーションモデルからの擬似ラベルを利用した,位相条件デコーダと簡易かつ効果的な半教師付きセットアップを導入することで,ツールセグメンテーションを強化する新しいフレームワークであるToolSegを提案する。
論文 参考訳(メタデータ) (2024-11-25T09:22:42Z) - Phase-Specific Augmented Reality Guidance for Microscopic Cataract
Surgery Using Long-Short Spatiotemporal Aggregation Transformer [14.568834378003707]
乳化白内障手術(英: Phaemulsification cataract surgery, PCS)は、外科顕微鏡を用いた外科手術である。
PCS誘導システムは、手術用顕微鏡映像から貴重な情報を抽出し、熟練度を高める。
既存のPCSガイダンスシステムでは、位相特異なガイダンスに悩まされ、冗長な視覚情報に繋がる。
本稿では,認識された手術段階に対応するAR情報を提供する,新しい位相特異的拡張現実(AR)誘導システムを提案する。
論文 参考訳(メタデータ) (2023-09-11T02:56:56Z) - Visual-Kinematics Graph Learning for Procedure-agnostic Instrument Tip
Segmentation in Robotic Surgeries [29.201385352740555]
そこで我々は,様々な外科手術を施した楽器の先端を正確に分類する新しいビジュアル・キネマティクスグラフ学習フレームワークを提案する。
具体的には、画像とキネマティクスの両方から楽器部品のリレーショナル特徴を符号化するグラフ学習フレームワークを提案する。
クロスモーダル・コントラッシブ・ロスは、キネマティクスからチップセグメンテーションのイメージへの頑健な幾何学的先行を組み込むように設計されている。
論文 参考訳(メタデータ) (2023-09-02T14:52:58Z) - GLSFormer : Gated - Long, Short Sequence Transformer for Step
Recognition in Surgical Videos [57.93194315839009]
本稿では,シーケンスレベルのパッチから時間的特徴を直接学習するための視覚変換器に基づくアプローチを提案する。
本研究では,白内障手術用ビデオデータセットである白内障-101とD99に対するアプローチを広範に評価し,各種の最先端手法と比較して優れた性能を示した。
論文 参考訳(メタデータ) (2023-07-20T17:57:04Z) - LoViT: Long Video Transformer for Surgical Phase Recognition [59.06812739441785]
短時間・長期の時間情報を融合する2段階のLong Video Transformer(LoViT)を提案する。
このアプローチは、Colec80とAutoLaparoデータセットの最先端メソッドを一貫して上回る。
論文 参考訳(メタデータ) (2023-05-15T20:06:14Z) - Dissecting Self-Supervised Learning Methods for Surgical Computer Vision [51.370873913181605]
一般のコンピュータビジョンコミュニティでは,自己監視学習(SSL)手法が普及し始めている。
医学や手術など、より複雑で影響力のある領域におけるSSLメソッドの有効性は、限定的かつ未調査のままである。
外科的文脈理解,位相認識,ツール存在検出の2つの基本的なタスクに対して,これらの手法の性能をColec80データセット上で広範囲に解析する。
論文 参考訳(メタデータ) (2022-07-01T14:17:11Z) - ST-MTL: Spatio-Temporal Multitask Learning Model to Predict Scanpath
While Tracking Instruments in Robotic Surgery [14.47768738295518]
トラッキング機器によるタスク指向の注意の学習は、画像誘導型ロボット手術において大きな可能性を秘めている。
本稿では,リアルタイムの手術機器分割とタスク指向唾液度検出のための共有エンコーダとシンク時デコーダを用いたエンドツーエンドマルチタスク学習(ST-MTL)モデルを提案する。
本稿では,各デコーダの独立勾配を計算することで,非同期時間最適化手法を提案する。
最先端のセグメンテーションとサリエンシ手法と比較して、我々のモデルは評価指標よりも優れており、挑戦において優れた性能を生んでいる。
論文 参考訳(メタデータ) (2021-12-10T15:20:27Z) - Efficient Global-Local Memory for Real-time Instrument Segmentation of
Robotic Surgical Video [53.14186293442669]
手術器具の知覚における重要な手がかりとして,隣接するフレームからの局所的時間依存性と,長距離における大域的意味的相関があげられる。
本稿では,グローバルとローカルの両方の時間的知識を関連付ける新しいデュアルメモリネットワーク(DMNet)を提案する。
本手法は,実時間速度を維持しながらセグメント化精度を向上する手法である。
論文 参考訳(メタデータ) (2021-09-28T10:10:14Z) - Assessing YOLACT++ for real time and robust instance segmentation of
medical instruments in endoscopic procedures [0.5735035463793008]
腹腔鏡下器具の画像ベースの追跡は、コンピュータおよびロボット支援手術において基本的な役割を果たす。
これまで、医療機器のセグメンテーションなどの既存のモデルは、ほとんどが2段階の検出器に基づいている。
楽器のリアルタイムインスタンスセグメンテーションを可能にするYOLACTアーキテクチャへの注意メカニズムの追加を提案する。
論文 参考訳(メタデータ) (2021-03-30T00:09:55Z) - One to Many: Adaptive Instrument Segmentation via Meta Learning and
Dynamic Online Adaptation in Robotic Surgical Video [71.43912903508765]
MDALは、ロボット支援手術における機器セグメンテーションのための動的オンライン適応学習スキームです。
ビデオ固有のメタ学習パラダイムを通じて、楽器の一般的な知識と高速適応能力を学ぶ。
2つのデータセットで他の最先端のメソッドよりも優れています。
論文 参考訳(メタデータ) (2021-03-24T05:02:18Z) - Searching for Efficient Architecture for Instrument Segmentation in
Robotic Surgery [58.63306322525082]
ほとんどのアプリケーションは、高解像度の外科画像の正確なリアルタイムセグメンテーションに依存している。
我々は,高解像度画像のリアルタイム推論を行うために調整された,軽量で高効率なディープ残差アーキテクチャを設計する。
論文 参考訳(メタデータ) (2020-07-08T21:38:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。