論文の概要: Aggregating Long-Term Context for Learning Laparoscopic and
Robot-Assisted Surgical Workflows
- arxiv url: http://arxiv.org/abs/2009.00681v4
- Date: Mon, 10 May 2021 20:02:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-23 00:35:16.057973
- Title: Aggregating Long-Term Context for Learning Laparoscopic and
Robot-Assisted Surgical Workflows
- Title(参考訳): 腹腔鏡・ロボット支援手術ワークフロー学習における長期コンテキストの集約
- Authors: Yutong Ban, Guy Rosman, Thomas Ward, Daniel Hashimoto, Taisei Kondo,
Hidekazu Iwaki, Ozanan Meireles, Daniela Rus
- Abstract要約: 本稿では,タスク固有のネットワーク表現を利用した時間的ネットワーク構造を提案する。
腹腔鏡下胆嚢摘出術を施行した。
- 参考スコア(独自算出の注目度): 40.48632897750319
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Analyzing surgical workflow is crucial for surgical assistance robots to
understand surgeries. With the understanding of the complete surgical workflow,
the robots are able to assist the surgeons in intra-operative events, such as
by giving a warning when the surgeon is entering specific keys or high-risk
phases. Deep learning techniques have recently been widely applied to
recognizing surgical workflows. Many of the existing temporal neural network
models are limited in their capability to handle long-term dependencies in the
data, instead, relying upon the strong performance of the underlying per-frame
visual models. We propose a new temporal network structure that leverages
task-specific network representation to collect long-term sufficient statistics
that are propagated by a sufficient statistics model (SSM). We implement our
approach within an LSTM backbone for the task of surgical phase recognition and
explore several choices for propagated statistics. We demonstrate superior
results over existing and novel state-of-the-art segmentation techniques on two
laparoscopic cholecystectomy datasets: the publicly available Cholec80 dataset
and MGH100, a novel dataset with more challenging and clinically meaningful
segment labels.
- Abstract(参考訳): 手術支援ロボットは手術のワークフローを分析することが重要である。
外科的ワークフローの完全な理解により、ロボットは外科医が特定のキーやハイリスクフェーズに入るときの警告を与えるなど、手術中のイベントにおいて外科医を支援することができる。
近年,手術ワークフローの認識に深層学習技術が広く応用されている。
既存の時間的ニューラルネットワークモデルの多くは、基礎となるフレーム毎のビジュアルモデルのパフォーマンスに頼らず、データの長期的な依存関係を扱う能力に制限がある。
本稿では,タスク固有のネットワーク表現を活用し,ssmによって伝播される長期的十分な統計情報を収集する新しい時間的ネットワーク構造を提案する。
外科的位相認識のためのLSTMバックボーン内に我々のアプローチを実装し, 伝播統計のためのいくつかの選択肢を探索する。
腹腔鏡下胆嚢摘出術(cholec80 dataset)とmgh100(mgh100)の2例について,既存の術式および術式分類法よりも優れた結果を示した。
関連論文リスト
- LLM-Assisted Multi-Teacher Continual Learning for Visual Question Answering in Robotic Surgery [57.358568111574314]
患者のデータのプライバシは、モデル更新時に古いデータの可用性を制限することが多い。
CL研究は外科領域で2つの重要な問題を見落としていた。
本稿では,多モーダル大規模言語モデル (LLM) と適応重み付け手法を用いて,これらの問題に対処することを提案する。
論文 参考訳(メタデータ) (2024-02-26T15:35:24Z) - SAR-RARP50: Segmentation of surgical instrumentation and Action
Recognition on Robot-Assisted Radical Prostatectomy Challenge [72.97934765570069]
外科的動作認識と意味計測のセグメンテーションのための,最初のマルチモーダルなインビボデータセットを公開し,ロボット補助根治術(RARP)の50の縫合ビデオセグメントを収録した。
この課題の目的は、提供されたデータセットのスケールを活用し、外科領域における堅牢で高精度なシングルタスクアクション認識とツールセグメンテーションアプローチを開発することである。
合計12チームがこのチャレンジに参加し、7つのアクション認識方法、9つの計器のセグメンテーション手法、そしてアクション認識と計器のセグメンテーションを統合した4つのマルチタスクアプローチをコントリビュートした。
論文 参考訳(メタデータ) (2023-12-31T13:32:18Z) - Identification of Cognitive Workload during Surgical Tasks with
Multimodal Deep Learning [20.706268332427157]
関連する認知ワークロード(CWL)の増加は、予期せぬ、反復的なタスクへの対処から生じる。
本稿では,CWLのマルチモーダル認識のための2つの機械学習手法のカスケードを提案する。
畳み込みニューラルネットワーク(CNN)は、この情報を用いて、各手術タスクに関連するさまざまなタイプのCWLを識別する。
論文 参考訳(メタデータ) (2022-09-12T18:29:34Z) - Dissecting Self-Supervised Learning Methods for Surgical Computer Vision [51.370873913181605]
一般のコンピュータビジョンコミュニティでは,自己監視学習(SSL)手法が普及し始めている。
医学や手術など、より複雑で影響力のある領域におけるSSLメソッドの有効性は、限定的かつ未調査のままである。
外科的文脈理解,位相認識,ツール存在検出の2つの基本的なタスクに対して,これらの手法の性能をColec80データセット上で広範囲に解析する。
論文 参考訳(メタデータ) (2022-07-01T14:17:11Z) - Federated Cycling (FedCy): Semi-supervised Federated Learning of
Surgical Phases [57.90226879210227]
FedCyは、FLと自己教師付き学習を組み合わせた半教師付き学習(FSSL)手法で、ラベル付きビデオとラベルなしビデオの両方の分散データセットを利用する。
外科的段階の自動認識作業において,最先端のFSSL法よりも顕著な性能向上を示した。
論文 参考訳(メタデータ) (2022-03-14T17:44:53Z) - LRTD: Long-Range Temporal Dependency based Active Learning for Surgical
Workflow Recognition [67.86810761677403]
本稿では,費用対効果の高い手術ビデオ解析のための新しい能動的学習法を提案する。
具体的には,非局所的再帰的畳み込みネットワーク (NL-RCNet) を提案する。
手術ワークフロー認識タスクを実行することで,大規模な手術ビデオデータセット(Cholec80)に対するアプローチを検証する。
論文 参考訳(メタデータ) (2020-04-21T09:21:22Z) - TeCNO: Surgical Phase Recognition with Multi-Stage Temporal
Convolutional Networks [43.95869213955351]
外科的位相認識のための階層的予測補正を行う多段階時間畳み込みネットワーク(MS-TCN)を提案する。
本手法は腹腔鏡下胆嚢摘出術ビデオの2つのデータセットに対して,追加の外科的ツール情報を用いずに徹底的に評価した。
論文 参考訳(メタデータ) (2020-03-24T10:12:30Z) - Multi-Task Recurrent Neural Network for Surgical Gesture Recognition and
Progress Prediction [17.63619129438996]
本稿では,手術動作の同時認識のためのマルチタスクリカレントニューラルネットワークを提案する。
マルチタスクフレームワークでは,手作業によるラベリングやトレーニングを伴わずに,進捗推定による認識性能が向上することが実証された。
論文 参考訳(メタデータ) (2020-03-10T14:28:02Z) - Temporal Segmentation of Surgical Sub-tasks through Deep Learning with
Multiple Data Sources [14.677001578868872]
本稿では,タスクが進行するにつれて発生する動作や事象に基づいて,統一的な手術状態推定モデルを提案する。
JHU-ISI Gesture and Skill Assessment Working Set(JIGSAWS)と,ロボット内超音波(RIOUS)画像を含むより複雑なデータセットについて検討した。
本モデルでは,89.4%まで優れたフレームワイド状態推定精度を実現し,最先端の手術状態推定モデルを改善する。
論文 参考訳(メタデータ) (2020-02-07T17:49:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。