論文の概要: Bounded Future MS-TCN++ for surgical gesture recognition
- arxiv url: http://arxiv.org/abs/2209.14647v1
- Date: Thu, 29 Sep 2022 09:09:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-30 16:19:14.547222
- Title: Bounded Future MS-TCN++ for surgical gesture recognition
- Title(参考訳): 外科的ジェスチャー認識のための境界将来のMS-TCN++
- Authors: Adam Goldbraikh, Netanell Avisdris, Carla M. Pugh, Shlomi Laufer
- Abstract要約: 性能遅延トレードオフを学習し、このトレードオフを利用できるMS-TCN++ベースのアルゴリズムを設計する。
単純なアプローチは、MS-TCN++の深さを減らすことであり、その結果、受容野が減少し、必要となる将来のフレームの数も減少する。
このように、ネットワーク設計には柔軟性があり、結果として、単純なアプローチよりもはるかに優れたパフォーマンスを実現しています。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In recent times there is a growing development of video based applications
for surgical purposes. Part of these applications can work offline after the
end of the procedure, other applications must react immediately. However, there
are cases where the response should be done during the procedure but some delay
is acceptable. In the literature, the online-offline performance gap is known.
Our goal in this study was to learn the performance-delay trade-off and design
an MS-TCN++-based algorithm that can utilize this trade-off. To this aim, we
used our open surgery simulation data-set containing 96 videos of 24
participants that perform a suturing task on a variable tissue simulator. In
this study, we used video data captured from the side view. The Networks were
trained to identify the performed surgical gestures. The naive approach is to
reduce the MS-TCN++ depth, as a result, the receptive field is reduced, and
also the number of required future frames is also reduced. We showed that this
method is sub-optimal, mainly in the small delay cases. The second method was
to limit the accessible future in each temporal convolution. This way, we have
flexibility in the network design and as a result, we achieve significantly
better performance than in the naive approach.
- Abstract(参考訳): 近年,手術用ビデオベースアプリケーションの開発が進んでいる。
これらのアプリケーションの一部は、手続きが終わるとオフラインで動作し、他のアプリケーションはすぐに反応しなければならない。
しかし、処理中に応答を行う場合もありますが、いくつかの遅延は許容されます。
文献では、オンラインオフラインのパフォーマンスギャップが知られている。
本研究の目的は,性能遅延トレードオフを学習し,このトレードオフを利用するMS-TCN++ベースのアルゴリズムを設計することであった。
そこで我々は,可変組織シミュレータで縫合作業を行う24名の参加者の96本のビデオを含むオープン手術シミュレーションデータセットを用いた。
本研究では,サイドビューから取得した映像データを用いた。
ネットワークは手術のジェスチャーを識別するために訓練された。
単純なアプローチは、MS-TCN++の深さを減らすことであり、その結果、受容野が減少し、必要となる将来のフレームの数も減少する。
本手法は, 主に遅延が小さい場合に準最適であることを示した。
第2の方法は、各時間的畳み込みにおけるアクセス可能な未来を制限することである。
このように、ネットワーク設計に柔軟性があり、その結果、ナイーブなアプローチよりもはるかに優れたパフォーマンスを実現しています。
関連論文リスト
- Efficient Deformable Tissue Reconstruction via Orthogonal Neural Plane [58.871015937204255]
変形性組織を再建するための高速直交平面(Fast Orthogonal Plane)を導入する。
我々は外科手術を4Dボリュームとして概念化し、それらをニューラルネットワークからなる静的および動的フィールドに分解する。
この分解により4次元空間が増加し、メモリ使用量が減少し、最適化が高速化される。
論文 参考訳(メタデータ) (2023-12-23T13:27:50Z) - Deep Multi-Threshold Spiking-UNet for Image Processing [51.88730892920031]
本稿では,SNN(Spike Neural Networks)とU-Netアーキテクチャを組み合わせた,画像処理のためのスパイキング-UNetの概念を紹介する。
効率的なスパイキング-UNetを実現するためには,スパイクによる高忠実度情報伝播の確保と,効果的なトレーニング戦略の策定という2つの課題に直面する。
実験の結果,画像のセグメンテーションとデノイングにおいて,スパイキングUNetは非スパイキングと同等の性能を発揮することがわかった。
論文 参考訳(メタデータ) (2023-07-20T16:00:19Z) - Neural Network Pruning for Real-time Polyp Segmentation [8.08470060885395]
ポリプセグメンテーションにおけるニューラルネットワークプルーニングの適用例を示す。
畳み込みフィルタの重要スコアを計算し、最小スコアを持つフィルタを除去する。
論文 参考訳(メタデータ) (2023-06-22T21:03:50Z) - Fast Neural Scene Flow [36.29234109363439]
座標ニューラルネットワークは、トレーニングなしで実行時のシーンフローを推定する。
本稿では,損失関数自体から生じる支配的な計算ボトルネックを伴って,シーンフローが異なることを実証する。
我々の高速ニューラルネットワークシーンフロー(FNSF)アプローチは、学習手法に匹敵するリアルタイムパフォーマンスを初めて報告します。
論文 参考訳(メタデータ) (2023-04-18T16:37:18Z) - AEGNN: Asynchronous Event-based Graph Neural Networks [54.528926463775946]
イベントベースのグラフニューラルネットワークは、標準のGNNを一般化して、イベントを"進化的"時間グラフとして処理する。
AEGNNは同期入力で容易に訓練でき、テスト時に効率的な「非同期」ネットワークに変換できる。
論文 参考訳(メタデータ) (2022-03-31T16:21:12Z) - Learning Bayesian Sparse Networks with Full Experience Replay for
Continual Learning [54.7584721943286]
継続学習(CL)手法は、機械学習モデルが、以前にマスターされたタスクを壊滅的に忘れることなく、新しいタスクを学習できるようにすることを目的としている。
既存のCLアプローチは、しばしば、事前に確認されたサンプルのバッファを保持し、知識蒸留を行い、あるいはこの目標に向けて正規化技術を使用する。
我々は,現在および過去のタスクを任意の段階で学習するために,スパースニューロンのみを活性化し,選択することを提案する。
論文 参考訳(メタデータ) (2022-02-21T13:25:03Z) - Training Feedback Spiking Neural Networks by Implicit Differentiation on
the Equilibrium State [66.2457134675891]
スパイキングニューラルネットワーク(英: Spiking Neural Network、SNN)は、ニューロモルフィックハードウェア上でエネルギー効率の高い実装を可能にする脳にインスパイアされたモデルである。
既存のほとんどの手法は、人工ニューラルネットワークのバックプロパゲーションフレームワークとフィードフォワードアーキテクチャを模倣している。
本稿では,フォワード計算の正逆性に依存しない新しいトレーニング手法を提案する。
論文 参考訳(メタデータ) (2021-09-29T07:46:54Z) - SurgeonAssist-Net: Towards Context-Aware Head-Mounted Display-Based
Augmented Reality for Surgical Guidance [18.060445966264727]
SurgeonAssist-Netは、アクション・アンド・ワークフロー駆動の仮想アシストを、市販の光学シースルーヘッドマウントディスプレイ(OST-HMD)に利用できるようにするフレームワークである。
本実装は,タスクの自動認識のための予測精度において,最先端の手法と競合する。
これはMicrosoft HoloLens 2 OST-HMD上でほぼリアルタイムで動作することができる。
論文 参考訳(メタデータ) (2021-07-13T21:12:34Z) - LRTD: Long-Range Temporal Dependency based Active Learning for Surgical
Workflow Recognition [67.86810761677403]
本稿では,費用対効果の高い手術ビデオ解析のための新しい能動的学習法を提案する。
具体的には,非局所的再帰的畳み込みネットワーク (NL-RCNet) を提案する。
手術ワークフロー認識タスクを実行することで,大規模な手術ビデオデータセット(Cholec80)に対するアプローチを検証する。
論文 参考訳(メタデータ) (2020-04-21T09:21:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。