論文の概要: Kinematic Data-Based Action Segmentation for Surgical Applications
- arxiv url: http://arxiv.org/abs/2303.07814v1
- Date: Tue, 14 Mar 2023 11:44:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-15 15:20:53.166274
- Title: Kinematic Data-Based Action Segmentation for Surgical Applications
- Title(参考訳): キネマティックデータに基づく手術用アクションセグメンテーション
- Authors: Adam Goldbraikh, Omer Shubi, Or Rubin, Carla M Pugh, Shlomi Laufer
- Abstract要約: 本研究は,運動学的データに対する行動セグメンテーションに関連する2つのコントリビューションを提示する。
本稿では,MS-TCN-BiLSTMとMS-TCN-BiGRUの2つのマルチステージアーキテクチャを紹介する。
次に,2つの新しいデータ拡張手法であるWorld Frame RotationとHorizontal-Flipを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Action segmentation is a challenging task in high-level process analysis,
typically performed on video or kinematic data obtained from various sensors.
In the context of surgical procedures, action segmentation is critical for
workflow analysis algorithms. This work presents two contributions related to
action segmentation on kinematic data. Firstly, we introduce two multi-stage
architectures, MS-TCN-BiLSTM and MS-TCN-BiGRU, specifically designed for
kinematic data. The architectures consist of a prediction generator with
intra-stage regularization and Bidirectional LSTM or GRU-based refinement
stages. Secondly, we propose two new data augmentation techniques, World Frame
Rotation and Horizontal-Flip, which utilize the strong geometric structure of
kinematic data to improve algorithm performance and robustness. We evaluate our
models on three datasets of surgical suturing tasks: the Variable Tissue
Simulation (VTS) Dataset and the newly introduced Bowel Repair Simulation (BRS)
Dataset, both of which are open surgery simulation datasets collected by us, as
well as the JHU-ISI Gesture and Skill Assessment Working Set (JIGSAWS), a
well-known benchmark in robotic surgery. Our methods achieve state-of-the-art
performance on all benchmark datasets and establish a strong baseline for the
BRS dataset.
- Abstract(参考訳): アクションセグメンテーション(Action segmentation)は、様々なセンサーから得られるビデオやキネマティックデータで通常実行される、ハイレベルなプロセス分析において難しいタスクである。
手術手順の文脈では、ワークフロー分析アルゴリズムではアクションセグメンテーションが重要である。
本研究は,運動データに対するアクションセグメンテーションに関する2つの貢献を示す。
まず,2つのマルチステージアーキテクチャ,MS-TCN-BiLSTMとMS-TCN-BiGRUを紹介する。
アーキテクチャは、ステージ内正規化を備えた予測生成器と、双方向LSTMまたはGRUベースの洗練段階で構成される。
第2に,キネマティックデータの強い幾何学的構造を利用してアルゴリズムの性能とロバスト性を向上させる,世界フレーム回転と水平フリップという2つの新しいデータ拡張手法を提案する。
本研究は,我々が収集したオープン手術シミュレーションデータセットである可変組織シミュレーション(vts)データセットと新たに導入した腸修復シミュレーション(brs)データセットと,ロボット手術における有名なベンチマークであるjigsaws(jhu-isi gesture and skill assessment working set)の3つの手術縫合課題について評価した。
提案手法は,すべてのベンチマークデータセットに対して最先端のパフォーマンスを達成し,BRSデータセットの強力なベースラインを確立する。
関連論文リスト
- Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based
Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。
我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。
時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文 参考訳(メタデータ) (2022-07-17T07:05:39Z) - StorSeismic: A new paradigm in deep learning for seismic processing [0.0]
StorSeismicは地震データ処理のフレームワークである。
我々は, 自己監督段階において, 人工的に生成された地震データとともに, 事前訓練を行った。
そして,ラベル付き合成データを用いて,事前学習したネットワークを教師付き方式で微調整し,各種の耐震処理を行う。
論文 参考訳(メタデータ) (2022-04-30T09:55:00Z) - MSeg: A Composite Dataset for Multi-domain Semantic Segmentation [100.17755160696939]
セマンティックセグメンテーションデータセットを異なるドメインから統合する合成データセットであるMSegを提案する。
一般化と画素レベルのアノテーションのアライメントを調整し,2万枚以上のオブジェクトマスクを8万枚以上の画像で再現する。
MSegでトレーニングされたモデルは、WildDash-v1のリーダーボードで、トレーニング中にWildDashのデータに触れることなく、堅牢なセマンティックセグメンテーションのためにランク付けされている。
論文 参考訳(メタデータ) (2021-12-27T16:16:35Z) - One to Many: Adaptive Instrument Segmentation via Meta Learning and
Dynamic Online Adaptation in Robotic Surgical Video [71.43912903508765]
MDALは、ロボット支援手術における機器セグメンテーションのための動的オンライン適応学習スキームです。
ビデオ固有のメタ学習パラダイムを通じて、楽器の一般的な知識と高速適応能力を学ぶ。
2つのデータセットで他の最先端のメソッドよりも優れています。
論文 参考訳(メタデータ) (2021-03-24T05:02:18Z) - Learning to Segment Rigid Motions from Two Frames [72.14906744113125]
本研究では, 運動場から独立物体の動きを復元する幾何学的解析により, モジュラーネットワークを提案する。
2つの連続フレームを入力とし、背景のセグメンテーションマスクと複数の剛体移動オブジェクトを予測し、3次元の剛体変換によってパラメータ化する。
本手法はkittiおよびsintelにおける剛体運動セグメンテーションの最先端性能を実現する。
論文 参考訳(メタデータ) (2021-01-11T04:20:30Z) - Shared Space Transfer Learning for analyzing multi-site fMRI data [83.41324371491774]
マルチボクセルパターン解析(MVPA)は、タスクベース機能磁気共鳴画像(fMRI)データから予測モデルを学習する。
MVPAはよく設計された機能セットと十分なサンプルサイズで機能する。
ほとんどのfMRIデータセットはノイズが多く、高次元で、収集するのに高価で、サンプルサイズも小さい。
本稿では,新しい伝達学習手法として共有空間移動学習(SSTL)を提案する。
論文 参考訳(メタデータ) (2020-10-24T08:50:26Z) - Endo-Sim2Real: Consistency learning-based domain adaptation for
instrument segmentation [1.086731011437779]
内視鏡的ビデオにおける外科的ツールセグメンテーションは、コンピュータによる介入システムの重要な構成要素である。
完全教師付きディープラーニングアプローチを用いた画像ベースソリューションの最近の成功は、大きなラベル付きデータセットの収集によるものである。
計算機シミュレーションは手動ラベリング問題を緩和するが、シミュレーションデータで訓練されたモデルは実際のデータに一般化しない。
本研究では,シミュレーションおよび実(ラベルなし)内視鏡データの共同学習のための一貫性に基づくフレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-22T16:18:11Z) - Learning Motion Flows for Semi-supervised Instrument Segmentation from
Robotic Surgical Video [64.44583693846751]
本研究は,スパースアノテーションを用いたロボット手術ビデオから半教師楽器のセグメンテーションについて検討する。
生成されたデータペアを利用することで、我々のフレームワークはトレーニングシーケンスの時間的一貫性を回復し、強化することができます。
その結果,本手法は最先端の半教師あり手法よりも大きなマージンで優れていることがわかった。
論文 参考訳(メタデータ) (2020-07-06T02:39:32Z) - Unsupervised Learning Consensus Model for Dynamic Texture Videos
Segmentation [12.462608802359936]
動的テクスチャのセグメンテーションのための効果的な教師なし学習コンセンサスモデルを提案する。
提案モデルでは,分類対象画素の周辺部における再量子化局所2値パターン(LBP)ヒストグラムの値の集合を特徴として用いた。
挑戦的なSynthDBデータセットで実施された実験は、ULCMが大幅に高速で、コーディングが簡単で、単純で、パラメータが限られていることを示している。
論文 参考訳(メタデータ) (2020-06-29T16:40:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。