論文の概要: Less is More: Surgical Phase Recognition from Timestamp Supervision
- arxiv url: http://arxiv.org/abs/2202.08199v1
- Date: Wed, 16 Feb 2022 17:18:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-17 15:13:55.128339
- Title: Less is More: Surgical Phase Recognition from Timestamp Supervision
- Title(参考訳): less is more:timetamp監督による手術段階認識
- Authors: Zixun Wang, Xinpeng Ding, Wei Zhao, Xiaomeng Li
- Abstract要約: 外科的位相認識にタイムスタンプを初めて導入した。
ナチュラルビデオの現在の手法は、フルフレームの擬似ラベルを生成することを目的としている。
本稿では,信頼に値する擬似ラベルを生成するための不確実性認識時間拡散法を提案する。
- 参考スコア(独自算出の注目度): 15.60519287243755
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Surgical phase recognition is a fundamental task in computer-assisted surgery
systems. Most existing works require expensive frame-wise annotations, which is
very time-consuming. In this paper, we introduce timestamp supervision to
surgical phase recognition for the first time, which only requires randomly
labeling one frame for each phase in a video. With timestamp supervision,
current methods in natural videos aim to generate pseudo labels of full frames.
However, due to the surgical videos containing ambiguous boundaries, these
methods would generate many noisy and inconsistent pseudo labels, leading to
limited performance. We argue that less is more in surgical phase
recognition,~\ie, less but discriminative pseudo labels outperform full but
ambiguous frames. To this end, we propose a novel method called
uncertainty-aware temporal diffusion to generate trustworthy pseudo labels. Our
approach evaluates the confidence of generated pseudo labels based on
uncertainty estimation. Then, we treat the annotated frames as anchors and make
pseudo labels diffuse to both sides, starting from anchors and stopping at the
high-uncertainty frames. In this way, our proposed method can generate
contiguous confident pseudo labels while discarding the uncertain ones.
Extensive experiments demonstrate that our method not only significantly save
annotation cost, but also outperforms fully supervised methods. Moreover, our
proposed approach can be used to clean noisy labels near boundaries and improve
the performance of the current surgical phase recognition methods.
- Abstract(参考訳): 手術相認識はコンピュータ支援手術システムの基本課題である。
既存の作業の多くは、高価なフレーム単位のアノテーションが必要です。
本稿では,ビデオの各位相に対して,ランダムに1フレームをラベル付けするだけで,外科的位相認識にタイムスタンプを初めて導入する。
タイムスタンプの監督により、現在の自然ビデオの方法は、フルフレームの擬似ラベルを生成することを目的としている。
しかし、曖昧な境界を含む手術ビデオのため、これらの手法は多くのノイズと一貫性のない擬似ラベルを生成し、性能を制限した。
外科的位相認識では, より少ないが差別的な擬似ラベルは, 完全だがあいまいなフレームよりも優れていた。
そこで本研究では,信頼に値する擬似ラベルを生成するための不確実性認識時間拡散法を提案する。
本手法は, 不確実性推定に基づく疑似ラベルの信頼度を評価する。
次に、アノテーション付きフレームをアンカーとして扱い、疑似ラベルを両サイドに拡散させ、アンカーから高精度フレームに停止させる。
このようにして,提案手法は不確かさを排除しつつ,確実な疑似ラベルを生成することができる。
広範な実験により,提案手法はアノテーションのコストを大幅に削減するだけでなく,完全に教師付きメソッドよりも優れていることが示された。
また,提案手法は境界付近のノイズラベルを浄化し,現在の外科的位相認識法の性能を向上させることができる。
関連論文リスト
- FinePseudo: Improving Pseudo-Labelling through Temporal-Alignablity for Semi-Supervised Fine-Grained Action Recognition [57.17966905865054]
実生活における行動認識の応用は、しばしば微妙な動きのきめ細かい理解を必要とする。
既存の半教師ありアクション認識は主に粗いアクション認識に焦点を当てている。
そこで我々は,微粒なアクションペアの識別を効果的に行うための,アライナビリティ検証に基づくメトリック学習手法を提案する。
論文 参考訳(メタデータ) (2024-09-02T20:08:06Z) - Robust Surgical Phase Recognition From Annotation Efficient Supervision [1.1510009152620668]
本稿では,欠落した位相アノテーションを効果的に扱える外科的位相認識のためのロバストな手法を提案する。
ビデオあたり3つの注釈付きフレームのみを用いて,MultiBypass140データセット上で85.1%の精度を実現する。
本研究は,外科的ワークフロー認識の進歩に寄与し,より効率的かつ信頼性の高い外科的位相認識システムの実現に寄与する。
論文 参考訳(メタデータ) (2024-06-26T16:47:31Z) - GLSFormer : Gated - Long, Short Sequence Transformer for Step
Recognition in Surgical Videos [57.93194315839009]
本稿では,シーケンスレベルのパッチから時間的特徴を直接学習するための視覚変換器に基づくアプローチを提案する。
本研究では,白内障手術用ビデオデータセットである白内障-101とD99に対するアプローチを広範に評価し,各種の最先端手法と比較して優れた性能を示した。
論文 参考訳(メタデータ) (2023-07-20T17:57:04Z) - Unsupervised Word Segmentation Using Temporal Gradient Pseudo-Labels [35.458787162722665]
近年の深層自己監督機能は単語セグメンテーションに非常に有効であるが,分類ヘッドの訓練には指導が必要であることが示唆された。
教師なし単語セグメンテーションにその効果を拡大するため,擬似ラベル方式を提案する。
その単純さと高速な実行時間にもかかわらず、我々の手法は2つのデータセット上で以前の方法よりも大幅に優れていた。
論文 参考訳(メタデータ) (2023-03-30T17:59:46Z) - Timestamp-Supervised Action Segmentation from the Perspective of
Clustering [12.661218632080207]
既存のほとんどの手法は、各ビデオ内のすべてのフレームに対して擬似ラベルを生成し、セグメンテーションモデルを訓練する。
本稿では,クラスタリングの観点から,以下の2つの部分を含む新しいフレームワークを提案する。
反復クラスタリングは、クラスタリングによって擬似ラベルをあいまいな間隔に反復的に伝播し、擬似ラベルシーケンスを更新してモデルをトレーニングする。
論文 参考訳(メタデータ) (2022-12-22T13:35:00Z) - Exploiting Completeness and Uncertainty of Pseudo Labels for Weakly
Supervised Video Anomaly Detection [149.23913018423022]
弱教師付きビデオ異常検出は、ビデオレベルのラベルのみを用いて、ビデオ内の異常事象を特定することを目的としている。
2段階の自己学習法は擬似ラベルの自己生成によって著しく改善されている。
本稿では,自己学習のための完全性と不確実性を利用した強化フレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-08T05:53:53Z) - A Generalized & Robust Framework For Timestamp Supervision in Temporal
Action Segmentation [79.436224998992]
時間的アクションセグメンテーションでは、Timestampの監督はビデオシーケンスごとにわずかにラベル付きフレームを必要とする。
本稿では,未ラベルフレームのラベルの不確実性を利用した期待最大化に基づく新しい手法を提案する。
提案手法はSOTA結果を生成し,複数のメトリクスやデータセットの完全教師付き設定を超えている。
論文 参考訳(メタデータ) (2022-07-20T18:30:48Z) - Pseudo-label Guided Cross-video Pixel Contrast for Robotic Surgical
Scene Segmentation with Limited Annotations [72.15956198507281]
シーンセグメンテーションを促進するために,新しい擬似ラベル付きクロスビデオコントラスト学習法であるPGV-CLを提案する。
本研究では,ロボット外科手術データセットEndoVis18と白内障手術データセットCaDISについて検討した。
論文 参考訳(メタデータ) (2022-07-20T05:42:19Z) - Refining Pseudo Labels with Clustering Consensus over Generations for
Unsupervised Object Re-identification [84.72303377833732]
教師なしのオブジェクト再識別は、アノテーションなしでオブジェクト検索のための識別表現を学習することを目的としている。
本稿では,クラスタリングコンセンサスを用いた連続学習世代間の擬似ラベル類似性を推定し,時間的に伝播およびアンサンブルされた擬似ラベルを用いた洗練された擬似ラベルを提案する。
提案する擬似ラベル精錬戦略は単純だが有効であり、既存のクラスタリングに基づく教師なし再同定手法にシームレスに統合することができる。
論文 参考訳(メタデータ) (2021-06-11T02:42:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。