Fugu-MT 論文翻訳(概要): WeakSurg: Weakly supervised surgical instrument segmentation using temporal equivariance and semantic continuity

論文の概要: WeakSurg: Weakly supervised surgical instrument segmentation using temporal equivariance and semantic continuity

arxiv url: http://arxiv.org/abs/2403.09551v2
Date: Mon, 30 Sep 2024 07:46:29 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-03 23:11:55.715806
Title: WeakSurg: Weakly supervised surgical instrument segmentation using temporal equivariance and semantic continuity
Title（参考訳）: WeakSurg : 時間的等比と意味的連続性を用いた弱監督型手術器具セグメンテーション
Authors: Qiyuan Wang, Yanzhe Liu, Shang Zhao, Rong Liu, S. Kevin Zhou,
Abstract要約: 本稿では,楽器の有無ラベルのみを付与した手術器具セグメンテーションを提案する。手術ビデオの時間的特性を考慮し,2段階の弱教師付きセグメンテーションパラダイムを拡張した。 1つの胆嚢摘出手術ベンチマークと1つの実際のロボット左外側肝外科手術データセットを含む2つの手術ビデオデータセットで実験が検証されている。
参考スコア（独自算出の注目度）: 14.448593791011204
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: For robotic surgical videos, instrument presence annotations are typically recorded with video streams, which offering the potential to reduce the manually annotated costs for segmentation. However, weakly supervised surgical instrument segmentation with only instrument presence labels has been rarely explored in surgical domain due to the highly under-constrained challenges. Temporal properties can enhance representation learning by capturing sequential dependencies and patterns over time even in incomplete supervision situations. From this, we take the inherent temporal attributes of surgical video into account and extend a two-stage weakly supervised segmentation paradigm from different perspectives. Firstly, we make temporal equivariance constraint to enhance pixel-wise temporal consistency between adjacent features. Secondly, we constrain class-aware semantic continuity between global and local regions across temporal dimension. Finally, we generate temporal-enhanced pseudo masks from consecutive frames to suppress irrelevant regions. Extensive experiments are validated on two surgical video datasets, including one cholecystectomy surgery benchmark and one real robotic left lateral segment liver surgery dataset. We annotate instance-wise instrument labels with fixed time-steps which are double checked by a clinician with 3-years experience to evaluate segmentation results. Experimental results demonstrate the promising performances of our method, which consistently achieves comparable or favorable results with previous state-of-the-art approaches.
Abstract（参考訳）: ロボットの手術ビデオの場合、楽器の存在アノテーションは典型的にビデオストリームで記録されるため、セグメンテーションのための手作業による注釈付きコストを削減できる。しかし, 極めて制約の少ない手術領域では, 楽器ラベルのみを用いた手術器具のセグメンテーションがほとんど行われていない。時間的特性は、不完全な監督状況であっても、連続的な依存関係やパターンを時間とともにキャプチャすることで、表現学習を強化することができる。そこで我々は,手術ビデオの時間的特性を考慮に入れ,異なる視点から2段階の弱教師付きセグメンテーションパラダイムを拡張した。まず,隣接した特徴間の画素方向の時間的整合性を高めるために時間的等角性制約を行う。第2に,時間的次元を越えたグローバル領域とローカル領域間のクラス認識のセマンティック連続性を制約する。最後に、連続するフレームから時間的強調仮面を生成し、無関係な領域を抑える。 1つの胆嚢摘出術のベンチマークと1つの実際のロボット左外側肝外科のデータセットを含む2つの手術ビデオデータセットで、広範囲な実験が検証されている。本研究は,3年間の経験を持つ臨床医が2回検査し,セグメンテーション結果を評価する,固定時間ステップのインスタンスワイド・インスツルメンツ・ラベルをアノテートする。実験により提案手法の有望な性能を実証し, 従来手法と同等あるいは好意的な結果が得られることを示した。

関連論文リスト

Multi-Stage Boundary-Aware Transformer Network for Action Segmentation in Untrimmed Surgical Videos [0.1053373860696675]
階層的スライディングウィンドウアテンションを有するマルチステージ境界対応変圧器ネットワーク(MSBATN)を提案する。提案手法は,動作分類と境界検出を独立に独立なタスクとして扱う新しい統合的損失関数を取り入れたものである。境界投票機構はコンテキスト情報を利用して開始点と終了点を正確に識別する。
論文参考訳（メタデータ） (2025-04-26T01:07:56Z)
Temporal Propagation of Asymmetric Feature Pyramid for Surgical Scene Segmentation [7.150163844454341]
手術シーンのセグメンテーションは,ロボットによる腹腔鏡下手術理解に不可欠である。現在のアプローチでは、(i)静的な画像制限ときめ細かい構造的詳細という2つの課題に直面している。クロスフレーム特徴伝搬を実現する双方向アテンションアーキテクチャである時間非対称特徴伝搬ネットワークを提案する。本フレームワークは外科的シーン理解のための時間的指導と文脈的推論の両方を可能にする。
論文参考訳（メタデータ） (2025-04-18T03:41:23Z)
Less is More? Revisiting the Importance of Frame Rate in Real-Time Zero-Shot Surgical Video Segmentation [1.0536099636804035]
胆嚢摘出術におけるフレームレートがゼロショット手術ビデオセグメンテーションに及ぼす影響について検討し,複数のフレームサンプリングレートでSAM2の有効性を評価した。意外なことに,従来の評価設定では,フレームレートが1秒あたりの1フレームあたりのフレームレートが25FPSを上回ることが示唆された。リアルタイムストリーミングのシナリオでは、高いフレームレートが時間的コヒーレンスと安定性を、特に外科的把握器のような動的対象に対して向上させる。
論文参考訳（メタデータ） (2025-02-28T10:42:09Z)
LACOSTE: Exploiting stereo and temporal contexts for surgical instrument segmentation [14.152207010509763]
ステレオ画像とテンポラル画像の位置情報を併用した新しいLACOSTEモデルを提案し,手術器具のセグメンテーションを改善した。我々は3つの公開手術ビデオデータセットに対するアプローチを広範囲に検証した。
論文参考訳（メタデータ） (2024-09-14T08:17:56Z)
Real-time guidewire tracking and segmentation in intraoperative x-ray [52.51797358201872]
リアルタイムガイドワイヤ分割と追跡のための2段階のディープラーニングフレームワークを提案する。第1段階では、ヨロフ5検出器が元のX線画像と合成画像を使って訓練され、ターゲットのガイドワイヤのバウンディングボックスを出力する。第2段階では、検出された各バウンディングボックスにガイドワイヤを分割するために、新規で効率的なネットワークが提案されている。
論文参考訳（メタデータ） (2024-04-12T20:39:19Z)
Weakly-Supervised Learning via Multi-Lateral Decoder Branching for Guidewire Segmentation in Robot-Assisted Cardiovascular Catheterization [4.894147633944561]
心臓血管造影検査におけるツールセグメンテーションのための多面的擬似ラベリングを用いた弱教師付き学習法を提案する。我々は,ロボット心カテーテル手術中に得られた弱注釈データを用いて,エンドツーエンドのモデルを訓練した。従来の3種類の心血管造影法と比較して,3種類の心血管造影データに対して高いセグメンテーション性能を示した。
論文参考訳（メタデータ） (2024-04-11T09:23:44Z)
Visual-Kinematics Graph Learning for Procedure-agnostic Instrument Tip Segmentation in Robotic Surgeries [29.201385352740555]
そこで我々は,様々な外科手術を施した楽器の先端を正確に分類する新しいビジュアル・キネマティクスグラフ学習フレームワークを提案する。具体的には、画像とキネマティクスの両方から楽器部品のリレーショナル特徴を符号化するグラフ学習フレームワークを提案する。クロスモーダル・コントラッシブ・ロスは、キネマティクスからチップセグメンテーションのイメージへの頑健な幾何学的先行を組み込むように設計されている。
論文参考訳（メタデータ） (2023-09-02T14:52:58Z)
GLSFormer : Gated - Long, Short Sequence Transformer for Step Recognition in Surgical Videos [57.93194315839009]
本稿では,シーケンスレベルのパッチから時間的特徴を直接学習するための視覚変換器に基づくアプローチを提案する。本研究では,白内障手術用ビデオデータセットである白内障-101とD99に対するアプローチを広範に評価し,各種の最先端手法と比較して優れた性能を示した。
論文参考訳（メタデータ） (2023-07-20T17:57:04Z)
LoViT: Long Video Transformer for Surgical Phase Recognition [59.06812739441785]
短時間・長期の時間情報を融合する2段階のLong Video Transformer(LoViT)を提案する。このアプローチは、Colec80とAutoLaparoデータセットの最先端メソッドを一貫して上回る。
論文参考訳（メタデータ） (2023-05-15T20:06:14Z)
TraSeTR: Track-to-Segment Transformer with Contrastive Query for Instance-level Instrument Segmentation in Robotic Surgery [60.439434751619736]
そこで我々は,TraSeTRを提案する。TraSeTR,TraSeTR,Trace-to-Segment Transformerは,手術器具のセグメンテーションを支援する。 TraSeTRは、機器の種類、位置、アイデンティティとインスタンスレベルの予測を共同で理由付けている。提案手法の有効性を,3つの公開データセットに対して,最先端の計器型セグメンテーション結果を用いて実証した。
論文参考訳（メタデータ） (2022-02-17T05:52:18Z)
Efficient Global-Local Memory for Real-time Instrument Segmentation of Robotic Surgical Video [53.14186293442669]
手術器具の知覚における重要な手がかりとして,隣接するフレームからの局所的時間依存性と,長距離における大域的意味的相関があげられる。本稿では,グローバルとローカルの両方の時間的知識を関連付ける新しいデュアルメモリネットワーク(DMNet)を提案する。本手法は,実時間速度を維持しながらセグメント化精度を向上する手法である。
論文参考訳（メタデータ） (2021-09-28T10:10:14Z)
Learning Motion Flows for Semi-supervised Instrument Segmentation from Robotic Surgical Video [64.44583693846751]
本研究は,スパースアノテーションを用いたロボット手術ビデオから半教師楽器のセグメンテーションについて検討する。生成されたデータペアを利用することで、我々のフレームワークはトレーニングシーケンスの時間的一貫性を回復し、強化することができます。その結果,本手法は最先端の半教師あり手法よりも大きなマージンで優れていることがわかった。
論文参考訳（メタデータ） (2020-07-06T02:39:32Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。