論文の概要: Learning from Single Timestamps: Complexity Estimation in Laparoscopic Cholecystectomy
- arxiv url: http://arxiv.org/abs/2511.04525v1
- Date: Thu, 06 Nov 2025 16:39:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-07 20:17:53.507036
- Title: Learning from Single Timestamps: Complexity Estimation in Laparoscopic Cholecystectomy
- Title(参考訳): 腹腔鏡下胆嚢摘出術における単一タイムスタンプからの学習
- Authors: Dimitrios Anastasiou, Santiago Barbarisi, Lucy Culshaw, Jayna Patel, Evangelos B. Mazomenos, Imanol Luengo, Danail Stoyanov,
- Abstract要約: STC-Netは,腹腔鏡下胆嚢摘出術(LC)ビデオにおける単一タイムスタンプによる複雑度推定のための新しいフレームワークである。
時間的監督の弱い下でビデオを直接操作する。
精度は62.11%、F1スコアは61.42%で、非局在化ベースラインを上回っている。
- 参考スコア(独自算出の注目度): 8.637329291879162
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Purpose: Accurate assessment of surgical complexity is essential in Laparoscopic Cholecystectomy (LC), where severe inflammation is associated with longer operative times and increased risk of postoperative complications. The Parkland Grading Scale (PGS) provides a clinically validated framework for stratifying inflammation severity; however, its automation in surgical videos remains largely unexplored, particularly in realistic scenarios where complete videos must be analyzed without prior manual curation. Methods: In this work, we introduce STC-Net, a novel framework for SingleTimestamp-based Complexity estimation in LC via the PGS, designed to operate under weak temporal supervision. Unlike prior methods limited to static images or manually trimmed clips, STC-Net operates directly on full videos. It jointly performs temporal localization and grading through a localization, window proposal, and grading module. We introduce a novel loss formulation combining hard and soft localization objectives and background-aware grading supervision. Results: Evaluated on a private dataset of 1,859 LC videos, STC-Net achieves an accuracy of 62.11% and an F1-score of 61.42%, outperforming non-localized baselines by over 10% in both metrics and highlighting the effectiveness of weak supervision for surgical complexity assessment. Conclusion: STC-Net demonstrates a scalable and effective approach for automated PGS-based surgical complexity estimation from full LC videos, making it promising for post-operative analysis and surgical training.
- Abstract(参考訳): 目的:腹腔鏡下胆嚢摘出術(LC:Laparoscopic Cholecystectomy, LLC)では, 術後合併症のリスクが高く, 術後の長期経過と重度の炎症が関連している。
パークランド・グラディング・スケール(PGS)は、炎症の重症度を成すための臨床的に検証された枠組みを提供するが、手術ビデオにおけるその自動化は、特に手作業による治験なしに、完全なビデオを解析しなければならない現実的なシナリオにおいて、ほとんど解明されていない。
方法:本研究では,STC-Netを紹介した。STC-NetはLCにおけるSingleTimestampベースの複雑度推定のための新しいフレームワークである。
静的画像や手動でトリミングされたクリップに制限された以前の方法とは異なり、STC-Netはフルビデオで直接動作する。
時間的ローカライゼーションとグレーディングを共同で実行し、ローカライゼーション、ウィンドウプロポーザル、グレーディングモジュールを経由する。
ハードとソフトのローカライゼーション目標とバックグラウンド・アウェア・グレーディング・インシュアランスを組み合わせた新しい損失定式化を提案する。
結果: STC-Netは1,859 LCビデオのプライベートデータセットに基づいて62.11%の精度と61.42%のF1スコアを達成し, どちらも非局在化ベースラインを10%以上上回った。
結論: STC-Netは全LCビデオからPGSベースの外科的複雑度の自動推定をスケーラブルかつ効果的に行う方法を示し, 術後分析と手術訓練に有効である。
関連論文リスト
- Detection-Gated Glottal Segmentation with Zero-Shot Cross-Dataset Transfer and Clinical Feature Extraction [0.0]
YOLOv8ベースの検出器とU-Netセグメンタを統合した検出ゲートパイプラインを提案する。
モデルは、GIRAFEデータセット(600フレーム)の限られたサブセットに基づいてトレーニングされ、大規模なBAGLSデータセット上でゼロショット転送によって評価された。
論文 参考訳(メタデータ) (2026-03-02T17:05:41Z) - Surgical Foundation Model Leveraging Compression and Entropy Maximization for Image-Guided Surgical Assistance [50.486523249499115]
低侵襲手術(MIS)におけるリアルタイム映像理解の重要性
手術ビデオからコンパクトで情報的表現を学習するための,新しい自己教師型フレームワークであるCompress-to-Explore (C2E)を提案する。
C2Eは、エントロピー最大化デコーダを使用して、臨床的に関連する詳細を保持しながら画像を圧縮し、ラベル付きデータなしでエンコーダのパフォーマンスを向上させる。
論文 参考訳(メタデータ) (2025-05-16T14:02:24Z) - Surgeons vs. Computer Vision: A comparative analysis on surgical phase recognition capabilities [65.66373425605278]
自動手術相認識(SPR)は、人工知能(AI)を使用して、手術ワークフローをその重要なイベントに分割する。
従来の研究は、短い外科手術と直線的な外科手術に焦点を合わせており、時間的文脈が手術の段階をよりよく分類する専門家の能力に影響を与えるかどうかを探索していない。
本研究は,ロボットによる部分腎切除(RAPN)を高度に非直線的に行うことに焦点を当て,これらのギャップに対処する。
論文 参考訳(メタデータ) (2025-04-26T15:37:22Z) - Revisiting the Evaluation Bias Introduced by Frame Sampling Strategies in Surgical Video Segmentation Using SAM2 [1.0536099636804035]
アノテーション密度とフレームレートサンプリングの不整合がゼロショットセグメンテーションモデルの評価に与える影響について検討する。
フレームレートの低下は,時間的不整合を隠蔽するスムーズな効果により,より高いフレームレートを達成できることがわかった。
リアルタイムストリーミング条件で評価すると、フレームレートが高いとセグメンテーション安定性が向上する。
論文 参考訳(メタデータ) (2025-02-28T10:42:09Z) - Early Operative Difficulty Assessment in Laparoscopic Cholecystectomy via Snapshot-Centric Video Analysis [3.104121871683839]
限定的なビデオ観察による早期LCOD評価の臨床的課題を提案する。
我々は,グローバルな時間分解能と局所的な時間分解能から特徴を分析し,LCODを評価する深層学習モデルであるSurgPrODを設計する。
ビデオレベルのLCODラベルを特徴とするColeScoreデータセットを導入し,本手法の有効性を検証した。
論文 参考訳(メタデータ) (2025-02-10T20:14:01Z) - SPRMamba: Surgical Phase Recognition for Endoscopic Submucosal Dissection with Mamba [6.531066045206769]
リアルタイムの外科的位相認識のための新しいフレームワークであるSPRMambaを提案する。
MambaアーキテクチャとScaled Residual TranMambaブロックを統合して、時間的モデリングと局所的な詳細抽出を相乗化する。
最先端のパフォーマンス(ESD385では87.64%、以前の方法では1.0%)を達成し、外科手術全体にわたって堅牢な一般化性を示す。
論文 参考訳(メタデータ) (2024-09-18T16:26:56Z) - Automated Assessment of Critical View of Safety in Laparoscopic
Cholecystectomy [51.240181118593114]
胆嚢摘出術(胆嚢摘出術)は米国で最も一般的な手術の一つで、年間1.2万回以上の手術が施行されている。
LCは胆管損傷(BDI)の増加と関連しており、致死率と死亡率が高い。
本稿では,LCにおける安全性評価(CVS)の自動化を目的とした深層学習手法を提案する。
論文 参考訳(メタデータ) (2023-09-13T22:01:36Z) - Phase-Specific Augmented Reality Guidance for Microscopic Cataract
Surgery Using Long-Short Spatiotemporal Aggregation Transformer [14.568834378003707]
乳化白内障手術(英: Phaemulsification cataract surgery, PCS)は、外科顕微鏡を用いた外科手術である。
PCS誘導システムは、手術用顕微鏡映像から貴重な情報を抽出し、熟練度を高める。
既存のPCSガイダンスシステムでは、位相特異なガイダンスに悩まされ、冗長な視覚情報に繋がる。
本稿では,認識された手術段階に対応するAR情報を提供する,新しい位相特異的拡張現実(AR)誘導システムを提案する。
論文 参考訳(メタデータ) (2023-09-11T02:56:56Z) - LoViT: Long Video Transformer for Surgical Phase Recognition [59.06812739441785]
短時間・長期の時間情報を融合する2段階のLong Video Transformer(LoViT)を提案する。
このアプローチは、Colec80とAutoLaparoデータセットの最先端メソッドを一貫して上回る。
論文 参考訳(メタデータ) (2023-05-15T20:06:14Z) - Real-time landmark detection for precise endoscopic submucosal
dissection via shape-aware relation network [51.44506007844284]
内視鏡下粘膜下郭清術における高精度かつリアルタイムなランドマーク検出のための形状認識型関係ネットワークを提案する。
まず,ランドマーク間の空間的関係に関する先行知識を直感的に表現する関係キーポイント・ヒートマップを自動生成するアルゴリズムを考案する。
次に、事前知識を学習プロセスに段階的に組み込むために、2つの補完的な正規化手法を開発する。
論文 参考訳(メタデータ) (2021-11-08T07:57:30Z) - LRTD: Long-Range Temporal Dependency based Active Learning for Surgical
Workflow Recognition [67.86810761677403]
本稿では,費用対効果の高い手術ビデオ解析のための新しい能動的学習法を提案する。
具体的には,非局所的再帰的畳み込みネットワーク (NL-RCNet) を提案する。
手術ワークフロー認識タスクを実行することで,大規模な手術ビデオデータセット(Cholec80)に対するアプローチを検証する。
論文 参考訳(メタデータ) (2020-04-21T09:21:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。