論文の概要: SurgPhase: Time efficient pituitary tumor surgery phase recognition via an interactive web platform
- arxiv url: http://arxiv.org/abs/2603.24897v1
- Date: Thu, 26 Mar 2026 00:22:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-27 20:52:48.026765
- Title: SurgPhase: Time efficient pituitary tumor surgery phase recognition via an interactive web platform
- Title(参考訳): SurgPhase: インタラクティブWebプラットフォームによる時間効率な下垂体腫瘍手術フェーズ認識
- Authors: Yan Meng, Jack Cook, X. Y. Han, Kaan Duman, Shauna Otto, Dhiraj Pangal, Jonathan Chainey, Ruth Lau, Margaux Masson-Forsythe, Daniel A. Donoho, Danielle Levy, Gabriel Zada, Sébastien Froelich, Juan Fernandez-Miranda, Mike Chang,
- Abstract要約: 下垂体腫瘍手術(PTS)ビデオにおける位相認識のための包括的枠組みを提案する。
提案手法はホールドアウトテストセットにおいて90%の精度を達成し,現在の最先端手法よりも優れていた。
この研究の中心的な貢献は、外科医が手術ビデオをアップロードするために設計された協調的なオンラインプラットフォームの統合である。
- 参考スコア(独自算出の注目度): 4.1977714530157435
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Accurate surgical phase recognition is essential for analyzing procedural workflows, supporting intraoperative decision-making, and enabling data-driven improvements in surgical education and performance evaluation. In this work, we present a comprehensive framework for phase recognition in pituitary tumor surgery (PTS) videos, combining self-supervised representation learning, robust temporal modeling, and scalable data annotation strategies. Our method achieves 90\% accuracy on a held-out test set, outperforming current state-of-the-art approaches and demonstrating strong generalization across variable surgical cases. A central contribution of this work is the integration of a collaborative online platform designed for surgeons to upload surgical videos, receive automated phase analysis, and contribute to a growing dataset. This platform not only facilitates large-scale data collection but also fosters knowledge sharing and continuous model improvement. To address the challenge of limited labeled data, we pretrain a ResNet-50 model using the self-supervised framework on 251 unlabeled PTS videos, enabling the extraction of high-quality feature representations. Fine-tuning is performed on a labeled dataset of 81 procedures using a modified training regime that incorporates focal loss, gradual layer unfreezing, and dynamic sampling to address class imbalance and procedural variability.
- Abstract(参考訳): 外科的段階の正確な認識は、手続き的ワークフローを解析し、術中意思決定をサポートし、外科教育におけるデータ駆動的改善とパフォーマンス評価を可能にするために不可欠である。
本研究では,下垂体腫瘍手術(PTS)ビデオにおける位相認識のための包括的フレームワークを提案する。
提案手法は, ホールドアウトテストセットにおいて90%の精度を達成し, 最先端のアプローチより優れ, 各種手術症例にまたがる強力な一般化を実証する。
この研究の中心的な貢献は、外科医が手術ビデオをアップロードし、自動フェーズ分析を受け、成長するデータセットに貢献するために設計された協調的なオンラインプラットフォームの統合である。
このプラットフォームは大規模なデータ収集を促進するだけでなく、知識共有と継続的モデルの改善を促進する。
制限付きラベル付きデータの課題に対処するため,251個の未ラベルPTSビデオ上で,自己教師型フレームワークを用いてResNet-50モデルを事前訓練し,高品質な特徴表現の抽出を可能にする。
微調整は、焦点損失、段階的な層凍結、クラス不均衡と手続き的変動に対処するための動的サンプリングを含む改良されたトレーニングシステムを用いて、81の手順のラベル付きデータセット上で実施される。
関連論文リスト
- Data-Efficient Learning for Generalizable Surgical Video Understanding [0.0]
本研究は, 深層学習に基づく外科的ビデオ解析と実世界の臨床環境とのギャップを埋めることを目的としている。
私は最先端のニューラルネットワークアーキテクチャをベンチマークして、各タスクの最も効果的な設計を特定しました。
我々は,大量の未ラベルの手術ビデオを活用することにより,タスク間のモデル性能を向上させる半駆動型フレームワークを開発した。
論文 参考訳(メタデータ) (2025-08-13T22:00:23Z) - ClipGS: Clippable Gaussian Splatting for Interactive Cinematic Visualization of Volumetric Medical Data [51.095474325541794]
医用データのインタラクティブなシネマティック可視化のためのクリッピングプレーンを備えた革新的なガウススプレイティングフレームワークであるClipGSを紹介した。
本手法を5つのボリューム医療データで検証し,平均36.635 PSNRレンダリング品質を156 FPS,16.1MBモデルサイズで達成した。
論文 参考訳(メタデータ) (2025-07-09T08:24:28Z) - SemiVT-Surge: Semi-Supervised Video Transformer for Surgical Phase Recognition [2.764986157003598]
本稿では,ロバストな擬似ラベリングフレームワークを用いたビデオトランスフォーマーモデルを提案する。
ラベルなしデータを組み込むことで,RAMIEの最先端性能が4.9%向上した。
本研究は半教師的外科的位相認識のための強力なベンチマークを確立した。
論文 参考訳(メタデータ) (2025-06-02T09:32:12Z) - Surgical Foundation Model Leveraging Compression and Entropy Maximization for Image-Guided Surgical Assistance [50.486523249499115]
低侵襲手術(MIS)におけるリアルタイム映像理解の重要性
手術ビデオからコンパクトで情報的表現を学習するための,新しい自己教師型フレームワークであるCompress-to-Explore (C2E)を提案する。
C2Eは、エントロピー最大化デコーダを使用して、臨床的に関連する詳細を保持しながら画像を圧縮し、ラベル付きデータなしでエンコーダのパフォーマンスを向上させる。
論文 参考訳(メタデータ) (2025-05-16T14:02:24Z) - AI-Powered Automated Model Construction for Patient-Specific CFD Simulations of Aortic Flows [8.062885940500259]
本研究では,医用画像からシミュレーション可能な血管モデルを作成するためのディープラーニングフレームワークを提案する。
提案手法は,手作業や処理時間を著しく削減しつつ,セグメンテーションとメッシュ品質の最先端性能を示す。
論文 参考訳(メタデータ) (2025-03-16T14:18:25Z) - GLSFormer : Gated - Long, Short Sequence Transformer for Step
Recognition in Surgical Videos [57.93194315839009]
本稿では,シーケンスレベルのパッチから時間的特徴を直接学習するための視覚変換器に基づくアプローチを提案する。
本研究では,白内障手術用ビデオデータセットである白内障-101とD99に対するアプローチを広範に評価し,各種の最先端手法と比較して優れた性能を示した。
論文 参考訳(メタデータ) (2023-07-20T17:57:04Z) - ARST: Auto-Regressive Surgical Transformer for Phase Recognition from
Laparoscopic Videos [2.973286445527318]
自然言語処理における逐次データモデリングのために提案されたTransformerは,外科的位相認識に成功している。
本研究では, 腹腔鏡下画像からのオンライン手術位相認識のために, ARSTと呼ばれる自動回帰手術変換器が最初に提案されている。
論文 参考訳(メタデータ) (2022-09-02T16:05:39Z) - Dissecting Self-Supervised Learning Methods for Surgical Computer Vision [51.370873913181605]
一般のコンピュータビジョンコミュニティでは,自己監視学習(SSL)手法が普及し始めている。
医学や手術など、より複雑で影響力のある領域におけるSSLメソッドの有効性は、限定的かつ未調査のままである。
外科的文脈理解,位相認識,ツール存在検出の2つの基本的なタスクに対して,これらの手法の性能をColec80データセット上で広範囲に解析する。
論文 参考訳(メタデータ) (2022-07-01T14:17:11Z) - Surgical Phase Recognition in Laparoscopic Cholecystectomy [57.929132269036245]
本稿では,2段階推論パイプラインのキャリブレーションされた信頼度スコアを利用するTransformerに基づく手法を提案する。
提案手法はColec80データセットのベースラインモデルよりも優れており,様々なアクションセグメンテーション手法に適用できる。
論文 参考訳(メタデータ) (2022-06-14T22:55:31Z) - Automatic Data Augmentation via Deep Reinforcement Learning for
Effective Kidney Tumor Segmentation [57.78765460295249]
医用画像セグメンテーションのための新しい学習ベースデータ拡張法を開発した。
本手法では,データ拡張モジュールと後続のセグメンテーションモジュールをエンドツーエンドのトレーニング方法で一貫した損失と,革新的に組み合わせる。
提案法の有効性を検証したCT腎腫瘍分節法について,本法を広範囲に評価した。
論文 参考訳(メタデータ) (2020-02-22T14:10:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。