論文の概要: ProstaTD: Bridging Surgical Triplet from Classification to Fully Supervised Detection
- arxiv url: http://arxiv.org/abs/2506.01130v3
- Date: Sat, 27 Sep 2025 03:37:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 11:50:46.795885
- Title: ProstaTD: Bridging Surgical Triplet from Classification to Fully Supervised Detection
- Title(参考訳): ProstaTD: 外科的トリプレットの分類から完全監視検出へ
- Authors: Yiliang Chen, Zhixi Li, Cheng Xu, Alex Qinyang Liu, Ruize Cui, Xuemiao Xu, Jeremy Yuen-Chun Teoh, Shengfeng He, Jing Qin,
- Abstract要約: ProstaTDは、ロボット補助前立腺切除術の技術的要求領域から開発された、外科的三重項検出のための大規模なデータセットである。
このデータセットは、71,775の動画フレームと196,490の注釈付きトリプルトインスタンスで構成され、複数の機関で実施された21の手術から収集された。
ProstaTDは、これまでで最大かつ最も多様な3重項データセットであり、単純な分類から正確な空間的境界と時間的境界を持つ完全な検出へとフィールドを移動している。
- 参考スコア(独自算出の注目度): 54.270188252068145
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Surgical triplet detection is a critical task in surgical video analysis. However, existing datasets like CholecT50 lack precise spatial bounding box annotations, rendering triplet classification at the image level insufficient for practical applications. The inclusion of bounding box annotations is essential to make this task meaningful, as they provide the spatial context necessary for accurate analysis and improved model generalizability. To address these shortcomings, we introduce ProstaTD, a large-scale, multi-institutional dataset for surgical triplet detection, developed from the technically demanding domain of robot-assisted prostatectomy. ProstaTD offers clinically defined temporal boundaries and high-precision bounding box annotations for each structured triplet activity. The dataset comprises 71,775 video frames and 196,490 annotated triplet instances, collected from 21 surgeries performed across multiple institutions, reflecting a broad range of surgical practices and intraoperative conditions. The annotation process was conducted under rigorous medical supervision and involved more than 60 contributors, including practicing surgeons and medically trained annotators, through multiple iterative phases of labeling and verification. To further facilitate future general-purpose surgical annotation, we developed two tailored labeling tools to improve efficiency and scalability in our annotation workflows. In addition, we created a surgical triplet detection evaluation toolkit that enables standardized and reproducible performance assessment across studies. ProstaTD is the largest and most diverse surgical triplet dataset to date, moving the field from simple classification to full detection with precise spatial and temporal boundaries and thereby providing a robust foundation for fair benchmarking.
- Abstract(参考訳): 外科的三重項検出は, 外科的ビデオ解析において重要な課題である。
しかし、CholecT50のような既存のデータセットには正確な空間境界ボックスアノテーションが欠けており、実用的な用途では画像レベルでのトリプルト分類が不十分である。
厳密な分析とモデル一般化性の改善に必要な空間的コンテキストを提供するため、バウンディングボックスアノテーションの導入は、このタスクを有意義にするために不可欠である。
これらの問題点に対処するために,ロボット補助前立腺切除術の技術的要求領域から開発された,外科的三重項検出のための大規模多施設データセットであるProstaTDを紹介する。
ProstaTDは、臨床的に定義された時間境界と、構造化三重項のアクティビティに対して高精度なバウンディングボックスアノテーションを提供する。
このデータセットは71,775の動画フレームと196,490の注釈付きトリプルトインスタンスで構成され、複数の施設で行われている21の手術から収集され、幅広い外科的プラクティスと術中状況が反映されている。
このアノテーションプロセスは、厳格な医療監督の下で実施され、複数の反復的なラベル付けと検証のフェーズを通じて、外科医や医学的に訓練された注釈作成者を含む60人以上のコントリビュータが関与した。
将来の汎用的な外科的アノテーションをより容易にするために,アノテーションワークフローの効率性と拡張性を改善するための2つのラベル付けツールを開発した。
さらに, 手術用三重項検出評価ツールキットを作成し, 研究全体の標準化と再現性の評価を可能にした。
ProstaTDは、これまでで最大かつ最も多様な手術用3重項データセットであり、フィールドを単純な分類から正確な空間的および時間的境界による完全な検出に移行し、公正なベンチマークのための堅牢な基盤を提供する。
関連論文リスト
- Comparative validation of surgical phase recognition, instrument keypoint estimation, and instrument instance segmentation in endoscopy: Results of the PhaKIR 2024 challenge [27.48982385201173]
3つの医療機関から収集した腹腔鏡下胆嚢摘出術13例からなる新しいデータセットについて紹介した。
既存のデータセットとは異なり、同じデータ内の機器の局所化と手続き的コンテキストを共同で調べることができる。
バイオメディカル画像解析の課題に対するBIASガイドラインに従って,結果と知見を報告する。
論文 参考訳(メタデータ) (2025-07-22T13:10:42Z) - Multi-Stage Boundary-Aware Transformer Network for Action Segmentation in Untrimmed Surgical Videos [0.1053373860696675]
手術条件下での長い行動列のキャプチャと解析は、個々の外科医のアプローチに固有の変動性のために困難である。
この変数は、曖昧な境界点と終点を持つ異なる作用の識別と分割を複雑にする。
動作セグメンテーションを改善するために,階層的スライディングウィンドウアテンションを有するマルチステージ境界対応変圧器ネットワーク(MSBATN)を提案する。
論文 参考訳(メタデータ) (2025-04-26T01:07:56Z) - A Continual Learning-driven Model for Accurate and Generalizable Segmentation of Clinically Comprehensive and Fine-grained Whole-body Anatomies in CT [67.34586036959793]
完全に注釈付きCTデータセットは存在せず、すべての解剖学がトレーニングのために記述されている。
完全解剖を分割できる連続学習駆動CTモデルを提案する。
単体CT分割モデルCL-Netは, 臨床的に包括的に包括的に235個の粒状体解剖の集合を高精度に分割することができる。
論文 参考訳(メタデータ) (2025-03-16T23:55:02Z) - Phase-Informed Tool Segmentation for Manual Small-Incision Cataract Surgery [5.346116837157231]
白内障手術は世界中で最も一般的な手術であり、発展途上国では非常に高い負担がかかる。
現存する研究は主にパコ白内障手術に焦点を当てており、白内障治療が最も必要とされる地域では利用できない高価な技術である。
手動小切開白内障手術(英: Manual Small-Incision Cataract Surgery, MICS)は、手動小切開白内障手術(英語版) (MSICS) が好まれる低コストで高速な手術法である。
今回紹介するSankara-MSICSは,3,527フレームと3,527フレームの3,53本の手術用ビデオを含む,最初の包括的データセットである。
論文 参考訳(メタデータ) (2024-11-25T09:22:42Z) - Surgical Triplet Recognition via Diffusion Model [59.50938852117371]
外科的三重項認識は、次世代のコンテキスト対応手術室を実現するために必要不可欠なビルディングブロックである。
拡散モデルを用いた外科的三重項認識のための新しい生成フレームワークであるDifftを提案する。
CholecT45とColecT50データセットの実験は、手術用三重項認識のための新しい最先端性能を達成する上で、提案手法の優位性を示している。
論文 参考訳(メタデータ) (2024-06-19T04:43:41Z) - CholecTrack20: A Multi-Perspective Tracking Dataset for Surgical Tools [1.7059333957102913]
既存のデータセットは、外科固有のダイナミックスを捉えるのに失敗した、過度に汎用的な追跡形式に依存している。
外科手術における多クラス多ツール追跡のための特別なデータセットであるCholecTrack20を紹介する。
データセットは20のフル長の手術ビデオからなり、1fpsで注釈付けされ、35Kフレーム以上と65Kラベルのツールインスタンスが生成される。
論文 参考訳(メタデータ) (2023-12-12T15:18:15Z) - CholecTriplet2021: A benchmark challenge for surgical action triplet
recognition [66.51610049869393]
腹腔鏡下手術における三肢の認識のためにMICCAI 2021で実施した内視鏡的視力障害であるColecTriplet 2021を提案する。
課題の参加者が提案する最先端の深層学習手法の課題設定と評価について述べる。
4つのベースライン法と19の新しいディープラーニングアルゴリズムが提示され、手術ビデオから直接手術行動三重項を認識し、平均平均精度(mAP)は4.2%から38.1%である。
論文 参考訳(メタデータ) (2022-04-10T18:51:55Z) - A unified 3D framework for Organs at Risk Localization and Segmentation
for Radiation Therapy Planning [56.52933974838905]
現在の医療ワークフローは、OAR(Organs-at-risk)のマニュアル記述を必要とする
本研究は,OARローカライゼーション・セグメンテーションのための統合された3Dパイプラインの導入を目的とする。
提案手法は医用画像に固有の3Dコンテキスト情報の活用を可能にする。
論文 参考訳(メタデータ) (2022-03-01T17:08:41Z) - Robust Medical Instrument Segmentation Challenge 2019 [56.148440125599905]
腹腔鏡装置の術中追跡は、しばしばコンピュータとロボットによる介入の必要条件である。
本研究の課題は,30の手術症例から取得した10,040枚の注釈画像からなる外科的データセットに基づいていた。
結果は、初期仮説、すなわち、アルゴリズムの性能がドメインギャップの増大とともに低下することを確認する。
論文 参考訳(メタデータ) (2020-03-23T14:35:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。