論文の概要: CathAction: A Benchmark for Endovascular Intervention Understanding
- arxiv url: http://arxiv.org/abs/2408.13126v2
- Date: Fri, 30 Aug 2024 11:45:09 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-02 17:28:49.109684
- Title: CathAction: A Benchmark for Endovascular Intervention Understanding
- Title(参考訳): CathAction: 血管インターベンション理解のためのベンチマーク
- Authors: Baoru Huang, Tuan Vo, Chayun Kongtongvattana, Giulio Dagnino, Dennis Kundrat, Wenqiang Chi, Mohamed Abdelaziz, Trevor Kwok, Tudor Jianu, Tuong Do, Hieu Le, Minh Nguyen, Hoan Nguyen, Erman Tjiputra, Quang Tran, Jianyang Xie, Yanda Meng, Binod Bhattarai, Zhaorui Tan, Hongbin Liu, Hong Seng Gan, Wei Wang, Xi Yang, Qiufeng Wang, Jionglong Su, Kaizhu Huang, Angelos Stefanidis, Min Guo, Bo Du, Rong Tao, Minh Vu, Guoyan Zheng, Yalin Zheng, Francisco Vasconcelos, Danail Stoyanov, Daniel Elson, Ferdinando Rodriguez y Baena, Anh Nguyen,
- Abstract要約: CathActionはカテーテル化理解のための大規模なデータセットである。
我々のデータセットは、約50,000の注釈付きフレームを含み、カテーテル化アクション理解と衝突検出を行う。
各タスクについて、この分野における最近の関連する研究をベンチマークする。
- 参考スコア(独自算出の注目度): 74.58430707848527
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Real-time visual feedback from catheterization analysis is crucial for enhancing surgical safety and efficiency during endovascular interventions. However, existing datasets are often limited to specific tasks, small scale, and lack the comprehensive annotations necessary for broader endovascular intervention understanding. To tackle these limitations, we introduce CathAction, a large-scale dataset for catheterization understanding. Our CathAction dataset encompasses approximately 500,000 annotated frames for catheterization action understanding and collision detection, and 25,000 ground truth masks for catheter and guidewire segmentation. For each task, we benchmark recent related works in the field. We further discuss the challenges of endovascular intentions compared to traditional computer vision tasks and point out open research questions. We hope that CathAction will facilitate the development of endovascular intervention understanding methods that can be applied to real-world applications. The dataset is available at https://airvlab.github.io/cathaction/.
- Abstract(参考訳): カテーテル化解析によるリアルタイム視覚フィードバックは,血管内手術における外科的安全性と効率の向上に不可欠である。
しかし、既存のデータセットは、しばしば特定のタスク、小さなスケールに制限され、より広範な血管内介入を理解するのに必要な包括的なアノテーションが欠如している。
これらの制約に対処するため,カテーテル化理解のための大規模データセットであるCathActionを導入する。
我々のCathActionデータセットは、カテーテルの動作理解と衝突検出のための約50,000の注釈付きフレームと、カテーテルとガイドワイヤのセグメンテーションのための25,000の真実マスクを含んでいる。
各タスクについて、この分野における最近の関連する研究をベンチマークする。
さらに,従来のコンピュータビジョンの課題と比較して,血管内意図の課題を議論し,オープンな研究課題を指摘する。
我々はCathActionが現実世界の応用に適用可能な血管内介入理解手法の開発を促進することを願っている。
データセットはhttps://airvlab.github.io/cathaction/で公開されている。
関連論文リスト
- Hypergraph-Transformer (HGT) for Interactive Event Prediction in
Laparoscopic and Robotic Surgery [50.3022015601057]
腹腔内ビデオから外科的ワークフローの重要なインタラクティブな側面を理解し,予測できる予測型ニューラルネットワークを提案する。
我々は,既存の手術用データセットとアプリケーションに対するアプローチを検証し,アクション・トリプレットの検出と予測を行った。
この結果は、非構造的な代替案と比較して、我々のアプローチの優位性を示している。
論文 参考訳(メタデータ) (2024-02-03T00:58:05Z) - Pixel-Wise Recognition for Holistic Surgical Scene Understanding [31.338288460529046]
本稿では,前立腺腫 (GraSP) データセットについて述べる。
GraSPは、外科的シーン理解を、様々なレベルの粒度の相補的なタスクの階層としてモデル化した、キュレートされたベンチマークである。
本稿では,グローバルビデオ特徴抽出器と局所領域の提案を組み合わせた汎用アーキテクチャであるTransformers for Actions, Phases, Steps, and Instruments(TAPIS)モデルを紹介する。
論文 参考訳(メタデータ) (2024-01-20T09:09:52Z) - CholecTrack20: A Dataset for Multi-Class Multiple Tool Tracking in
Laparoscopic Surgery [1.8076340162131013]
CholecTrack20は,3つの視点にわたるマルチクラスマルチツールトラッキングのための,綿密な注釈付きデータセットである。
データセットは、20の腹腔鏡ビデオと35,000のフレーム、65,000のアノテーション付きツールインスタンスで構成されている。
論文 参考訳(メタデータ) (2023-12-12T15:18:15Z) - Adaptive Semi-Supervised Segmentation of Brain Vessels with Ambiguous
Labels [63.415444378608214]
提案手法は, 進歩的半教師付き学習, 適応的学習戦略, 境界拡張など, 革新的な手法を取り入れたものである。
3DRAデータセットによる実験結果から,メッシュベースのセグメンテーション指標を用いて,本手法の優位性を示す。
論文 参考訳(メタデータ) (2023-08-07T14:16:52Z) - Cross-Dataset Adaptation for Instrument Classification in Cataract
Surgery Videos [54.1843419649895]
特定のデータセットでこのタスクをうまく実行する最先端モデルでは、別のデータセットでテストすると、パフォーマンスが低下する。
本稿では,Barlow Adaptorと呼ばれる新しいエンドツーエンドのUnsupervised Domain Adaptation (UDA)手法を提案する。
さらに,BFAL(Barlow Feature Alignment Loss)と呼ばれる,異なるドメインにまたがる特徴を整列させる新たな損失を導入する。
論文 参考訳(メタデータ) (2023-07-31T18:14:18Z) - Task-Aware Active Learning for Endoscopic Image Analysis [18.230148396607625]
そこで,本研究では,学習例数を削減するために,アクティブな学習パラダイムについて検討する。
本稿では,新しいタスク対応能動学習パイプラインを提案し,内視鏡画像解析における2つの重要な課題に適用する。
論文 参考訳(メタデータ) (2022-04-07T13:36:45Z) - External Attention Assisted Multi-Phase Splenic Vascular Injury
Segmentation with Limited Data [72.99534552950138]
脾臓は腹部外傷において最も多く損傷を受けた固形臓器の1つである。
脾臓血管損傷の 正確な分節化は 以下の理由から 困難です
論文 参考訳(メタデータ) (2022-01-04T02:35:56Z) - Simulation-to-Real domain adaptation with teacher-student learning for
endoscopic instrument segmentation [1.1047993346634768]
注釈付きシミュレーションデータとラベルのない実データから共同学習する教師学習手法を紹介します。
3つのデータセットの実証結果は、提案したフレームワークの有効性を浮き彫りにする。
論文 参考訳(メタデータ) (2021-03-02T09:30:28Z) - End-to-End Real-time Catheter Segmentation with Optical Flow-Guided
Warping during Endovascular Intervention [26.467626509096043]
エンド・ツー・エンドおよびリアルタイムの深層学習フレームワークであるFW-Netについて述べる。
本研究では,時間的連続性を効果的に学習することにより,実地真実のみを用いてリアルタイムにカテーテルを分割・追跡できることを示す。
論文 参考訳(メタデータ) (2020-06-16T12:53:27Z) - Robust Medical Instrument Segmentation Challenge 2019 [56.148440125599905]
腹腔鏡装置の術中追跡は、しばしばコンピュータとロボットによる介入の必要条件である。
本研究の課題は,30の手術症例から取得した10,040枚の注釈画像からなる外科的データセットに基づいていた。
結果は、初期仮説、すなわち、アルゴリズムの性能がドメインギャップの増大とともに低下することを確認する。
論文 参考訳(メタデータ) (2020-03-23T14:35:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。