論文の概要: ArthroPhase: A Novel Dataset and Method for Phase Recognition in Arthroscopic Video
- arxiv url: http://arxiv.org/abs/2502.07431v1
- Date: Tue, 11 Feb 2025 10:19:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-12 14:07:38.182451
- Title: ArthroPhase: A Novel Dataset and Method for Phase Recognition in Arthroscopic Video
- Title(参考訳): ArthroPhase: 関節鏡視画像の位相認識のための新しいデータセットと方法
- Authors: Ali Bahari Malayeri, Matthias Seibold, Nicola Cavalcanti, Jonas Hein, Sascha Jecklin, Lazaros Vlachopoulos, Sandro Fucentese, Sandro Hodel, Philipp Furnstahl,
- Abstract要約: 時間的特徴を利用した鏡視下外科的位相認識のためのベンチマークを確立することを目的としている。
我々のモデルは、時間的フレームワイド特徴抽出を利用して、トランスフォーマーベースのアーキテクチャを採用している。
提案されたモデルは、ACL27データセットで72.91%の精度を達成した。
- 参考スコア(独自算出の注目度): 0.6819010383838326
- License:
- Abstract: This study aims to advance surgical phase recognition in arthroscopic procedures, specifically Anterior Cruciate Ligament (ACL) reconstruction, by introducing the first arthroscopy dataset and developing a novel transformer-based model. We aim to establish a benchmark for arthroscopic surgical phase recognition by leveraging spatio-temporal features to address the specific challenges of arthroscopic videos including limited field of view, occlusions, and visual distortions. We developed the ACL27 dataset, comprising 27 videos of ACL surgeries, each labeled with surgical phases. Our model employs a transformer-based architecture, utilizing temporal-aware frame-wise feature extraction through a ResNet-50 and transformer layers. This approach integrates spatio-temporal features and introduces a Surgical Progress Index (SPI) to quantify surgery progression. The model's performance was evaluated using accuracy, precision, recall, and Jaccard Index on the ACL27 and Cholec80 datasets. The proposed model achieved an overall accuracy of 72.91% on the ACL27 dataset. On the Cholec80 dataset, the model achieved a comparable performance with the state-of-the-art methods with an accuracy of 92.4%. The SPI demonstrated an output error of 10.6% and 9.86% on ACL27 and Cholec80 datasets respectively, indicating reliable surgery progression estimation. This study introduces a significant advancement in surgical phase recognition for arthroscopy, providing a comprehensive dataset and a robust transformer-based model. The results validate the model's effectiveness and generalizability, highlighting its potential to improve surgical training, real-time assistance, and operational efficiency in orthopedic surgery. The publicly available dataset and code will facilitate future research and development in this critical field.
- Abstract(参考訳): 本研究の目的は,鏡視下手術,特に前十字靭帯再建術(ACL)において,第1回関節鏡的データセットを導入し,新しいトランスフォーマーモデルを開発することである。
本研究の目的は,視力,咬合力,視力の歪みなど,鏡視ビデオの特定の課題に対処するために,時空間的特徴を活用して,鏡視下手術の位相認識のためのベンチマークを確立することである。
手術相をラベル付けしたACL27データセットを27本開発した。
モデルでは,ResNet-50と変換器層を経由した時間的フレームワイド特徴抽出を利用して,トランスフォーマーベースのアーキテクチャを採用している。
このアプローチは時空間的特徴を統合し,手術進行の定量化のための手術進行指数(SPI)を導入する。
モデルの性能は ACL27 と Cholec80 データセットの精度、精度、リコール、および Jaccard Index を用いて評価された。
提案されたモデルは、ACL27データセットで72.91%の精度を達成した。
Cholec80データセットでは、92.4%の精度で最先端の手法で同等のパフォーマンスを達成した。
SPI は ACL27 と Cholec80 のデータセットで出力誤差が 10.6% と 9.86% であることを示した。
本研究は関節鏡における外科的位相認識の大幅な進歩を紹介し,包括的データセットと頑健なトランスフォーマーモデルを提供する。
その結果, 整形外科手術において, 手術訓練, リアルタイム支援, 手術効率を向上させる可能性が示された。
公開されているデータセットとコードは、この重要な分野における将来の研究と開発を促進する。
関連論文リスト
- Data-Centric Learning Framework for Real-Time Detection of Aiming Beam in Fluorescence Lifetime Imaging Guided Surgery [3.8261910636994925]
本研究では,FLImを用いたリアルタイム手術指導のための新しいデータ中心アプローチを提案する。
第一の課題は,特に経口ロボット手術(TORS)における手術環境における複雑で変動的な状態から生じる。
ラベルノイズの最小化と検出ロバスト性の向上により精度を向上させるデータ中心のトレーニング戦略を用いて,インスタンスセグメンテーションモデルを開発した。
論文 参考訳(メタデータ) (2024-11-11T22:04:32Z) - Automated Surgical Skill Assessment in Endoscopic Pituitary Surgery using Real-time Instrument Tracking on a High-fidelity Bench-top Phantom [9.41936397281689]
外科的スキルの改善は一般的に患者の成績の改善に関連しているが、評価は主観的であり、労働集約的である。
内視鏡下垂体手術の鼻相を模範として,シミュレートされた手術に焦点を当てた新しい公開データセットが導入された。
多層パーセプトロンは87%の精度で手術技量(初心者または専門家)を予測し、「可視時間測定のための全手術時間の割合」は高度な手術技量と相関した。
論文 参考訳(メタデータ) (2024-09-25T15:27:44Z) - Handling Geometric Domain Shifts in Semantic Segmentation of Surgical RGB and Hyperspectral Images [67.66644395272075]
本稿では,幾何学的アウト・オブ・ディストリビューションデータに直面する場合の,最先端のセマンティックセマンティックセマンティクスモデルの最初の解析を行う。
本稿では, 汎用性を高めるために, 有機移植(Organ Transplantation)と呼ばれる拡張技術を提案する。
我々の拡張技術は、RGBデータに対して最大67%、HSIデータに対して90%のSOAモデル性能を改善し、実際のOODテストデータに対して、分配内パフォーマンスのレベルでのパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-08-27T19:13:15Z) - Domain adaptation strategies for 3D reconstruction of the lumbar spine using real fluoroscopy data [9.21828361691977]
本研究は整形外科手術における手術ナビゲーション導入における重要な障害に対処するものである。
これは、少数の蛍光画像から脊椎の3次元解剖モデルを生成するためのアプローチを示す。
これまでの合成データに基づく研究の精度に匹敵する84%のF1スコアを達成しました。
論文 参考訳(メタデータ) (2024-01-29T10:22:45Z) - An Automated Real-Time Approach for Image Processing and Segmentation of Fluoroscopic Images and Videos Using a Single Deep Learning Network [2.752817022620644]
人工膝関節における画像分割に機械学習を用いる可能性は、そのセグメンテーション精度を改善し、プロセスを自動化し、外科医にリアルタイムの補助を提供する能力にある。
本稿では, リアルタイム全膝画像分割における深層学習手法を提案する。
大規模なデータセットに基づいてトレーニングされた深層学習モデルは、インプラントされた大腿骨とティアビアの両方を正確にセグメント化する際、優れた性能を示す。
論文 参考訳(メタデータ) (2024-01-23T05:00:02Z) - Phase-Specific Augmented Reality Guidance for Microscopic Cataract
Surgery Using Long-Short Spatiotemporal Aggregation Transformer [14.568834378003707]
乳化白内障手術(英: Phaemulsification cataract surgery, PCS)は、外科顕微鏡を用いた外科手術である。
PCS誘導システムは、手術用顕微鏡映像から貴重な情報を抽出し、熟練度を高める。
既存のPCSガイダンスシステムでは、位相特異なガイダンスに悩まされ、冗長な視覚情報に繋がる。
本稿では,認識された手術段階に対応するAR情報を提供する,新しい位相特異的拡張現実(AR)誘導システムを提案する。
論文 参考訳(メタデータ) (2023-09-11T02:56:56Z) - Prediction of Post-Operative Renal and Pulmonary Complications Using
Transformers [69.81176740997175]
術後急性腎不全,肺合併症,院内死亡の予測におけるトランスフォーマーモデルの有用性について検討した。
以上の結果から,トランスフォーマーモデルにより術後合併症の予測や従来の機械学習モデルよりも優れた性能が得られることが示された。
論文 参考訳(メタデータ) (2023-06-01T14:08:05Z) - LoViT: Long Video Transformer for Surgical Phase Recognition [59.06812739441785]
短時間・長期の時間情報を融合する2段階のLong Video Transformer(LoViT)を提案する。
このアプローチは、Colec80とAutoLaparoデータセットの最先端メソッドを一貫して上回る。
論文 参考訳(メタデータ) (2023-05-15T20:06:14Z) - Dissecting Self-Supervised Learning Methods for Surgical Computer Vision [51.370873913181605]
一般のコンピュータビジョンコミュニティでは,自己監視学習(SSL)手法が普及し始めている。
医学や手術など、より複雑で影響力のある領域におけるSSLメソッドの有効性は、限定的かつ未調査のままである。
外科的文脈理解,位相認識,ツール存在検出の2つの基本的なタスクに対して,これらの手法の性能をColec80データセット上で広範囲に解析する。
論文 参考訳(メタデータ) (2022-07-01T14:17:11Z) - CholecTriplet2021: A benchmark challenge for surgical action triplet
recognition [66.51610049869393]
腹腔鏡下手術における三肢の認識のためにMICCAI 2021で実施した内視鏡的視力障害であるColecTriplet 2021を提案する。
課題の参加者が提案する最先端の深層学習手法の課題設定と評価について述べる。
4つのベースライン法と19の新しいディープラーニングアルゴリズムが提示され、手術ビデオから直接手術行動三重項を認識し、平均平均精度(mAP)は4.2%から38.1%である。
論文 参考訳(メタデータ) (2022-04-10T18:51:55Z) - Trans-SVNet: Accurate Phase Recognition from Surgical Videos via Hybrid
Embedding Aggregation Transformer [57.18185972461453]
本稿では,手術ワークフロー解析トランスフォーマーを初めて導入し,正確な位相認識のための時間的特徴と時間的特徴の無視された補完効果を再考する。
我々のフレームワークは軽量であり、高い推論速度を達成するためにハイブリッド埋め込みを並列に処理します。
論文 参考訳(メタデータ) (2021-03-17T15:12:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。