論文の概要: The SAGES Critical View of Safety Challenge: A Global Benchmark for AI-Assisted Surgical Quality Assessment
- arxiv url: http://arxiv.org/abs/2509.17100v1
- Date: Sun, 21 Sep 2025 14:41:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-23 18:58:16.118312
- Title: The SAGES Critical View of Safety Challenge: A Global Benchmark for AI-Assisted Surgical Quality Assessment
- Title(参考訳): 安全問題に対するSAGESの批判的見解:AIによる外科的品質評価のためのグローバルベンチマーク
- Authors: Deepak Alapatt, Jennifer Eckhoff, Zhiliang Lyu, Yutong Ban, Jean-Paul Mazellier, Sarah Choksi, Kunyi Yang, 2024 CVS Challenge Consortium, Quanzheng Li, Filippo Filicori, Xiang Li, Pietro Mascagni, Daniel A. Hashimoto, Guy Rosman, Ozanan Meireles, Nicolas Padoy,
- Abstract要約: 本研究は,外科学会が主催する初のAIコンペティションであるSAGES critical View of Safety (CVS) Challengeを提示する。
世界中の24カ国の54の機関が協力し、数百人の臨床医や技術者が、20人の外科専門家が注釈を付けた1000本の動画をキュレートした。
13の国際チームが参加し、評価パフォーマンスが17%、キャリブレーションエラーが80%以上減少し、最先端技術に対するロバスト性が17%向上した。
- 参考スコア(独自算出の注目度): 16.679380065522107
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Advances in artificial intelligence (AI) for surgical quality assessment promise to democratize access to expertise, with applications in training, guidance, and accreditation. This study presents the SAGES Critical View of Safety (CVS) Challenge, the first AI competition organized by a surgical society, using the CVS in laparoscopic cholecystectomy, a universally recommended yet inconsistently performed safety step, as an exemplar of surgical quality assessment. A global collaboration across 54 institutions in 24 countries engaged hundreds of clinicians and engineers to curate 1,000 videos annotated by 20 surgical experts according to a consensus-validated protocol. The challenge addressed key barriers to real-world deployment in surgery, including achieving high performance, capturing uncertainty in subjective assessment, and ensuring robustness to clinical variability. To enable this scale of effort, we developed EndoGlacier, a framework for managing large, heterogeneous surgical video and multi-annotator workflows. Thirteen international teams participated, achieving up to a 17\% relative gain in assessment performance, over 80\% reduction in calibration error, and a 17\% relative improvement in robustness over the state-of-the-art. Analysis of results highlighted methodological trends linked to model performance, providing guidance for future research toward robust, clinically deployable AI for surgical quality assessment.
- Abstract(参考訳): 外科的品質評価のための人工知能(AI)の進歩は、専門知識へのアクセスを民主化し、訓練、指導、認定に応用することを約束する。
本研究は, 腹腔鏡下胆嚢摘出術においてCVSを併用し, 外科的品質評価の模範として, 外科学会による初のAIコンペティションであるSAGESCritical View of Safety (CVS) Challengeを提案する。
24カ国の54の機関が協力し、数百人の臨床医と技術者が協力し、20人の外科専門家が注釈を付けた1000本の動画を収集した。
この課題は、高いパフォーマンスを達成すること、主観的評価の不確実性を捉えること、臨床変数に対する堅牢性を確保することなど、手術における現実世界の展開に対する重要な障壁に対処した。
大規模な異種手術ビデオとマルチアノテーションワークフローを管理するためのフレームワークであるendoGlacierを開発した。
13の国際チームが参加し、評価性能の17\%の相対的な向上、キャリブレーションエラーの80\%以上の削減、最先端技術に対するロバストネスの17\%以上の相対的な改善を実現した。
結果から, モデル性能に関連する方法論的傾向が強調され, 外科的品質評価のための堅牢で臨床的に展開可能なAIに向けた今後の研究のためのガイダンスが得られた。
関連論文リスト
- DermINO: Hybrid Pretraining for a Versatile Dermatology Foundation Model [69.20140430678092]
DermNIOは皮膚科学の多目的基盤モデルである。
自己教師型学習パラダイムを増強する、新しいハイブリッド事前学習フレームワークが組み込まれている。
さまざまなタスクにおいて、最先端のモデルよりも一貫して優れています。
論文 参考訳(メタデータ) (2025-08-17T00:41:39Z) - ReCAP: Recursive Cross Attention Network for Pseudo-Label Generation in Robotic Surgical Skill Assessment [40.09498356923132]
外科的スキル評価において、OATS(Objective Assessments of Technical Skills)とGRS(Global Rating Scale)は、訓練中の外科医を評価するための確立されたツールである。
最近の研究は、運動データ、ビデオ、またはそれらの組み合わせからGRSスコアを回帰することに焦点を当てている。
我々は,OSATSのスコアを集計し,外科的臨床試験において臨床的に有意な変動を見落としているため,GRSのみの回帰は限界であると主張している。
論文 参考訳(メタデータ) (2024-04-22T10:33:06Z) - Validating polyp and instrument segmentation methods in colonoscopy through Medico 2020 and MedAI 2021 Challenges [58.32937972322058]
メディコオートマチックポリープセグメンテーション(Medico 2020)と「メディコ:医療画像の透明性(MedAI 2021)」コンペティション。
本報告では, それぞれのコントリビューションを包括的に分析し, ベストパフォーマンスメソッドの強さを強調し, クリニックへの臨床翻訳の可能性について考察する。
論文 参考訳(メタデータ) (2023-07-30T16:08:45Z) - CholecTriplet2021: A benchmark challenge for surgical action triplet
recognition [66.51610049869393]
腹腔鏡下手術における三肢の認識のためにMICCAI 2021で実施した内視鏡的視力障害であるColecTriplet 2021を提案する。
課題の参加者が提案する最先端の深層学習手法の課題設定と評価について述べる。
4つのベースライン法と19の新しいディープラーニングアルゴリズムが提示され、手術ビデオから直接手術行動三重項を認識し、平均平均精度(mAP)は4.2%から38.1%である。
論文 参考訳(メタデータ) (2022-04-10T18:51:55Z) - The SARAS Endoscopic Surgeon Action Detection (ESAD) dataset: Challenges
and methods [15.833413083110903]
本稿では,内視鏡下低侵襲手術における外科医の行動検出問題に取り組むための,最初の大規模データセットであるesadについて述べる。
このデータセットは、前立腺切除術中にキャプチャされた実際の内視鏡的ビデオフレーム上の21のアクションクラスに対するバウンディングボックスアノテーションを提供し、最近のMIDL 2020チャレンジのベースとして使用された。
論文 参考訳(メタデータ) (2021-04-07T15:11:51Z) - Surgical Skill Assessment on In-Vivo Clinical Data via the Clearness of
Operating Field [18.643159726513133]
本論文では,実際の臨床データセットを用いて外科的スキルアセスメントについて検討する。
手術領域のクリアネス(COF)は総合的な外科的スキルの指標として有用である。
COFのプロキシを通じて外科的スキルを予測するための,客観的かつ自動化されたフレームワークを提案する。
実験では, 提案手法はスピアマンの0.55の相関性を, 総合技術技術の基礎的真理と比較した。
論文 参考訳(メタデータ) (2020-08-27T07:12:16Z) - AGE Challenge: Angle Closure Glaucoma Evaluation in Anterior Segment
Optical Coherence Tomography [61.405005501608706]
アングル閉鎖緑内障(ACG)は開角緑内障よりも攻撃的な疾患である。
前部セグメント光コヒーレンス・トモグラフィー(AS-OCT)は、開角度から角度閉鎖を識別する高速で接触のない方法を提供する。
既存のメソッドを均一に評価するためのパブリックなAS-OCTデータセットは存在しない。
私たちは,MICCAI 2019と共同で開催したAngle closure Glaucoma Evaluation Challenge (AGE)を組織した。
論文 参考訳(メタデータ) (2020-05-05T14:55:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。