論文の概要: The SAGES Critical View of Safety Challenge: A Global Benchmark for AI-Assisted Surgical Quality Assessment
- arxiv url: http://arxiv.org/abs/2509.17100v1
- Date: Sun, 21 Sep 2025 14:41:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-23 18:58:16.118312
- Title: The SAGES Critical View of Safety Challenge: A Global Benchmark for AI-Assisted Surgical Quality Assessment
- Title(参考訳): 安全問題に対するSAGESの批判的見解:AIによる外科的品質評価のためのグローバルベンチマーク
- Authors: Deepak Alapatt, Jennifer Eckhoff, Zhiliang Lyu, Yutong Ban, Jean-Paul Mazellier, Sarah Choksi, Kunyi Yang, 2024 CVS Challenge Consortium, Quanzheng Li, Filippo Filicori, Xiang Li, Pietro Mascagni, Daniel A. Hashimoto, Guy Rosman, Ozanan Meireles, Nicolas Padoy,
- Abstract要約: 本研究は,外科学会が主催する初のAIコンペティションであるSAGES critical View of Safety (CVS) Challengeを提示する。
世界中の24カ国の54の機関が協力し、数百人の臨床医や技術者が、20人の外科専門家が注釈を付けた1000本の動画をキュレートした。
13の国際チームが参加し、評価パフォーマンスが17%、キャリブレーションエラーが80%以上減少し、最先端技術に対するロバスト性が17%向上した。
- 参考スコア(独自算出の注目度): 16.679380065522107
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Advances in artificial intelligence (AI) for surgical quality assessment promise to democratize access to expertise, with applications in training, guidance, and accreditation. This study presents the SAGES Critical View of Safety (CVS) Challenge, the first AI competition organized by a surgical society, using the CVS in laparoscopic cholecystectomy, a universally recommended yet inconsistently performed safety step, as an exemplar of surgical quality assessment. A global collaboration across 54 institutions in 24 countries engaged hundreds of clinicians and engineers to curate 1,000 videos annotated by 20 surgical experts according to a consensus-validated protocol. The challenge addressed key barriers to real-world deployment in surgery, including achieving high performance, capturing uncertainty in subjective assessment, and ensuring robustness to clinical variability. To enable this scale of effort, we developed EndoGlacier, a framework for managing large, heterogeneous surgical video and multi-annotator workflows. Thirteen international teams participated, achieving up to a 17\% relative gain in assessment performance, over 80\% reduction in calibration error, and a 17\% relative improvement in robustness over the state-of-the-art. Analysis of results highlighted methodological trends linked to model performance, providing guidance for future research toward robust, clinically deployable AI for surgical quality assessment.
- Abstract(参考訳): 外科的品質評価のための人工知能(AI)の進歩は、専門知識へのアクセスを民主化し、訓練、指導、認定に応用することを約束する。
本研究は, 腹腔鏡下胆嚢摘出術においてCVSを併用し, 外科的品質評価の模範として, 外科学会による初のAIコンペティションであるSAGESCritical View of Safety (CVS) Challengeを提案する。
24カ国の54の機関が協力し、数百人の臨床医と技術者が協力し、20人の外科専門家が注釈を付けた1000本の動画を収集した。
この課題は、高いパフォーマンスを達成すること、主観的評価の不確実性を捉えること、臨床変数に対する堅牢性を確保することなど、手術における現実世界の展開に対する重要な障壁に対処した。
大規模な異種手術ビデオとマルチアノテーションワークフローを管理するためのフレームワークであるendoGlacierを開発した。
13の国際チームが参加し、評価性能の17\%の相対的な向上、キャリブレーションエラーの80\%以上の削減、最先端技術に対するロバストネスの17\%以上の相対的な改善を実現した。
結果から, モデル性能に関連する方法論的傾向が強調され, 外科的品質評価のための堅牢で臨床的に展開可能なAIに向けた今後の研究のためのガイダンスが得られた。
関連論文リスト
- ClinConsensus: A Consensus-Based Benchmark for Evaluating Chinese Medical LLMs across Difficulty Levels [39.33170904610862]
大規模言語モデル(LLM)は、病気の予防、臨床的意思決定、長期ケアにまたがる約束を示す健康管理にますます応用されている。
ClinConsensusは、臨床専門家がキュレートし、検証し、品質を制御した中国の医療ベンチマークである。
ClinConsensusは、予防と介入から長期フォローアップまで、ケアの全期間にわたる2500件のオープンエンドケースで構成されており、36の専門医、12の共通臨床タスクタイプ、そして徐々に複雑さのレベルが増大している。
論文 参考訳(メタデータ) (2026-03-02T17:17:18Z) - A generalizable foundation model for intraoperative understanding across surgical procedures [1.0412442875956527]
術中画像理解のための汎用基盤モデルであるZENを導入し,21以上の術式から400万フレーム以上をトレーニングした。
ZENは、既存の外科的基礎モデルより一貫して優れており、堅牢な多目的一般化を実証している。
論文 参考訳(メタデータ) (2026-02-14T06:52:42Z) - Augmenting Clinical Decision-Making with an Interactive and Interpretable AI Copilot: A Real-World User Study with Clinicians in Nephrology and Obstetrics [36.981753143345664]
共同臨床意思決定のための対話型・解釈可能なAIコラボロであるAICareについて紹介する。
縦断的な電子健康記録を解析することにより、AICareは動的リスク予測を精査可能な可視化に基礎を置いている。
論文 参考訳(メタデータ) (2026-01-31T13:41:32Z) - Responsible Evaluation of AI for Mental Health [72.85175110624736]
メンタルヘルスケアにおけるAIツールの評価に対する現在のアプローチは、断片化されており、臨床実践、社会的コンテキスト、ファーストハンドのユーザエクスペリエンスと不整合である。
本稿では,臨床の健全性,社会的文脈,公平性を統合した学際的枠組みを導入することにより,責任ある評価を再考する。
論文 参考訳(メタデータ) (2026-01-20T12:55:10Z) - DermINO: Hybrid Pretraining for a Versatile Dermatology Foundation Model [69.20140430678092]
DermNIOは皮膚科学の多目的基盤モデルである。
自己教師型学習パラダイムを増強する、新しいハイブリッド事前学習フレームワークが組み込まれている。
さまざまなタスクにおいて、最先端のモデルよりも一貫して優れています。
論文 参考訳(メタデータ) (2025-08-17T00:41:39Z) - ReCAP: Recursive Cross Attention Network for Pseudo-Label Generation in Robotic Surgical Skill Assessment [40.09498356923132]
外科的スキル評価において、OATS(Objective Assessments of Technical Skills)とGRS(Global Rating Scale)は、訓練中の外科医を評価するための確立されたツールである。
最近の研究は、運動データ、ビデオ、またはそれらの組み合わせからGRSスコアを回帰することに焦点を当てている。
我々は,OSATSのスコアを集計し,外科的臨床試験において臨床的に有意な変動を見落としているため,GRSのみの回帰は限界であると主張している。
論文 参考訳(メタデータ) (2024-04-22T10:33:06Z) - Automated Assessment of Critical View of Safety in Laparoscopic
Cholecystectomy [51.240181118593114]
胆嚢摘出術(胆嚢摘出術)は米国で最も一般的な手術の一つで、年間1.2万回以上の手術が施行されている。
LCは胆管損傷(BDI)の増加と関連しており、致死率と死亡率が高い。
本稿では,LCにおける安全性評価(CVS)の自動化を目的とした深層学習手法を提案する。
論文 参考訳(メタデータ) (2023-09-13T22:01:36Z) - Validating polyp and instrument segmentation methods in colonoscopy through Medico 2020 and MedAI 2021 Challenges [58.32937972322058]
メディコオートマチックポリープセグメンテーション(Medico 2020)と「メディコ:医療画像の透明性(MedAI 2021)」コンペティション。
本報告では, それぞれのコントリビューションを包括的に分析し, ベストパフォーマンスメソッドの強さを強調し, クリニックへの臨床翻訳の可能性について考察する。
論文 参考訳(メタデータ) (2023-07-30T16:08:45Z) - CholecTriplet2021: A benchmark challenge for surgical action triplet
recognition [66.51610049869393]
腹腔鏡下手術における三肢の認識のためにMICCAI 2021で実施した内視鏡的視力障害であるColecTriplet 2021を提案する。
課題の参加者が提案する最先端の深層学習手法の課題設定と評価について述べる。
4つのベースライン法と19の新しいディープラーニングアルゴリズムが提示され、手術ビデオから直接手術行動三重項を認識し、平均平均精度(mAP)は4.2%から38.1%である。
論文 参考訳(メタデータ) (2022-04-10T18:51:55Z) - The SARAS Endoscopic Surgeon Action Detection (ESAD) dataset: Challenges
and methods [15.833413083110903]
本稿では,内視鏡下低侵襲手術における外科医の行動検出問題に取り組むための,最初の大規模データセットであるesadについて述べる。
このデータセットは、前立腺切除術中にキャプチャされた実際の内視鏡的ビデオフレーム上の21のアクションクラスに対するバウンディングボックスアノテーションを提供し、最近のMIDL 2020チャレンジのベースとして使用された。
論文 参考訳(メタデータ) (2021-04-07T15:11:51Z) - Surgical Skill Assessment on In-Vivo Clinical Data via the Clearness of
Operating Field [18.643159726513133]
本論文では,実際の臨床データセットを用いて外科的スキルアセスメントについて検討する。
手術領域のクリアネス(COF)は総合的な外科的スキルの指標として有用である。
COFのプロキシを通じて外科的スキルを予測するための,客観的かつ自動化されたフレームワークを提案する。
実験では, 提案手法はスピアマンの0.55の相関性を, 総合技術技術の基礎的真理と比較した。
論文 参考訳(メタデータ) (2020-08-27T07:12:16Z) - AGE Challenge: Angle Closure Glaucoma Evaluation in Anterior Segment
Optical Coherence Tomography [61.405005501608706]
アングル閉鎖緑内障(ACG)は開角緑内障よりも攻撃的な疾患である。
前部セグメント光コヒーレンス・トモグラフィー(AS-OCT)は、開角度から角度閉鎖を識別する高速で接触のない方法を提供する。
既存のメソッドを均一に評価するためのパブリックなAS-OCTデータセットは存在しない。
私たちは,MICCAI 2019と共同で開催したAngle closure Glaucoma Evaluation Challenge (AGE)を組織した。
論文 参考訳(メタデータ) (2020-05-05T14:55:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。