論文の概要: ExpOS: Explainable Open-Surgery Skills Assessment Using 3D Hand Reconstruction
- arxiv url: http://arxiv.org/abs/2605.23653v1
- Date: Fri, 22 May 2026 14:06:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 17:29:20.381754
- Title: ExpOS: Explainable Open-Surgery Skills Assessment Using 3D Hand Reconstruction
- Title(参考訳): ExpOS:3Dハンドコンストラクションによる説明可能なオープンサージェリースキルの評価
- Authors: Roi Papo, Idan Smoller, Shlomi Laufer,
- Abstract要約: オープンサージェリースキルをデータ駆動で評価するためのフレームワークExpOSを紹介する。
オープンサージリーを3回実施した221名の医学生を対象に,本手法を訓練・評価した。
- 参考スコア(独自算出の注目度): 1.9116784879310027
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Timely and transparent feedback is essential for effective surgical training, yet current assessment remains dependent on expert observation, limiting scalability and opportunities for autonomous practice. We present ExpOS, an explainable framework for data-driven assessment of open-surgery skills designed to enable automatic, feedback-oriented evaluation. Rather than relying on expert-defined metrics, ExpOS learns discriminative temporal patterns directly from motion data and identifies the segments and behaviors most predictive of skill level. We trained and evaluated the method on 221 videos of medical students performing three open-surgery tasks. Hand poses and tool detections were extracted from each frame to derive kinematic descriptors and global motion statistics. Spatiotemporal hand-tool dynamics were modeled using a temporal convolutional backbone with attention-based pooling to generate frame-level importance maps. These representations were fused with global motion statistics to predict skill level and to provide interpretable feedback. ExpOS provides multi-level explainability by identifying when informative events occur through attention weights and which motion characteristics most influence predictions through global feature analysis. Across tasks, the framework achieved strong correlation with expert ratings, with best performance on fascial closure (r = 0.778, R2 = 0.74). These results demonstrate that combining weakly-supervised temporal importance learning with interpretable motion statistics enables scalable and actionable surgical skill assessment.
- Abstract(参考訳): タイムリーで透明なフィードバックは効果的な外科訓練には不可欠であるが、現在の評価は専門家の観察、スケーラビリティの制限、自律的な実践の機会に依存している。
我々は,自動フィードバック指向評価を実現するために設計されたオープンサージェリースキルの,データ駆動型評価のための説明可能なフレームワークExpOSを提案する。
ExpOSは、専門家定義のメトリクスに頼るのではなく、モーションデータから直接差別的な時間パターンを学び、スキルレベルの最も予測可能なセグメントと振る舞いを特定する。
オープンサージリーを3回実施した221名の医学生を対象に,本手法を訓練・評価した。
ハンドポーズとツール検出は各フレームから抽出され、キネマティックな記述子とグローバルな動き統計を導出する。
フレームレベルの重要度マップを生成するために,時間的畳み込みバックボーンとアテンションベースプールを用いた時空間ハンドツールダイナミクスをモデル化した。
これらの表現は、スキルレベルを予測し、解釈可能なフィードバックを提供するために、グローバルな動き統計と融合した。
ExpOSは、注意重みによる情報イベントの発生と、世界的特徴分析による最も影響の大きい動き特性の特定により、多段階的な説明可能性を提供する。
タスク全体にわたって、このフレームワークは専門家の評価と強い相関を達成し、ファシズムクロージャ(r = 0.778, R2 = 0.74)で最高のパフォーマンスを得た。
これらの結果から,弱い教師付き時間的重要度学習と解釈可能な動作統計とを組み合わせることで,スケーラブルで動作可能な外科的スキルアセスメントが可能であることが示唆された。
関連論文リスト
- AI-Assisted Competency Assessment from Egocentric Video in Simulation-Based Nursing Education [9.996771938125582]
複雑な視覚行動を理解するための有望なツールとして、視覚言語モデルが登場した。
我々は,凍結した視覚エンコーダと数ショット学習を用いて,自己中心型看護シミュレーションビデオから行動タイムラインを抽出する。
認識精度と能力の間の負の傾向を観察する。
論文 参考訳(メタデータ) (2026-05-16T02:07:35Z) - Model selection and real-time skill assessment for suturing in robotic surgery [33.229894165318]
我々はOSATSスコアに基づいてリアルタイムに外科的スキルレベルのリアルタイム予測を実現する方法について検討した。
モデル設計においては,外科的スキルレベルを予測するための多モード深層学習モデルの有効性を評価する。
スキルレベルに基づくクロスバリデーションでは,異なるスキルレベルを持つ外科医のモデルを個別に訓練した。
論文 参考訳(メタデータ) (2026-01-17T11:28:59Z) - AI-Driven Evaluation of Surgical Skill via Action Recognition [4.92174988745803]
マイクロアナコシス性能の自動評価のためのAI駆動型フレームワークを提案する。
マイクロアナコシススキルの5つの側面、例えば、全体的な動作実行、プロシージャクリティカルアクション中の運動品質、一般的な楽器ハンドリングについて評価する。
論文 参考訳(メタデータ) (2025-12-30T18:45:34Z) - Attention Trajectories as a Diagnostic Axis for Deep Reinforcement Learning [4.662814261930481]
本稿では,学習過程を定量的に分析して分析する科学的手法を提案する。
このアプローチは、オブジェクトとモダリティレベルでのサリエンシ情報を階層的な注意プロファイルに集約する。
この手法はアルゴリズム固有の注意バイアスを明らかにし、意図しない報酬駆動戦略を明らかにし、冗長な感覚チャネルへの過度な適合を診断する。
論文 参考訳(メタデータ) (2025-11-25T18:20:42Z) - Beyond Description: Cognitively Benchmarking Fine-Grained Action for Embodied Agents [52.14392337070763]
CFG-Benchは、きめ細かな動作インテリジェンスを体系的に評価する新しいベンチマークである。
CFG-Benchは、1,368のキュレートされたビデオと19,562の3つのモダリティからなる質問応答ペアからなる。
CFG-Benchに関する包括的評価から,MLLMの先導者は,物理的相互作用の詳細な指示を生成するのに苦慮していることが明らかとなった。
論文 参考訳(メタデータ) (2025-11-24T02:02:29Z) - Multi-Modal Self-Supervised Learning for Surgical Feedback Effectiveness Assessment [66.6041949490137]
そこで本研究では,音声による音声入力とそれに対応する手術映像からの情報を統合して,フィードバックの有効性を予測する手法を提案する。
以上の結果から,手書きフィードバックと手術映像の両方が,訓練者の行動変化を個別に予測できることがわかった。
本研究は,手術フィードバックの自動評価を推進するためのマルチモーダル学習の可能性を示すものである。
論文 参考訳(メタデータ) (2024-11-17T00:13:00Z) - Prospector Heads: Generalized Feature Attribution for Large Models & Data [82.02696069543454]
本稿では,説明に基づく帰属手法の効率的かつ解釈可能な代替手段であるプロスペクタヘッドを紹介する。
入力データにおけるクラス固有のパターンの解釈と発見を、プロファイラヘッドがいかに改善できるかを実証する。
論文 参考訳(メタデータ) (2024-02-18T23:01:28Z) - Clairvoyance: A Pipeline Toolkit for Medical Time Series [95.22483029602921]
時系列学習は、データ駆動の*クリニカルな意思決定支援のパンとバターである*
Clairvoyanceは、ソフトウェアツールキットとして機能する、統合されたエンドツーエンドのオートMLフレンドリなパイプラインを提案する。
Clairvoyanceは、臨床時系列MLのための包括的で自動化可能なパイプラインの生存可能性を示す最初のものである。
論文 参考訳(メタデータ) (2023-10-28T12:08:03Z) - A Survey of the Impact of Self-Supervised Pretraining for Diagnostic
Tasks with Radiological Images [71.26717896083433]
自己教師付き事前学習は,伝達学習における特徴表現の改善に有効であることが観察されている。
本総説ではX線, CT, 磁気共鳴, 超音波画像における使用法について概説する。
論文 参考訳(メタデータ) (2023-09-05T19:45:09Z) - Information-Theoretic Odometry Learning [83.36195426897768]
生体計測推定を目的とした学習動機付け手法のための統合情報理論フレームワークを提案する。
提案フレームワークは情報理論言語の性能評価と理解のためのエレガントなツールを提供する。
論文 参考訳(メタデータ) (2022-03-11T02:37:35Z) - Simulation-to-Real domain adaptation with teacher-student learning for
endoscopic instrument segmentation [1.1047993346634768]
注釈付きシミュレーションデータとラベルのない実データから共同学習する教師学習手法を紹介します。
3つのデータセットの実証結果は、提案したフレームワークの有効性を浮き彫りにする。
論文 参考訳(メタデータ) (2021-03-02T09:30:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。