論文の概要: AI-Assisted Competency Assessment from Egocentric Video in Simulation-Based Nursing Education
- arxiv url: http://arxiv.org/abs/2605.20233v1
- Date: Sat, 16 May 2026 02:07:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.217783
- Title: AI-Assisted Competency Assessment from Egocentric Video in Simulation-Based Nursing Education
- Title(参考訳): シミュレーション看護教育におけるエゴセントリックビデオによるAI支援能力評価
- Authors: Hanchen David Wang, Yilin Liu, Madison J. Lee, Surya Chand Rayala, Gautam Biswas, Daniel T. Levin, Meiyi Ma,
- Abstract要約: 複雑な視覚行動を理解するための有望なツールとして、視覚言語モデルが登場した。
我々は,凍結した視覚エンコーダと数ショット学習を用いて,自己中心型看護シミュレーションビデオから行動タイムラインを抽出する。
認識精度と能力の間の負の傾向を観察する。
- 参考スコア(独自算出の注目度): 9.996771938125582
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Assessing learner competency in clinical simulation requires expert observation that is time-intensive, difficult to scale, and subject to inter-rater variability. Vision-language models have emerged as a promising tool for understanding complex visual behavior. In this work, we investigate whether visual observations can provide educationally meaningful signals for competency assessment through a three-stage framework that (1) extracts action timelines from egocentric nursing simulation video using frozen visual encoders and few-shot learning, (2) derives sequence-level features and per-session recognition metrics, and (3) relates these to instructor-rated competency. Across 22 densely annotated sessions (3.8 hours, 493 actions), a frozen DINOv2 backbone with HMM Viterbi decoding achieves 57.4% MOF in leave-one-out 1-shot recognition. Surprisingly, we observe a negative trend between recognition accuracy and competency (rho = -0.524, p = 0.012 for mIoU), robust to six confound controls: more competent students produce diverse, harder-to-classify workflows, while simple sequence features show no such relationship. Per-item analysis identifies patient safety protocols and team communication as the expected behaviors most reflected in this pattern, and process model comparisons reveal that higher-competency students exhibit more protocol-consistent action transitions. These findings suggest that recognition accuracy may complement predicted action timelines as a pedagogically informative signal in automated competency assessment.
- Abstract(参考訳): 臨床シミュレーションにおける学習者の能力を評価するには、時間集約的で、スケールが困難で、ラター間変動の対象となる専門家の観察が必要である。
複雑な視覚行動を理解するための有望なツールとして、視覚言語モデルが登場した。
本研究では,(1)凍結型視覚エンコーダと少数ショットラーニングを用いた自己中心型看護シミュレーションビデオから行動タイムラインを抽出し,(2)シーケンスレベルの特徴とセッション単位の認識基準を導出し,(3)インストラクター評価能力に関連付ける3段階の枠組みを用いて,視覚的観察が能力評価のための教育的意味のあるシグナルを提供するかどうかを検討する。
22のセッション(3.8時間、493のアクション)にわたって、HMMビタビデコード付き凍結したDINOv2のバックボーンは57.4%のMOFを達成する。
意外なことに、認識精度と能力の間の負の傾向(rho = -0.524, p = 0.012 for mIoU)を観察し、より有能な学生が多種多様で分類しにくいワークフローを生成する一方で、単純なシーケンス特徴はそのような関係は示さない。
このパターンに最も反映される振る舞いとして、患者安全プロトコルとチームコミュニケーションを識別し、プロセスモデルの比較により、高能率の学生がよりプロトコルに一貫性のある行動遷移を示すことが明らかとなった。
これらの結果から,認識精度は,自動能力評価における教育的情報伝達信号として,予測行動タイムラインを補完する可能性が示唆された。
関連論文リスト
- Behavioral Engagement in VR-Based Sign Language Learning: Visual Attention as a Predictor of Performance and Temporal Dynamics [3.1690235522182113]
本研究では,手話学習と検証を目的としたバーチャルリアリティアプリケーションであるSONARにおける行動エンゲージメントを分析する。
視覚的意図(VA)、ビデオ再生頻度(VRF)、ポストプレイバック視聴時間(PPVT)の3つの自動帰属指標に着目し、学習成績との関係について検討した。
論文 参考訳(メタデータ) (2026-03-20T00:24:15Z) - PromptCD: Test-Time Behavior Enhancement via Polarity-Prompt Contrastive Decoding [85.22047087898311]
本稿では,より広範な拡張設定へのコントラストデコーディングを一般化するテスト時動作制御手法であるPolarity-Prompt Contrastive Decoding(PromptCD)を紹介する。
PromptCDは、目標行動のためのペアの正と負の導出プロンプトを構築し、望ましい結果を強化するためにモデル応答を対比する。
3H"アライメントの目的に関する実験では、一貫性と実質的な改善が示されている。
論文 参考訳(メタデータ) (2026-02-24T08:56:52Z) - Digital FAST: An AI-Driven Multimodal Framework for Rapid and Early Stroke Screening [0.7136933021609076]
本研究では,F.A.S.T.アセスメントで収集したデータをもとに,高速かつ非侵襲的な2次脳卒中自動スクリーニングのための多モード深層学習フレームワークを提案する。
提案手法は, 表情, 音声信号, 上体動作からの相補的な情報を統合し, 診断の堅牢性を高める。
論文 参考訳(メタデータ) (2026-01-17T03:35:39Z) - PiCME: Pipeline for Contrastive Modality Evaluation and Encoding in the MIMIC Dataset [16.263862005367667]
マルチモーダル深層学習は、多様な患者データを統合することで臨床予測を改善することを約束する。
対照的な学習は、タスク間で再利用可能な統一表現を生成することによって、この統合を促進する。
PiCMEはMIMICのすべてのモダリティの組み合わせでコントラスト学習をスケールした最初の企業である。
論文 参考訳(メタデータ) (2025-07-03T20:45:37Z) - Dynamic Programming Techniques for Enhancing Cognitive Representation in Knowledge Tracing [125.75923987618977]
認知表現動的プログラミングに基づく知識追跡(CRDP-KT)モデルを提案する。
質問の難易度とそれらの間の性能間隔に基づいて認知表現を最適化する動的プログラミングアルゴリズムである。
これは、その後のモデルトレーニングのためにより正確で体系的な入力機能を提供し、それによって認知状態のシミュレーションにおける歪みを最小限にする。
論文 参考訳(メタデータ) (2025-06-03T14:44:48Z) - Two-Stage Representation Learning for Analyzing Movement Behavior Dynamics in People Living with Dementia [44.39545678576284]
本研究では,認知症高齢者の在宅活動データを,2段階の自己指導型学習アプローチによって分析する。
第1段階は、時系列アクティビティを事前訓練された言語モデルによって符号化されたテキストシーケンスに変換する。
このPageRankベクトルは遅延状態遷移をキャプチャし、複雑な振る舞いデータを簡潔な形式に効果的に圧縮する。
論文 参考訳(メタデータ) (2025-02-13T10:57:25Z) - Clairvoyance: A Pipeline Toolkit for Medical Time Series [95.22483029602921]
時系列学習は、データ駆動の*クリニカルな意思決定支援のパンとバターである*
Clairvoyanceは、ソフトウェアツールキットとして機能する、統合されたエンドツーエンドのオートMLフレンドリなパイプラインを提案する。
Clairvoyanceは、臨床時系列MLのための包括的で自動化可能なパイプラインの生存可能性を示す最初のものである。
論文 参考訳(メタデータ) (2023-10-28T12:08:03Z) - A Knowledge-based Learning Framework for Self-supervised Pre-training
Towards Enhanced Recognition of Medical Images [14.304996977665212]
本研究では,医用画像の認識向上に向けた知識ベース学習フレームワークを提案する。
コントラスト学習と生成学習モデルを相乗化することで、3つのフェーズで機能する。
提案したフレームワークは、AUC/DiceのSimCLRよりも2.08, 1.23, 1.12, 0.76, 1.38ポイント改善された自己教師型ベンチマークで統計的に優れている。
論文 参考訳(メタデータ) (2022-11-27T03:58:58Z) - Self-Regulated Learning for Egocentric Video Activity Anticipation [147.9783215348252]
自己制御学習(SRL)は、中間表現を連続的に制御し、現在のタイムスタンプのフレームにおける新しい情報を強調する表現を作り出すことを目的としている。
SRLは2つのエゴセントリックなビデオデータセットと2つの第三者のビデオデータセットにおいて、既存の最先端技術よりも大幅に優れています。
論文 参考訳(メタデータ) (2021-11-23T03:29:18Z) - MIMO: Mutual Integration of Patient Journey and Medical Ontology for
Healthcare Representation Learning [49.57261599776167]
本稿では、医療表現学習と予測分析のための、エンドツーエンドの堅牢なトランスフォーマーベースのソリューション、患者旅行の相互統合、医療オントロジー(MIMO)を提案する。
論文 参考訳(メタデータ) (2021-07-20T07:04:52Z) - Visual Adversarial Imitation Learning using Variational Models [60.69745540036375]
逆関数仕様は、深い強化学習を通しての学習行動にとって大きな障害であり続けている。
望ましい行動の視覚的なデモンストレーションは、エージェントを教えるためのより簡単で自然な方法を示すことが多い。
変動モデルに基づく対向的模倣学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-07-16T00:15:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。