論文の概要: An Interpretable Transformer-Based Foundation Model for Cross-Procedural Skill Assessment Using Raw fNIRS Signals
- arxiv url: http://arxiv.org/abs/2506.22476v1
- Date: Sat, 21 Jun 2025 18:30:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 21:27:53.398365
- Title: An Interpretable Transformer-Based Foundation Model for Cross-Procedural Skill Assessment Using Raw fNIRS Signals
- Title(参考訳): 生 fNIRS 信号を用いたプロセス間スキル評価のための解釈可能なトランスフォーマーベース基礎モデル
- Authors: A. Subedi, S. De, L. Cavuoto, S. Schwaitzberg, M. Hackett, J. Norfleet,
- Abstract要約: 本稿では,FNIRS信号の最小処理に基づく解釈可能なトランスフォーマーベース基礎モデルを提案する。
このモデルは全てのタスクにおいて88%以上の分類精度を達成し、マシューズ相関係数はETIで0.91を超える。
これは、30個未満のラベル付きサンプルと軽量(2kパラメータ未満)アダプターモジュールを使用する新しい緊急気道手順に一般化する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Objective skill assessment in high-stakes procedural environments requires models that not only decode underlying cognitive and motor processes but also generalize across tasks, individuals, and experimental contexts. While prior work has demonstrated the potential of functional near-infrared spectroscopy (fNIRS) for evaluating cognitive-motor performance, existing approaches are often task-specific, rely on extensive preprocessing, and lack robustness to new procedures or conditions. Here, we introduce an interpretable transformer-based foundation model trained on minimally processed fNIRS signals for cross-procedural skill assessment. Pretrained using self-supervised learning on data from laparoscopic surgical tasks and endotracheal intubation (ETI), the model achieves greater than 88% classification accuracy on all tasks, with Matthews Correlation Coefficient exceeding 0.91 on ETI. It generalizes to a novel emergency airway procedure--cricothyrotomy--using fewer than 30 labeled samples and a lightweight (less than 2k parameter) adapter module, attaining an AUC greater than 87%. Interpretability is achieved via a novel channel attention mechanism--developed specifically for fNIRS--that identifies functionally coherent prefrontal sub-networks validated through ablation studies. Temporal attention patterns align with task-critical phases and capture stress-induced changes in neural variability, offering insight into dynamic cognitive states.
- Abstract(参考訳): 高度な手続き環境における客観的スキルアセスメントは、基礎となる認知的および運動過程をデコードするだけでなく、タスク、個人、実験的な文脈にまたがって一般化するモデルを必要とする。
従来の研究は、認知運動性能を評価するための機能的近赤外分光法(fNIRS)の可能性を実証してきたが、既存のアプローチはしばしばタスク固有であり、広範囲な前処理に依存し、新しい手順や条件に堅牢性が欠如している。
本稿では,FNIRS信号の最小処理に基づく解釈可能なトランスフォーマーベース基礎モデルを提案する。
腹腔鏡下手術と気管内挿管(ETI)のデータを用いた自己教師あり学習により,全作業において88%以上の分類精度を達成し,ETIでは0.91を超えるマシューズ相関係数が得られた。
30個未満のラベル付きサンプルと軽量(2kパラメータ未満)アダプターモジュールを使用し、AUCが87%以上に達する。
fNIRSのために特別に開発された新しいチャネルアテンション機構により、アブレーション研究によって検証された機能的に整合した前頭前野のサブネットワークを特定することによって、解釈可能性を実現する。
時間的注意パターンはタスククリティカルなフェーズと一致し、ストレスによって引き起こされる神経変動の変化を捉え、動的認知状態に関する洞察を提供する。
関連論文リスト
- End-to-End Deep Learning for Real-Time Neuroimaging-Based Assessment of Bimanual Motor Skills [1.710146779965826]
本研究では,fNIRS信号を直接処理する新しいエンドツーエンドディープラーニングフレームワークを提案する。
平均分類精度は93.9%(SD 4.4)、一般化精度は92.6%(SD 1.9)である。
論文 参考訳(メタデータ) (2025-03-21T22:56:54Z) - Domain Adaptive Diabetic Retinopathy Grading with Model Absence and Flowing Data [45.75724873443564]
ドメインシフトは、糖尿病網膜症などの臨床応用において重要な課題である。
本稿では,データ中心の観点から適応可能なGUES(Generative Unadversarial Examples)を提案する。
論文 参考訳(メタデータ) (2024-12-02T07:14:25Z) - Fine-tuning -- a Transfer Learning approach [0.22344294014777952]
電子健康記録(EHR)の欠落は、この貴重な資源に欠落するデータが豊富にあるため、しばしば妨げられる。
既存の深い計算手法は、計算処理とダウンストリーム解析の両方を組み込んだエンドツーエンドのパイプラインに依存している。
本稿では,モジュール型深層学習型計算・分類パイプラインの開発について検討する。
論文 参考訳(メタデータ) (2024-11-06T14:18:23Z) - Multi-stream deep learning framework to predict mild cognitive impairment with Rey Complex Figure Test [10.324611550865926]
2つの異なる処理ストリームを統合するマルチストリームディープラーニングフレームワークを開発した。
提案したマルチストリームモデルは,外部検証においてベースラインモデルよりも優れた性能を示した。
本モデルは,早期スクリーニングのための費用対効果のあるツールとして機能する,臨床現場における実用的意味を持つ。
論文 参考訳(メタデータ) (2024-09-04T17:08:04Z) - Improving Machine Learning Based Sepsis Diagnosis Using Heart Rate Variability [0.0]
本研究の目的は、心拍変動(HRV)機能を用いて、敗血症検出のための効果的な予測モデルを開発することである。
ニューラルネットワークモデルは、HRVの特徴に基づいてトレーニングされ、F1スコアは0.805、精度は0.851、リコールは0.763である。
論文 参考訳(メタデータ) (2024-08-01T01:47:29Z) - Enhancing Cognitive Workload Classification Using Integrated LSTM Layers and CNNs for fNIRS Data Analysis [13.74551296919155]
本稿では、ディープラーニングモデルにおける畳み込みニューラルネットワーク(CNN)の有効性に対する長期記憶層の影響について検討する。
LSTMレイヤを統合することで、モデルがfNIRSデータ内の時間的依存関係をキャプチャし、認知状態をより包括的に理解することが可能になる。
論文 参考訳(メタデータ) (2024-07-22T11:28:34Z) - Machine Learning for ALSFRS-R Score Prediction: Making Sense of the Sensor Data [44.99833362998488]
筋萎縮性側索硬化症(Amyotrophic Lateral Sclerosis、ALS)は、急速に進行する神経変性疾患である。
iDPP@CLEF 2024チャレンジを先導した今回の調査は,アプリから得られるセンサデータを活用することに焦点を当てている。
論文 参考訳(メタデータ) (2024-07-10T19:17:23Z) - Physics Inspired Hybrid Attention for SAR Target Recognition [61.01086031364307]
本稿では,物理にヒントを得たハイブリットアテンション(PIHA)機構と,この問題に対処するためのOFA評価プロトコルを提案する。
PIHAは、物理的情報の高レベルなセマンティクスを活用して、ターゲットの局所的なセマンティクスを認識した特徴群を活性化し、誘導する。
提案手法は,ASCパラメータが同じ12のテストシナリオにおいて,他の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2023-09-27T14:39:41Z) - Contrastive Conditional Neural Processes [45.70735205041254]
条件付きニューラル・プロセス(CNP)は、メタラーニング環境下でのプロセスの機能に近い確率的推論でニューラルネットワークをブリッジする。
2つの補助的コントラスト分岐が階層的に設定される。すなわち、インストラクテーション時間的コントラスト学習(tt TCL)とクロスストラクテーション関数コントラスト学習(tt FCL)である。
実験により、tt TCLは観測の高レベルの抽象化を捉えるのに対し、tt FCLは基底関数の同定に役立ち、より効率的な表現を提供することを示す。
論文 参考訳(メタデータ) (2022-03-08T10:08:45Z) - Real-time landmark detection for precise endoscopic submucosal
dissection via shape-aware relation network [51.44506007844284]
内視鏡下粘膜下郭清術における高精度かつリアルタイムなランドマーク検出のための形状認識型関係ネットワークを提案する。
まず,ランドマーク間の空間的関係に関する先行知識を直感的に表現する関係キーポイント・ヒートマップを自動生成するアルゴリズムを考案する。
次に、事前知識を学習プロセスに段階的に組み込むために、2つの補完的な正規化手法を開発する。
論文 参考訳(メタデータ) (2021-11-08T07:57:30Z) - TeCNO: Surgical Phase Recognition with Multi-Stage Temporal
Convolutional Networks [43.95869213955351]
外科的位相認識のための階層的予測補正を行う多段階時間畳み込みネットワーク(MS-TCN)を提案する。
本手法は腹腔鏡下胆嚢摘出術ビデオの2つのデータセットに対して,追加の外科的ツール情報を用いずに徹底的に評価した。
論文 参考訳(メタデータ) (2020-03-24T10:12:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。