論文の概要: Towards trustworthy seizure onset detection using workflow notes
- arxiv url: http://arxiv.org/abs/2306.08728v1
- Date: Wed, 14 Jun 2023 20:13:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-16 17:34:29.445547
- Title: Towards trustworthy seizure onset detection using workflow notes
- Title(参考訳): ワークフローノートを用いた信頼できる発作検出に向けて
- Authors: Khaled Saab, Siyi Tang, Mohamed Taha, Christopher Lee-Messer,
Christopher R\'e, Daniel Rubin
- Abstract要約: 本稿では,医療従事者が日常臨床で作成するアノテーションを活用することを提案する。
トレーニングデータを68,920EEG時間にスケールアップすることにより、発作発生検出性能が大幅に向上することを示す。
また、スパイク、スロー、モーションアーティファクトなど、発作以外の26の属性を分類するマルチラベルモデルを訓練する。
- 参考スコア(独自算出の注目度): 5.536372101225628
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A major barrier to deploying healthcare AI models is their trustworthiness.
One form of trustworthiness is a model's robustness across different subgroups:
while existing models may exhibit expert-level performance on aggregate
metrics, they often rely on non-causal features, leading to errors in hidden
subgroups. To take a step closer towards trustworthy seizure onset detection
from EEG, we propose to leverage annotations that are produced by healthcare
personnel in routine clinical workflows -- which we refer to as workflow notes
-- that include multiple event descriptions beyond seizures. Using workflow
notes, we first show that by scaling training data to an unprecedented level of
68,920 EEG hours, seizure onset detection performance significantly improves
(+12.3 AUROC points) compared to relying on smaller training sets with
expensive manual gold-standard labels. Second, we reveal that our binary
seizure onset detection model underperforms on clinically relevant subgroups
(e.g., up to a margin of 6.5 AUROC points between pediatrics and adults), while
having significantly higher false positives on EEG clips showing
non-epileptiform abnormalities compared to any EEG clip (+19 FPR points). To
improve model robustness to hidden subgroups, we train a multilabel model that
classifies 26 attributes other than seizures, such as spikes, slowing, and
movement artifacts. We find that our multilabel model significantly improves
overall seizure onset detection performance (+5.9 AUROC points) while greatly
improving performance among subgroups (up to +8.3 AUROC points), and decreases
false positives on non-epileptiform abnormalities by 8 FPR points. Finally, we
propose a clinical utility metric based on false positives per 24 EEG hours and
find that our multilabel model improves this clinical utility metric by a
factor of 2x across different clinical settings.
- Abstract(参考訳): 医療AIモデルをデプロイする上で大きな障壁は、信頼性だ。
既存のモデルは、集約されたメトリクスに専門家レベルのパフォーマンスを示すことがあるが、それらはしばしば非因果的特徴に依存し、隠れたサブグループのエラーにつながる。
脳波からの信頼できる発作発生検出に向けて、我々は、発作以外の複数のイベント記述を含む、日常的な臨床ワークフロー(ワークフローノートと呼ばれる)で医療関係者が作成するアノテーションを活用することを提案する。
ワークフローノートを用いて、トレーニングデータを68,920 EEG時間にスケールアップすることにより、高価な手作業によるゴールドスタンダードラベルによる小さなトレーニングセットに依存するよりも、発作発生検出性能が著しく向上する(+12.3 AUROCポイント)ことを示す。
第2に, 2次発作検出モデルは, 臨床的に関連のあるサブグループ (小児と成人の間では最大6.5 auroc point) に過小評価され, また, 任意の脳波クリップ (+19 fpr) と比較して, 非てんかん性異常を示す脳波クリップでは有意に高い偽陽性率を示した。
隠れたサブグループに対するモデルロバスト性を改善するために、スパイク、減速、移動アーティファクトなど、発作以外の26の属性を分類するマルチラベルモデルを訓練する。
その結果, マルチラベルモデルでは, 発作発生検出性能(+5.9 AUROC点)が有意に向上し, サブグループ(+8.3 AUROC点)のパフォーマンスが向上し, 非てんかん性異常に対する偽陽性が8FPR点まで低下することがわかった。
最後に,24脳波時間あたりの偽陽性率に基づく臨床ユーティリティ指標を提案するとともに,この臨床ユーティリティ指標を異なる臨床設定で2倍改善するマルチラベルモデルを提案する。
関連論文リスト
- Weakly supervised deep learning model with size constraint for prostate cancer detection in multiparametric MRI and generalization to unseen domains [0.90668179713299]
本モデルでは, 完全教師付きベースラインモデルにより, オンパー性能が向上することを示す。
また、未確認データドメインでテストした場合、完全に教師付きモデルと弱い教師付きモデルの両方のパフォーマンス低下も観察する。
論文 参考訳(メタデータ) (2024-11-04T12:24:33Z) - Multi-stream deep learning framework to predict mild cognitive impairment with Rey Complex Figure Test [10.324611550865926]
2つの異なる処理ストリームを統合するマルチストリームディープラーニングフレームワークを開発した。
提案したマルチストリームモデルは,外部検証においてベースラインモデルよりも優れた性能を示した。
本モデルは,早期スクリーニングのための費用対効果のあるツールとして機能する,臨床現場における実用的意味を持つ。
論文 参考訳(メタデータ) (2024-09-04T17:08:04Z) - How Does Pruning Impact Long-Tailed Multi-Label Medical Image
Classifiers? [49.35105290167996]
プルーニングは、ディープニューラルネットワークを圧縮し、全体的なパフォーマンスに大きな影響を及ぼすことなく、メモリ使用量と推論時間を短縮する強力なテクニックとして登場した。
この研究は、プルーニングがモデル行動に与える影響を理解するための第一歩である。
論文 参考訳(メタデータ) (2023-08-17T20:40:30Z) - Learning Clinical Concepts for Predicting Risk of Progression to Severe
COVID-19 [17.781861866125023]
大手医療機関のデータを用いて、重度の新型コロナウイルスの進行を予測する生存モデルを開発する。
i) 利用可能なすべての特徴から構築された制約のないモデル,(ii) リスク予測器を訓練する前に少数の臨床概念を学習するパイプラインである。
論文 参考訳(メタデータ) (2022-08-28T02:59:35Z) - SOUL: An Energy-Efficient Unsupervised Online Learning Seizure Detection
Classifier [68.8204255655161]
神経活動を記録して発作を検出するインプラントデバイスは、発作を抑えるために警告を発したり神経刺激を誘発したりするために採用されている。
移植可能な発作検出システムでは、低出力で最先端のオンライン学習アルゴリズムを使用して、神経信号のドリフトに動的に適応することができる。
SOULはTSMCの28nmプロセスで0.1mm2を占め、1.5nJ/分級エネルギー効率を実現した。
論文 参考訳(メタデータ) (2021-10-01T23:01:20Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Convolutional Neural Networks for Sleep Stage Scoring on a Two-Channel
EEG Signal [63.18666008322476]
睡眠障害は、世界中の主要な病気の1つです。
専門家が使用する基本的なツールはPolysomnogramで、睡眠中に記録された様々な信号の集合である。
専門家は、標準的なガイドラインの1つに従って異なる信号を採点する必要があります。
論文 参考訳(メタデータ) (2021-03-30T09:59:56Z) - Severity Quantification and Lesion Localization of COVID-19 on CXR using
Vision Transformer [25.144248675578286]
世界的な新型コロナウイルス(covid-19)のパンデミックの中で、covid-19の重症度を定量化する自動化フレームワークの構築がますます重要になっている。
重症度と臨床応用可能な新型コロナウイルス関連病変の局在を定量化するための新しい視覚トランスフォーマを提案する。
我々のモデルは、弱い配列に基づくラベルから全確率マップを生成するために、弱教師付きで訓練されている。
論文 参考訳(メタデータ) (2021-03-12T03:17:19Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - EventScore: An Automated Real-time Early Warning Score for Clinical
Events [3.3039612529376625]
臨床劣化を示す各種臨床事象の早期予測のための解釈可能なモデルを構築した。
このモデルは2つのデータセットと4つの臨床イベントで評価される。
私達のモデルは手動で記録された特徴を要求しないで完全に自動化することができます。
論文 参考訳(メタデータ) (2021-02-11T11:55:08Z) - Self-Training with Improved Regularization for Sample-Efficient Chest
X-Ray Classification [80.00316465793702]
挑戦的なシナリオで堅牢なモデリングを可能にするディープラーニングフレームワークを提案する。
その結果,85%のラベル付きデータを用いて,大規模データ設定で学習した分類器の性能に適合する予測モデルを構築することができた。
論文 参考訳(メタデータ) (2020-05-03T02:36:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。