論文の概要: DeepStroke: An Efficient Stroke Screening Framework for Emergency Rooms
with Multimodal Adversarial Deep Learning
- arxiv url: http://arxiv.org/abs/2109.12065v1
- Date: Fri, 24 Sep 2021 16:46:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2021-09-27 14:24:16.449672
- Title: DeepStroke: An Efficient Stroke Screening Framework for Emergency Rooms
with Multimodal Adversarial Deep Learning
- Title(参考訳): DeepStroke: マルチモーダル逆深層学習による緊急室の効率的なストロークスクリーニングフレームワーク
- Authors: Tongan Cai, Haomiao Ni, Mingli Yu, Xiaolei Huang, Kelvin Wong, John
Volpi, James Z. Wang, Stephen T.C. Wong
- Abstract要約: 緊急室(ER)では、脳梗塞の診断が一般的な課題である。
過剰な実行時間とコストのため、通常、MRIスキャンはERでは利用できない。
本稿では,コンピュータ支援型ストロークプレゼンス評価を実現するために,新しいマルチモーダル深層学習フレームワークDeepStrokeを提案する。
- 参考スコア(独自算出の注目度): 18.097454820713555
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In an emergency room (ER) setting, the diagnosis of stroke is a common
challenge. Due to excessive execution time and cost, an MRI scan is usually not
available in the ER. Clinical tests are commonly referred to in stroke
screening, but neurologists may not be immediately available. We propose a
novel multimodal deep learning framework, DeepStroke, to achieve computer-aided
stroke presence assessment by recognizing the patterns of facial motion
incoordination and speech inability for patients with suspicion of stroke in an
acute setting. Our proposed DeepStroke takes video data for local facial
paralysis detection and audio data for global speech disorder analysis. It
further leverages a multi-modal lateral fusion to combine the low- and
high-level features and provides mutual regularization for joint training. A
novel adversarial training loss is also introduced to obtain
identity-independent and stroke-discriminative features. Experiments on our
video-audio dataset with actual ER patients show that the proposed approach
outperforms state-of-the-art models and achieves better performance than ER
doctors, attaining a 6.60% higher sensitivity and maintaining 4.62% higher
accuracy when specificity is aligned. Meanwhile, each assessment can be
completed in less than 6 minutes, demonstrating the framework's great potential
for clinical implementation.
- Abstract(参考訳): 緊急室(ER)では、脳梗塞の診断が一般的な課題である。
過剰な実行時間とコストのため、通常、MRIスキャンはERでは利用できない。
臨床検査は脳卒中スクリーニングでは一般的に言及されるが、神経科医はすぐには利用できない。
急性期脳卒中疑い患者の顔の動きの調整パターンと発話障害を認識し,コンピュータ支援による脳卒中プレゼンス評価を実現するための,新しい多モードディープラーニングフレームワークであるDeepStrokeを提案する。
提案するdeep strokeは,局所顔面麻痺検出のための映像データと,グローバル音声障害解析のための音声データを用いる。
さらに、低レベルと高レベルの特徴を組み合わせるためにマルチモーダル側方融合を活用し、共同訓練に相互正則化を提供する。
また、識別非依存性および脳卒中識別性の特徴を得るために、新たな逆行訓練損失も導入されている。
実際のer患者によるビデオオーディオデータセットを用いた実験では,提案手法が最先端モデルよりも優れ,er医師よりも優れた性能を実現し,感度が6.60%向上し,特異度調整時の精度が4.62%向上した。
一方、各アセスメントは6分以内で完了でき、このフレームワークが臨床実装に持つ大きな可能性を示している。
関連論文リスト
- Multi-View Stenosis Classification Leveraging Transformer-Based Multiple-Instance Learning Using Real-World Clinical Data [76.89269238957593]
冠動脈狭窄は心血管疾患の主要な原因であり,多発血管造影で冠動脈を解析し診断した。
患者レベルの狭窄分類のためのトランスフォーマーベースマルチビューマルチインスタンス学習フレームワークであるSegmentMILを提案する。
論文 参考訳(メタデータ) (2026-02-02T13:07:52Z) - Digital FAST: An AI-Driven Multimodal Framework for Rapid and Early Stroke Screening [0.7136933021609076]
本研究では,F.A.S.T.アセスメントで収集したデータをもとに,高速かつ非侵襲的な2次脳卒中自動スクリーニングのための多モード深層学習フレームワークを提案する。
提案手法は, 表情, 音声信号, 上体動作からの相補的な情報を統合し, 診断の堅牢性を高める。
論文 参考訳(メタデータ) (2026-01-17T03:35:39Z) - EchoBench: Benchmarking Sycophancy in Medical Large Vision-Language Models [82.43729208063468]
医療用LVLM(Large Vision-Language Models)の最近のベンチマークでは、信頼性と安全性を見越して、リーダボードの精度を強調している。
ユーザが提供した情報を非批判的に反響させる傾向のモデルについて検討する。
医療用LVLMの梅毒を系統的に評価するベンチマークであるEchoBenchを紹介する。
論文 参考訳(メタデータ) (2025-09-24T14:09:55Z) - RAD: Towards Trustworthy Retrieval-Augmented Multi-modal Clinical Diagnosis [56.373297358647655]
Retrieval-Augmented Diagnosis (RAD)は、下流タスクで直接マルチモーダルモデルに外部知識を注入する新しいフレームワークである。
RADは、複数の医療ソースからの疾患中心の知識の検索と改善、ガイドライン強化コントラスト損失トランスフォーマー、デュアルデコーダの3つの主要なメカニズムで機能する。
論文 参考訳(メタデータ) (2025-09-24T10:36:14Z) - Personalization on a Budget: Minimally-Labeled Continual Learning for Resource-Efficient Seizure Detection [3.587595102085769]
本稿では,ディープラーニングを用いたてんかん発作の自動検出について検討する。
Epiは、患者固有の脳波信号に漸進的に適応するための継続的な学習フレームワークである。
平均して、Epiはラベル付きデータの6.46分と1日6.28の更新しか必要とせず、ウェアラブルシステムにおけるリアルタイムデプロイメントに適している。
論文 参考訳(メタデータ) (2025-09-17T13:47:45Z) - A Deep Learning-Based Ensemble System for Automated Shoulder Fracture Detection in Clinical Radiographs [0.0]
肩関節骨折はしばしば診断されないが、特に緊急時および高用量の臨床で診断される。
我々は1万個の注釈付き肩X線を用いた多モデル深層学習システムを開発した。
このアンサンブルベースのAIは、臨床関連性の高いX線写真で肩骨折を確実に検出することができる。
論文 参考訳(メタデータ) (2025-07-17T06:06:12Z) - Benchmarking and Explaining Deep Learning Cortical Lesion MRI Segmentation in Multiple Sclerosis [28.192924379673862]
多発性硬化症(MS)における生体マーカーとしての皮質病変(CL)の出現
本稿では,MRIにおけるCL検出とセグメンテーションの総合ベンチマークを提案する。
医療画像のセグメンテーションのために設計された自己構成のnnU-Netフレームワークを利用し、CL検出の改善に適した適応を提案する。
論文 参考訳(メタデータ) (2025-07-16T09:56:11Z) - NeuroMoE: A Transformer-Based Mixture-of-Experts Framework for Multi-Modal Neurological Disorder Classification [3.5313393560458826]
Deep Learningは最近、診断を助けるために医療データから意味のあるパターンを抽出する強力なツールとして登場した。
神経疾患を分類するための新しいトランスフォーマーベースのMixture-of-Experts(MoE)フレームワークを提案する。
我々のフレームワークは82.47%の検証精度を達成し、ベースライン法を10%以上上回っている。
論文 参考訳(メタデータ) (2025-06-17T20:40:06Z) - STIED: A deep learning model for the SpatioTemporal detection of focal Interictal Epileptiform Discharges with MEG [0.08030359871216612]
脳磁図(MEG)を用いたてんかん間葉状放電(IED)の非侵襲的検出
深層学習(DL)は臨床MEGの実践に革命をもたらす可能性がある。
我々は,2つの畳み込みニューラルネットワークと時間的(1次元時間軸)および空間的(2次元トポグラフィー)特徴を組み合わせた,強力で教師付きなDLアルゴリズムであるSTIEDを開発した。
論文 参考訳(メタデータ) (2024-10-30T18:41:22Z) - Detecting and clustering swallow events in esophageal long-term high-resolution manometry [48.688209040613216]
深達度学習に基づく飲み込み検出法を提案し, 二次性非解離性食道運動障害を正確に同定する。
われわれは,25 LTHRMで計算パイプラインを評価し,医療専門家の注意を喚起した。
論文 参考訳(メタデータ) (2024-05-02T09:41:31Z) - Automatic diagnosis of knee osteoarthritis severity using Swin
transformer [55.01037422579516]
変形性膝関節症 (KOA) は膝関節の慢性的な痛みと硬直を引き起こす疾患である。
我々は,Swin Transformer を用いて KOA の重大度を予測する自動手法を提案する。
論文 参考訳(メタデータ) (2023-07-10T09:49:30Z) - MAMAF-Net: Motion-Aware and Multi-Attention Fusion Network for Stroke
Diagnosis [1.4680035572775534]
ストロークは世界中で死亡率と障害の主な原因であり、そのうち4人に1人が生涯で死亡する恐れがある。
マルチモーダル検査ビデオからストロークを検出できる動き認識・マルチアテンション融合ネットワーク(MAMAF-Net)を提案する。
提案するMAMAF-Netは,患者の動きを感知する動き認識モジュールと,多入力映像データを融合する注意モジュールと,注意ベース抽出特徴から診断する3次元畳み込み層とから構成される。
論文 参考訳(メタデータ) (2023-04-19T07:27:21Z) - AIOSA: An approach to the automatic identification of obstructive sleep
apnea events based on deep learning [1.5381930379183162]
OSASは、死亡率の上昇、神経障害の悪化、リハビリテーション後の機能低下、高血圧の発症率の上昇と関連している。
OSAS診断のための金標準検査はPSG (Polysomnography) である。
生波形データの時間分解能を低減できる畳み込み型ディープラーニングアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-02-10T11:21:47Z) - Collective Intelligent Strategy for Improved Segmentation of COVID-19
from CT [0.2062593640149623]
本研究では, 深層学習と画像を用いた非侵襲的非侵襲ツールを提案する。
Ensembling Attention-based Multi-scaled Convolution Network (EAMC) は感染領域のアウトラインにおいて高い感度と精度を示す。
その臨床的意義は、遠隔地で専門的な医療を欠く患者に低コストな意思決定を提供することにおいて、前例のない範囲にある。
論文 参考訳(メタデータ) (2022-12-23T11:24:29Z) - Learnable Patchmatch and Self-Teaching for Multi-Frame Depth Estimation in Monocular Endoscopy [16.233423010425355]
教師なしマルチフレーム単眼深度推定モデルを提案する。
提案モデルでは、学習可能なパッチマッチモジュールを統合し、低次および均質なテクスチャを持つ領域における識別能力を適応的に向上させる。
自己学習パラダイムの副産物として,テスト時により多くのフレームが入力されたときの深度予測を改善することができる。
論文 参考訳(メタデータ) (2022-05-30T12:11:03Z) - Outlier-based Autism Detection using Longitudinal Structural MRI [6.311381904410801]
本稿では, 構造的磁気共鳴画像(sMRI)に基づく自閉症スペクトラム障害の診断を, 異常検出手法を用いて提案する。
GAN(Generative Adversarial Network)は、健康な被験者のsMRIスキャンでのみ訓練される。
実験の結果、ASD検出フレームワークは最先端のトレーニングデータと互換性があり、トレーニングデータもはるかに少ないことがわかった。
論文 参考訳(メタデータ) (2022-02-21T04:37:25Z) - A Deep Learning Approach to Predicting Collateral Flow in Stroke
Patients Using Radiomic Features from Perfusion Images [58.17507437526425]
側方循環は、血流を妥協した領域に酸素を供給する特殊な無酸素流路から生じる。
実際のグレーティングは主に、取得した画像の手動検査によって行われる。
MR灌流データから抽出した放射線学的特徴に基づいて,脳卒中患者の側方血流低下を予測するための深層学習手法を提案する。
論文 参考訳(メタデータ) (2021-10-24T18:58:40Z) - An Interpretable Multiple-Instance Approach for the Detection of
referable Diabetic Retinopathy from Fundus Images [72.94446225783697]
基礎画像における参照糖尿病網膜症検出のための機械学習システムを提案する。
画像パッチから局所情報を抽出し,アテンション機構により効率的に組み合わせることで,高い分類精度を実現することができる。
我々は,現在入手可能な網膜画像データセットに対するアプローチを評価し,最先端の性能を示す。
論文 参考訳(メタデータ) (2021-03-02T13:14:15Z) - Cross-Modal Information Maximization for Medical Imaging: CMIM [62.28852442561818]
病院では、同じ情報を異なるモダリティの下で利用できるようにする特定の情報システムにデータがサイロ化される。
これは、テスト時に常に利用できないかもしれない同じ情報の複数のビューを列車で取得し、使用するためのユニークな機会を提供する。
テスト時にモダリティの低下に耐性を持つマルチモーダル入力の優れた表現を学習することで、利用可能なデータを最大限活用する革新的なフレームワークを提案する。
論文 参考訳(メタデータ) (2020-10-20T20:05:35Z) - Detecting Parkinsonian Tremor from IMU Data Collected In-The-Wild using
Deep Multiple-Instance Learning [59.74684475991192]
パーキンソン病(英: Parkinson's Disease、PD)は、60歳以上の人口の約1%に影響を与える徐々に進化する神経学的疾患である。
PD症状には、震動、剛性、ブレイキネジアがある。
本稿では,スマートフォン端末から受信したIMU信号に基づいて,PDに関連するトレモラスなエピソードを自動的に識別する手法を提案する。
論文 参考訳(メタデータ) (2020-05-06T09:02:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。