論文の概要: A store-and-forward cloud-based telemonitoring system for automatic
assessing dysarthria evolution in neurological diseases from video-recording
analysis
- arxiv url: http://arxiv.org/abs/2309.09038v1
- Date: Sat, 16 Sep 2023 16:24:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-19 17:55:14.543421
- Title: A store-and-forward cloud-based telemonitoring system for automatic
assessing dysarthria evolution in neurological diseases from video-recording
analysis
- Title(参考訳): ビデオ記録解析による脳神経疾患の変形自動評価のためのストア・アンド・フォワード型遠隔監視システム
- Authors: Lucia Migliorelli, Daniele Berardini, Kevin Cela, Michela Coccia,
Laura Villani, Emanuele Frontoni, Sara Moccia
- Abstract要約: 神経疾患に苦しむ患者は、発語に影響を及ぼす運動性発声障害である失語を発症する可能性がある。
この研究は、クラウドアーキテクチャの中で、変形性障害を持つ個人が取得したビデオ記録を分析するための畳み込みニューラルネットワーク(CNN)を統合するストア・アンド・フォワード遠隔監視システムを提案する。
- 参考スコア(独自算出の注目度): 8.275082697744084
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Background and objectives: Patients suffering from neurological diseases may
develop dysarthria, a motor speech disorder affecting the execution of speech.
Close and quantitative monitoring of dysarthria evolution is crucial for
enabling clinicians to promptly implement patient management strategies and
maximizing effectiveness and efficiency of communication functions in term of
restoring, compensating or adjusting. In the clinical assessment of orofacial
structures and functions, at rest condition or during speech and non-speech
movements, a qualitative evaluation is usually performed, throughout visual
observation. Methods: To overcome limitations posed by qualitative assessments,
this work presents a store-and-forward self-service telemonitoring system that
integrates, within its cloud architecture, a convolutional neural network (CNN)
for analyzing video recordings acquired by individuals with dysarthria. This
architecture, called facial landmark Mask RCNN, aims at locating facial
landmarks as a prior for assessing the orofacial functions related to speech
and examining dysarthria evolution in neurological diseases. Results: When
tested on the Toronto NeuroFace dataset, a publicly available annotated dataset
of video recordings from patients with amyotrophic lateral sclerosis (ALS) and
stroke, the proposed CNN achieved a normalized mean error equal to 1.79 on
localizing the facial landmarks. We also tested our system in a real-life
scenario on 11 bulbar-onset ALS subjects, obtaining promising outcomes in terms
of facial landmark position estimation. Discussion and conclusions: This
preliminary study represents a relevant step towards the use of remote tools to
support clinicians in monitoring the evolution of dysarthria.
- Abstract(参考訳): 背景と目的: 神経疾患に苦しむ患者は、発話の実行に影響を与える運動性言語障害であるジステリアを発症する可能性がある。
臨床医が患者の管理戦略を迅速に実施し、回復、補充、調整の際のコミュニケーション機能の有効性と効率を最大化するためには、難治性進化の綿密かつ定量的なモニタリングが不可欠である。
顔面構造や機能,休息状態,音声・非音声動作の臨床的評価では,視覚的観察を通して質的評価が通常行われる。
方法:質的評価によって生じる限界を克服するため,本研究では,クラウドアーキテクチャ内に,不整脈を有する個人が取得したビデオ記録を分析する畳み込みニューラルネットワーク(cnn)を統合した,ストア・アンド・フォワード型セルフサービス遠隔監視システムを提案する。
このアーキテクチャは、Mask RCNNと呼ばれ、顔のランドマークを、音声に関連する口腔機能の評価と、神経疾患の変形の観察の先駆けとして位置づけることを目的としている。
結果: 筋萎縮性側索硬化症 (als) および脳卒中患者からの映像記録を一般公開したannotated datasetであるトロント・ニューロフェイス・データセットでテストしたところ, 顔ランドマークのローカライズにおいて, cnnの正規化平均誤差は1.79。
また,11名の球根型als被験者に対して実生活シナリオで実験を行い,顔のランドマーク位置推定で有望な結果を得た。
考察と結論:この予備研究は、変形の進化を監視するために臨床医を支援するための遠隔ツールの使用に向けた重要なステップである。
関連論文リスト
- Developing vocal system impaired patient-aimed voice quality assessment approach using ASR representation-included multiple features [0.4681310436826459]
本稿では,音声認識と自己教師型学習表現の利用について紹介する。
実験ではPVQDデータセットのチェックを行い、英語における様々な声道系の損傷の原因をカバーし、パーキンソン病の患者に焦点を当てた日本語データセットを作成した。
PVQDの結果, PCCでは0.8, MSEでは0.5と顕著な相関がみられた。
論文 参考訳(メタデータ) (2024-08-22T10:22:53Z) - AutoRG-Brain: Grounded Report Generation for Brain MRI [57.22149878985624]
放射線学者は、大量の画像を日々のベースで解釈し、対応するレポートを生成する責任を負う。
この要求される作業負荷は、人間のエラーのリスクを高め、治療の遅れ、医療費の増加、収益損失、運用上の不効率につながる可能性がある。
地盤自動報告生成(AutoRG)に関する一連の研究を開始した。
このシステムは、脳の構造の明細化、異常の局所化、そしてよく組織化された発見の生成をサポートする。
論文 参考訳(メタデータ) (2024-07-23T17:50:00Z) - Dr-LLaVA: Visual Instruction Tuning with Symbolic Clinical Grounding [53.629132242389716]
VLM(Vision-Language Models)は、医用画像を分析し、自然言語の相互作用に関与することによって、臨床医を支援する。
VLMはしばしば「幻覚的」な振る舞いを示し、文脈的マルチモーダル情報に基づかないテキスト出力を生成する。
本稿では,臨床推論の象徴的表現を用いて医療知識にVLMを基盤とする新たなアライメントアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-05-29T23:19:28Z) - Exploring neural oscillations during speech perception via surrogate gradient spiking neural networks [59.38765771221084]
本稿では、ディープラーニングフレームワークと互換性があり、スケーラブルな、生理学的にインスパイアされた音声認識アーキテクチャを提案する。
本研究では, 終末から終末までの勾配降下訓練が, 中枢スパイク神経ネットワークにおける神経振動の出現に繋がることを示す。
本研究は, スパイク周波数適応やリカレント接続などのフィードバック機構が, 認識性能を向上させるために, 神経活動の調節と同期に重要な役割を担っていることを明らかにする。
論文 参考訳(メタデータ) (2024-04-22T09:40:07Z) - Eye-tracking in Mixed Reality for Diagnosis of Neurodegenerative Diseases [0.2686968510141288]
パーキンソン病は世界で2番目に多い神経変性疾患である。
本研究の目的は、眼球運動の追跡・評価にMixed Reality機能を活用するシステムを開発することである。
論文 参考訳(メタデータ) (2024-04-19T16:34:15Z) - Estimating the severity of dental and oral problems via sentiment
classification over clinical reports [0.8287206589886879]
テキストにおける著者の感情を分析することは、医学や歯科など様々な分野において実用的で有用である。
CNN-LSTMとして知られる畳み込みニューラルネットワーク(CNN)とLong Short-Term Memory(LSTM)ネットワークアーキテクチャに基づくディープラーニングモデルを開発した。
論文 参考訳(メタデータ) (2024-01-17T14:33:13Z) - Deep Learning Approaches for Seizure Video Analysis: A Review [40.1521024778093]
コンピュータ支援による発作の映像分析が自然の道として現れている。
ディープラーニングとコンピュータビジョンのアプローチは、大幅な進歩をもたらした。
これらの主な応用は、(1)発作検出法の改善、(2)発作のタイプと脳の局在を予測するための洗練されたセミロジー分析である。
論文 参考訳(メタデータ) (2023-12-18T04:45:41Z) - The Face of Affective Disorders [7.4005714204825646]
臨床領域における脳刺激の調節によって変化する顔面行動の統計的特性について検討した。
我々は,現代のカメラを用いたリアルタイム信号処理とコンピュータビジョンにのみ依存する,古典的な頭皮型閉塞型センサであるオプト・エレクトロニック・脳波(OEG)の意味で,提示された測定値を命名した。
論文 参考訳(メタデータ) (2022-08-02T11:28:17Z) - fMRI Neurofeedback Learning Patterns are Predictive of Personal and
Clinical Traits [62.997667081978825]
機能的MRI(fMRI)による自律神経運動課題における学習経過の個人的シグネチャを得る。
署名は、第1セッションで同様のfMRI由来の脳の状態が与えられた後、第2セッションで扁桃体の活動を予測することに基づいている。
論文 参考訳(メタデータ) (2021-12-21T06:52:48Z) - Learning Personal Representations from fMRIby Predicting Neurofeedback
Performance [52.77024349608834]
機能的MRI(fMRI)によって導かれる自己神経変調タスクを行う個人のための個人表現を学習するためのディープニューラルネットワーク手法を提案する。
この表現は、直近のfMRIフレームが与えられた次のfMRIフレームにおける扁桃体活動を予測する自己教師型リカレントニューラルネットワークによって学習され、学習された個々の表現に条件付けされる。
論文 参考訳(メタデータ) (2021-12-06T10:16:54Z) - An Interpretable Multiple-Instance Approach for the Detection of
referable Diabetic Retinopathy from Fundus Images [72.94446225783697]
基礎画像における参照糖尿病網膜症検出のための機械学習システムを提案する。
画像パッチから局所情報を抽出し,アテンション機構により効率的に組み合わせることで,高い分類精度を実現することができる。
我々は,現在入手可能な網膜画像データセットに対するアプローチを評価し,最先端の性能を示す。
論文 参考訳(メタデータ) (2021-03-02T13:14:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。