論文の概要: Detecting Parkinson's Disease From an Online Speech-task
- arxiv url: http://arxiv.org/abs/2009.01231v4
- Date: Tue, 15 Dec 2020 21:08:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-22 19:01:45.690482
- Title: Detecting Parkinson's Disease From an Online Speech-task
- Title(参考訳): オンライン音声タスクからパーキンソン病を検出する
- Authors: Wasifur Rahman, Sangwu Lee, Md. Saiful Islam, Victor Nikhil Antony,
Harshil Ratnu, Mohammad Rafayet Ali, Abdullah Al Mamun, Ellen Wagner, Stella
Jensen-Roberts, Max A. Little, Ray Dorsey, and Ehsan Hoque
- Abstract要約: 本稿では,世界中のどこでも短時間の音声タスクを記録できるWebベースのフレームワークを構想し,パーキンソン病(PD)のスクリーニングのために記録データを解析する。
対象者は726名(女性262名,女性38%,非女性464名,女性65%,平均年齢61名)であった。
音声データから標準音響特徴(MFCC)、ジッタおよびシマー変種(シマー変種)、および深層学習に基づく特徴を抽出した。
我々のモデルは、制御された実験室で収集されたデータと「野生」でも同様に良好に機能した。
- 参考スコア(独自算出の注目度): 4.968576908394359
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: In this paper, we envision a web-based framework that can help anyone,
anywhere around the world record a short speech task, and analyze the recorded
data to screen for Parkinson's disease (PD). We collected data from 726 unique
participants (262 PD, 38% female; 464 non-PD, 65% female; average age: 61) --
from all over the US and beyond. A small portion of the data was collected in a
lab setting to compare quality. The participants were instructed to utter a
popular pangram containing all the letters in the English alphabet "the quick
brown fox jumps over the lazy dog..". We extracted both standard acoustic
features (Mel Frequency Cepstral Coefficients (MFCC), jitter and shimmer
variants) and deep learning based features from the speech data. Using these
features, we trained several machine learning algorithms. We achieved 0.75 AUC
(Area Under The Curve) performance on determining presence of self-reported
Parkinson's disease by modeling the standard acoustic features through the
XGBoost -- a gradient-boosted decision tree model. Further analysis reveal that
the widely used MFCC features and a subset of previously validated dysphonia
features designed for detecting Parkinson's from verbal phonation task
(pronouncing 'ahh') contains the most distinct information. Our model performed
equally well on data collected in controlled lab environment as well as 'in the
wild' across different gender and age groups. Using this tool, we can collect
data from almost anyone anywhere with a video/audio enabled device,
contributing to equity and access in neurological care.
- Abstract(参考訳): 本稿では,世界中のどこでも短時間の音声タスクを記録できるWebベースのフレームワークを構想し,パーキンソン病(PD)のスクリーニングのために記録データを解析する。
726人の独特な参加者(262人、女性38%、非pd464人、女性65%、平均年齢61人)のデータを米国中以降から収集した。
データのごく一部は、品質を比較するために実験室で収集された。
参加者は、英語のアルファベット「the quick brown fox jump over the lazy dog.」の文字を全て含む人気パングラムを発声するよう指示された。
音声データから標準音響的特徴(メル周波数ケプストラム係数(mfcc)、ジッターおよびシマー変種)とディープラーニングに基づく特徴を抽出した。
これらの機能を使って、いくつかの機械学習アルゴリズムを訓練しました。
傾斜型決定木モデルXGBoostを用いて,標準的な音響特性をモデル化し,自己報告型パーキンソン病の有無を判定する性能を 0.75 AUC (Area Under The Curve) で達成した。
さらなる分析により、広く使われているmfccの特徴と、パーキンソンの言語発声タスク(ahh)からパーキンソンを検出するために設計された、以前に検証された不協和音の特徴のサブセットが、最も異なる情報を含んでいることが判明した。
実験では,対照実験環境で収集したデータと,性別や年齢の異なる「野生」のデータについて,等しく評価した。
このツールを使用することで、ビデオ/オーディオ対応デバイスを使用して、ほぼ誰からもデータを集め、公平性と神経学的ケアへのアクセスに貢献することができます。
関連論文リスト
- A Novel Fusion Architecture for PD Detection Using Semi-Supervised Speech Embeddings [8.996456485141069]
本稿では,パーキンソン病(PD)をWebアプリケーションを用いて収集した英語パングラム発話音声を通して認識する枠組みを提案する。
我々のデータセットには、PDと診断された392人を含む1306人の世界的コホートが含まれている。
We used deep learning embeddeds derived from semi-supervised model, Wav2Vec 2.0, WavLM, ImageBind represented the speech dynamics associated with PD。
論文 参考訳(メタデータ) (2024-05-21T16:06:51Z) - NeuroVoz: a Castillian Spanish corpus of parkinsonian speech [36.23298373892936]
NeuroVozは、平均26.88 pm 3.35$のオーディオ録音2,903枚で構成されている。
このデータセットは、すでにいくつかの研究を基盤にしており、PD音声パターン識別のベンチマーク精度は89%に達している。
論文 参考訳(メタデータ) (2024-03-04T16:17:39Z) - PULSAR: Graph based Positive Unlabeled Learning with Multi Stream
Adaptive Convolutions for Parkinson's Disease Recognition [1.9482539692051932]
パーキンソン病(英: Parkinsons disease、PD)は、運動、発話、協調に影響を及ぼす神経変性疾患である。
本稿では,ウェブカメラで記録した指タップのビデオからPDをスクリーニングする新しい手法PULSARを提案する。
適応型グラフ畳み込みニューラルネットワークを用いて,指触りタスクに特有の時間グラフを動的に学習した。
論文 参考訳(メタデータ) (2023-12-10T05:56:20Z) - Decoding speech perception from non-invasive brain recordings [48.46819575538446]
非侵襲的な記録から知覚音声の自己教師付き表現をデコードするために、コントラスト学習で訓練されたモデルを導入する。
我々のモデルでは、3秒のMEG信号から、1,000以上の異なる可能性から最大41%の精度で対応する音声セグメントを識別できる。
論文 参考訳(メタデータ) (2022-08-25T10:01:43Z) - Remote Medication Status Prediction for Individuals with Parkinson's
Disease using Time-series Data from Smartphones [75.23250968928578]
本稿では,パーキンソン病患者のmPowerデータセットを用いて薬剤状態を予測する方法を提案する。
提案手法は,3つの薬物状態を客観的に予測する上で有望な結果を示す。
論文 参考訳(メタデータ) (2022-07-26T02:08:08Z) - Subgroup discovery of Parkinson's Disease by utilizing a multi-modal
smart device system [63.20765930558542]
われわれはスマートウォッチとスマートフォンを使って、PD患者、DD、HCを含む504人の参加者のマルチモーダルデータを収集した。
様々なモダリティを組み合わせることで,分類精度が向上し,さらにPDクラスタが発見された。
論文 参考訳(メタデータ) (2022-05-12T08:59:57Z) - Parkinson's disease diagnostics using AI and natural language knowledge
transfer [0.0]
PDと診断された症例における生音声の分類のための深層学習手法を提案する。
対象は, PD患者38名, 健常者10名で, 50歳以上であった。
論文 参考訳(メタデータ) (2022-04-26T19:39:29Z) - Automatic Dialect Density Estimation for African American English [74.44807604000967]
アフリカ・アメリカン・イングリッシュ(AAE)方言の方言密度の自動予測について検討する。
方言密度は、非標準方言の特徴を含む発話における単語の割合として定義される。
このデータベースでは,AAE音声に対する予測された真理弁証密度と地上の真理弁証密度との間に有意な相関関係を示す。
論文 参考訳(メタデータ) (2022-04-03T01:34:48Z) - Comparative Study of Speech Analysis Methods to Predict Parkinson's
Disease [0.0]
発声障害は、変性する前にこの疾患を検出するために用いられる。
この研究は、PDを予測するための音声特徴と機械学習アプローチを分析する。
全ての音響特性とMFCCを使い、SVMと共に98%の精度で最高の性能を実現した。
論文 参考訳(メタデータ) (2021-11-15T04:29:51Z) - Predicting Parkinson's Disease with Multimodal Irregularly Collected
Longitudinal Smartphone Data [75.23250968928578]
パーキンソン病は神経疾患であり、高齢者に多い。
伝統的に病気を診断する方法は、一連の活動テストの品質に関する個人的主観的臨床評価に依存している。
そこで本研究では,スマートフォンが収集した生の行動データを用いて,パーキンソン病を予測するための時系列に基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2020-09-25T01:50:15Z) - Detecting Parkinsonian Tremor from IMU Data Collected In-The-Wild using
Deep Multiple-Instance Learning [59.74684475991192]
パーキンソン病(英: Parkinson's Disease、PD)は、60歳以上の人口の約1%に影響を与える徐々に進化する神経学的疾患である。
PD症状には、震動、剛性、ブレイキネジアがある。
本稿では,スマートフォン端末から受信したIMU信号に基づいて,PDに関連するトレモラスなエピソードを自動的に識別する手法を提案する。
論文 参考訳(メタデータ) (2020-05-06T09:02:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。