論文の概要: Classifying Autism from Crowdsourced Semi-Structured Speech Recordings:
A Machine Learning Approach
- arxiv url: http://arxiv.org/abs/2201.00927v1
- Date: Tue, 4 Jan 2022 01:31:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-05 22:03:02.914042
- Title: Classifying Autism from Crowdsourced Semi-Structured Speech Recordings:
A Machine Learning Approach
- Title(参考訳): クラウドソーシングによる半構造化音声記録からの自閉症の分類:機械学習アプローチ
- Authors: Nathan A. Chi, Peter Washington, Aaron Kline, Arman Husic, Cathy Hou,
Chloe He, Kaitlyn Dunlap, and Dennis Wall
- Abstract要約: 本研究では,家庭環境における自閉症・ニューロタイプ(NT)児の自己記録音声における自閉症検出のための機械学習手法について述べる。
まず、抽出音声の特徴を訓練したランダムフォレスト、スペクトルを訓練した第2の畳み込みニューラルネットワーク(CNN)、そして第3の、最先端のトランスフォーマーベースのASRモデルであるwav2vec 2.0の3つの方法を検討する。
- 参考スコア(独自算出の注目度): 0.9945783208680666
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autism spectrum disorder (ASD) is a neurodevelopmental disorder which results
in altered behavior, social development, and communication patterns. In past
years, autism prevalence has tripled, with 1 in 54 children now affected. Given
that traditional diagnosis is a lengthy, labor-intensive process, significant
attention has been given to developing systems that automatically screen for
autism. Prosody abnormalities are among the clearest signs of autism, with
affected children displaying speech idiosyncrasies including echolalia,
monotonous intonation, atypical pitch, and irregular linguistic stress
patterns. In this work, we present a suite of machine learning approaches to
detect autism in self-recorded speech audio captured from autistic and
neurotypical (NT) children in home environments. We consider three methods to
detect autism in child speech: first, Random Forests trained on extracted audio
features (including Mel-frequency cepstral coefficients); second, convolutional
neural networks (CNNs) trained on spectrograms; and third, fine-tuned wav2vec
2.0--a state-of-the-art Transformer-based ASR model. We train our classifiers
on our novel dataset of cellphone-recorded child speech audio curated from
Stanford's Guess What? mobile game, an app designed to crowdsource videos of
autistic and neurotypical children in a natural home environment. The Random
Forest classifier achieves 70% accuracy, the fine-tuned wav2vec 2.0 model
achieves 77% accuracy, and the CNN achieves 79% accuracy when classifying
children's audio as either ASD or NT. Our models were able to predict autism
status when training on a varied selection of home audio clips with
inconsistent recording quality, which may be more generalizable to real world
conditions. These results demonstrate that machine learning methods offer
promise in detecting autism automatically from speech without specialized
equipment.
- Abstract(参考訳): 自閉症スペクトラム障害(Autism spectrum disorder、ASD)は、行動の変化、社会的発達、コミュニケーションパターンをもたらす神経発達障害である。
近年では自閉症の有病率は3倍になり、54人中1人が影響を受けた。
従来の診断が長く、労働集約的なプロセスであることを考えると、自閉症を自動スクリーニングするシステムの開発に重要な注意が向けられている。
韻律異常は自閉症の最も明確な兆候の一つであり、患児はエコー、単調なイントネーション、非典型的ピッチ、不規則な言語的ストレスパターンを含む音声の同調を示す。
本研究では,家庭環境における自閉症・ニューロタイプ(NT)児の自己記録音声における自閉症検出のための機械学習手法について述べる。
まず,抽出音声の特徴(メル周波数ケプストラム係数を含む)を訓練したランダムフォレスト,分光法を訓練した第2の畳み込みニューラルネットワーク(CNN),第3の細調整wav2vec 2.0(最先端トランスフォーマーベースASRモデル)について検討した。
私たちは、スタンフォードのGuess What?から収集された携帯電話で録音された音声のデータセットに基づいて、分類器を訓練します。
モバイルゲーム(mobile game)は、自閉症や神経質な子供のビデオを、自然の家庭環境でクラウドソースするアプリだ。
ランダムフォレスト分類器は70%の精度、微調整されたwav2vec 2.0モデルは77%の精度、CNNは79%の精度で子供の音声をASDまたはNTに分類する。
本モデルでは, 実環境においてより一般化可能な, 録音品質の相容れない家庭内オーディオクリップの選択を訓練する際に, 自閉症状態を予測することができた。
これらの結果から,機械学習手法が音声から自閉症を自動的に検出する可能性を示唆している。
関連論文リスト
- Hear Me, See Me, Understand Me: Audio-Visual Autism Behavior Recognition [47.550391816383794]
本稿では,音声・視覚自閉症の行動認識の新たな課題について紹介する。
社会的行動認識は、AIによる自閉症スクリーニング研究において、これまで省略されてきた重要な側面である。
データセット、コード、事前トレーニングされたモデルをリリースします。
論文 参考訳(メタデータ) (2024-03-22T22:52:35Z) - Autism Detection in Speech - A Survey [0.9028773906859542]
自閉症を示す言語的・韻律的・音響的手がかりを考察する。
特に,言語や意味の流布,韻律的特徴,不適応や発話率といった観察結果に注目した。
結論として、すでに多くの研究が行われていますが、女性患者は過度に研究されているようです。
論文 参考訳(メタデータ) (2024-02-20T10:18:18Z) - Toward a realistic model of speech processing in the brain with
self-supervised learning [67.7130239674153]
生波形で訓練された自己教師型アルゴリズムは有望な候補である。
We show that Wav2Vec 2.0 learns brain-like representations with little as 600 hours of unlabelled speech。
論文 参考訳(メタデータ) (2022-06-03T17:01:46Z) - Recent Progress in the CUHK Dysarthric Speech Recognition System [66.69024814159447]
障害音声は、現在のデータ集約型ディープニューラルネットワーク(DNN)に基づく自動音声認識技術に対して、幅広い課題を提示している。
本稿では,香港の中国大学における音声認識システムの性能向上に向けた最近の研究成果について述べる。
論文 参考訳(メタデータ) (2022-01-15T13:02:40Z) - Investigation of Data Augmentation Techniques for Disordered Speech
Recognition [69.50670302435174]
本稿では,不規則音声認識のための一連のデータ拡張手法について検討する。
正常な音声と無秩序な音声の両方が増強過程に利用された。
UASpeechコーパスを用いた最終話者適応システムと、最大2.92%の絶対単語誤り率(WER)の速度摂動に基づく最良の拡張アプローチ
論文 参考訳(メタデータ) (2022-01-14T17:09:22Z) - Predi\c{c}\~ao da Idade Cerebral a partir de Imagens de Resson\^ancia
Magn\'etica utilizando Redes Neurais Convolucionais [57.52103125083341]
磁気共鳴画像を用いた脳年齢予測のための深層学習手法について検討した。
バイオマーカーの同定は、早期の神経変性過程の検出、および年齢または非年齢に関する認知低下の予測に有用である。
最も優れた結果は、平均絶対誤差3.83年を達成した2Dモデルによって得られた。
論文 参考訳(メタデータ) (2021-12-23T14:51:45Z) - Detecting Autism Spectrum Disorders with Machine Learning Models Using
Speech Transcripts [0.0]
自閉症スペクトラム障害(Autism spectrum disorder、ASD)は、子どもの相互作用、コミュニケーション、他者との交流に影響を及ぼす神経発達障害として定義される。
ASDを正確に診断する現在の方法は、侵襲的、時間的、退屈である。
音声を使った機械学習モデル、顔からのコンピュータービジョン、網膜、脳MRI画像など、この疾患を正確にタイムリーに検出する新しい技術が急速に発展しつつある。
論文 参考訳(メタデータ) (2021-10-07T09:10:15Z) - Development of an autism screening classification model for toddlers [0.0]
自閉症スペクトラム障害 ASDは、コミュニケーション、社会的相互作用、反復行動の課題に関連する神経発達障害である。
本研究は, 乳幼児の早期検診に寄与し, ASD 特性を有する者を同定し, 正式な臨床診断を行おうとする。
論文 参考訳(メタデータ) (2021-09-29T09:07:39Z) - Diagnosis of Autism in Children using Facial Analysis and Deep Learning [0.0]
本研究では,ディープラーニングを用いた94.6%の精度で,子どもを健康的あるいは自閉症に分類するディープラーニングモデルを提案する。
自閉症患者は、社会的スキル、反復行動、コミュニケーションに苦しむ。
そこで本研究では,画像のみを用いて自閉症の診断を効果的に行うことを提案する。
論文 参考訳(メタデータ) (2020-08-06T22:15:20Z) - 4D Spatio-Temporal Deep Learning with 4D fMRI Data for Autism Spectrum
Disorder Classification [69.62333053044712]
ASD分類のための4次元畳み込み深層学習手法を提案する。
F1スコアは0.71、F1スコアは0.65であるのに対し、我々は4Dニューラルネットワークと畳み込みリカレントモデルを採用する。
論文 参考訳(メタデータ) (2020-04-21T17:19:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。