論文の概要: Understanding Spoken Language Development of Children with ASD Using
Pre-trained Speech Embeddings
- arxiv url: http://arxiv.org/abs/2305.14117v2
- Date: Wed, 31 May 2023 22:32:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-02 23:25:58.903936
- Title: Understanding Spoken Language Development of Children with ASD Using
Pre-trained Speech Embeddings
- Title(参考訳): プレトレーニング音声埋め込みを用いたASD児の音声言語発達の理解
- Authors: Anfeng Xu, Rajat Hebbar, Rimita Lahiri, Tiantian Feng, Lindsay Butler,
Lue Shen, Helen Tager-Flusberg, Shrikanth Narayanan
- Abstract要約: 自然言語サンプル(NLS)分析は,従来の手法を補完する有望な手法として注目されている。
本稿では,子どもの音声言語発達の自動評価を支援するために,音声処理技術の応用を提案する。
- 参考スコア(独自算出の注目度): 26.703275678213135
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Speech processing techniques are useful for analyzing speech and language
development in children with Autism Spectrum Disorder (ASD), who are often
varied and delayed in acquiring these skills. Early identification and
intervention are crucial, but traditional assessment methodologies such as
caregiver reports are not adequate for the requisite behavioral phenotyping.
Natural Language Sample (NLS) analysis has gained attention as a promising
complement. Researchers have developed benchmarks for spoken language
capabilities in children with ASD, obtainable through the analysis of NLS. This
paper proposes applications of speech processing technologies in support of
automated assessment of children's spoken language development by
classification between child and adult speech and between speech and nonverbal
vocalization in NLS, with respective F1 macro scores of 82.6% and 67.8%,
underscoring the potential for accurate and scalable tools for ASD research and
clinical use.
- Abstract(参考訳): 音声処理技術は自閉症スペクトラム障害(ASD)児の音声・言語発達を解析するのに有用である。
早期診断と介入は重要であるが,介護者報告のような従来の評価手法は,必要な行動表現型付けには不十分である。
自然言語サンプル(NLS)分析は有望な補完として注目されている。
研究者は、NLSの分析により取得可能な、ASDを持つ小児の音声言語能力のベンチマークを開発した。
本稿では,子供と成人の音声とNLSにおける音声・非言語音声の分類による言語発達の自動評価を支援するための音声処理技術の応用を提案し,それぞれのF1マクロスコアが82.6%,67.8%であり,ASD研究および臨床応用のための正確でスケーラブルなツールの可能性について考察する。
関連論文リスト
- Exploring Speech Pattern Disorders in Autism using Machine Learning [12.469348589699766]
本研究は, 被験者と患者との対話の分析を通じて, 独特の音声パターンを識別するための包括的アプローチを提案する。
我々は,40の音声関連特徴を抽出し,周波数,ゼロクロス速度,エネルギー,スペクトル特性,メル周波数ケプストラル係数(MFCC),バランスに分類した。
分類モデルはASDと非ASDを区別することを目的としており、精度は87.75%である。
論文 参考訳(メタデータ) (2024-05-03T02:59:15Z) - Speech Corpus for Korean Children with Autism Spectrum Disorder: Towards
Automatic Assessment Systems [7.153773998764661]
本稿では,韓国の子どもを対象とした音声コーパスについて紹介する。
音声・言語病理学者3人は,3点類似尺度を用いて,社会コミュニケーション重症度 (SCS) と発音能力 (PP) の評価を行った。
また,73児と9人のTD児を対象に,音声データから抽出した音響的特徴と言語学的特徴を分析した。
論文 参考訳(メタデータ) (2024-02-23T07:32:54Z) - BabySLM: language-acquisition-friendly benchmark of self-supervised
spoken language models [56.93604813379634]
音声表現を学習するための自己指導技術は、人間のラベルを必要とせずに、音声への露出から言語能力を高めることが示されている。
語彙および構文レベルで音声言語モデルを探索するために,言語習得に親しみやすいベンチマークを提案する。
テキストと音声のギャップを埋めることと、クリーンな音声とその内話のギャップを埋めることである。
論文 参考訳(メタデータ) (2023-06-02T12:54:38Z) - Analysing the Impact of Audio Quality on the Use of Naturalistic
Long-Form Recordings for Infant-Directed Speech Research [62.997667081978825]
早期言語習得のモデリングは、幼児が言語スキルをブートストラップする方法を理解することを目的としている。
近年の進歩により、より自然主義的なトレーニングデータを計算モデルに利用できるようになった。
音質がこれらのデータに対する分析やモデリング実験にどう影響するかは、現時点では不明である。
論文 参考訳(メタデータ) (2023-05-03T08:25:37Z) - Leveraging Pretrained Representations with Task-related Keywords for
Alzheimer's Disease Detection [69.53626024091076]
アルツハイマー病(AD)は高齢者に特に顕著である。
事前学習モデルの最近の進歩は、AD検出モデリングを低レベル特徴から高レベル表現にシフトさせる動機付けとなっている。
本稿では,高レベルの音響・言語的特徴から,より優れたAD関連手がかりを抽出する,いくつかの効率的な手法を提案する。
論文 参考訳(メタデータ) (2023-03-14T16:03:28Z) - Psychophysiological Arousal in Young Children Who Stutter: An
Interpretable AI Approach [6.507353572917133]
本研究は, 幼児期(CWS)児における, 子ども期(CWNS)児の生理的覚醒における第2・第2パターンの差異を効果的に把握し, 可視化するものである。
後者は言語的、認知的、コミュニケーション的要求を話者に導入する。
論文 参考訳(メタデータ) (2022-08-03T13:28:15Z) - Speech Detection For Child-Clinician Conversations In Danish For
Low-Resource In-The-Wild Conditions: A Case Study [6.4461798613033405]
デンマーク語における幼児・子どもの会話からなるデータセット上で,事前学習した音声モデルの性能について検討した。
その結果, 既定分類閾値のモデルでは, 患者集団の子どもに悪影響を及ぼすことが判明した。
本研究は,3分間のクリニック・チャイルド・会話が最適分類閾値を得るのに十分であることを示す。
論文 参考訳(メタデータ) (2022-04-25T10:51:54Z) - HASA-net: A non-intrusive hearing-aid speech assessment network [52.83357278948373]
本稿では,DNNに基づく聴覚支援音声評価ネットワーク(HASA-Net)を提案する。
我々の知る限り、HASA-Netは、DNNに基づく統合型非侵襲的補聴器モデルを用いて、品質とインテリジェンスの評価を取り入れた最初の研究である。
実験結果から,HASA-Netの予測音声品質と難聴度スコアは,2つのよく知られた難聴度評価指標と高い相関を示した。
論文 参考訳(メタデータ) (2021-11-10T14:10:13Z) - Is Attention always needed? A Case Study on Language Identification from
Speech [1.162918464251504]
本研究では,畳み込みリカレントニューラルネットワーク(CRNN)を用いたLIDを提案する。
CRNNベースのLIDは、音声サンプルのMel- frequency Cepstral Coefficient(MFCC)特性で動作するように設計されている。
LIDモデルは言語的に類似した言語に対して97%から100%のハイパフォーマンスレベルを示す。
論文 参考訳(メタデータ) (2021-10-05T16:38:57Z) - Leveraging Pre-trained Language Model for Speech Sentiment Analysis [58.78839114092951]
本研究では、事前学習された言語モデルを用いて、文章の感情情報を学習し、音声の感情分析を行う。
本稿では,言語モデルを用いた擬似ラベルに基づく半教師付き訓練戦略を提案する。
論文 参考訳(メタデータ) (2021-06-11T20:15:21Z) - NUVA: A Naming Utterance Verifier for Aphasia Treatment [49.114436579008476]
失語症(PWA)患者の治療介入に対する反応の診断とモニタリングの両立のための画像命名タスクを用いた音声性能評価
本稿では,失語症脳卒中患者の「正しい」と「正しくない」を分類する深層学習要素を組み込んだ発話検証システムであるNUVAについて述べる。
イギリス系英語8ヶ国語でのテストでは、システムの性能精度は83.6%から93.6%の範囲であり、10倍のクロスバリデーション平均は89.5%であった。
論文 参考訳(メタデータ) (2021-02-10T13:00:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。