論文の概要: Speech Corpus for Korean Children with Autism Spectrum Disorder: Towards
Automatic Assessment Systems
- arxiv url: http://arxiv.org/abs/2402.15539v1
- Date: Fri, 23 Feb 2024 07:32:54 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-27 18:10:37.776727
- Title: Speech Corpus for Korean Children with Autism Spectrum Disorder: Towards
Automatic Assessment Systems
- Title(参考訳): 自閉症スペクトラム障害児のための音声コーパス:自動評価システムに向けて
- Authors: Seonwoo Lee, Jihyun Mun, Sunhee Kim, Minhwa Chung
- Abstract要約: 本稿では,韓国の子どもを対象とした音声コーパスについて紹介する。
音声・言語病理学者3人は,3点類似尺度を用いて,社会コミュニケーション重症度 (SCS) と発音能力 (PP) の評価を行った。
また,73児と9人のTD児を対象に,音声データから抽出した音響的特徴と言語学的特徴を分析した。
- 参考スコア(独自算出の注目度): 7.153773998764661
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite the growing demand for digital therapeutics for children with Autism
Spectrum Disorder (ASD), there is currently no speech corpus available for
Korean children with ASD. This paper introduces a speech corpus specifically
designed for Korean children with ASD, aiming to advance speech technologies
such as pronunciation and severity evaluation. Speech recordings from speech
and language evaluation sessions were transcribed, and annotated for
articulatory and linguistic characteristics. Three speech and language
pathologists rated these recordings for social communication severity (SCS) and
pronunciation proficiency (PP) using a 3-point Likert scale. The total number
of participants will be 300 for children with ASD and 50 for typically
developing (TD) children. The paper also analyzes acoustic and linguistic
features extracted from speech data collected and completed for annotation from
73 children with ASD and 9 TD children to investigate the characteristics of
children with ASD and identify significant features that correlate with the
clinical scores. The results reveal some speech and linguistic characteristics
in children with ASD that differ from those in TD children or another subgroup
of ASD categorized by clinical scores, demonstrating the potential for
developing automatic assessment systems for SCS and PP.
- Abstract(参考訳): 自閉症スペクトラム障害(ASD)の小児に対するデジタル治療の需要が高まっているが、現在、ASDの韓国人子供向けの音声コーパスは存在しない。
本稿では, 韓国人児童を対象とした音声コーパスについて紹介し, 発音・重度評価などの音声技術の発展を目指している。
音声および言語評価セッションからの音声記録を転写し, 調音および言語特性に注釈を付けた。
音声・言語病理学者3人は,3点類似尺度を用いて,これらの記録を社会コミュニケーション重症度(SCS)と発音能力(PP)に評価した。
参加者の合計は、asd児300名、典型的にはtd児50名である。
また,asd児73名とtd児9名を対象に,音声データから抽出した音響的特徴と言語的特徴を解析し,asd児の特徴と臨床評価との関連性について検討した。
その結果,td児や臨床成績別に分類されたasdの他のサブグループと異なるasd児の発話と言語の特徴が明らかとなり,scsとppの自動評価システムの開発の可能性が示された。
関連論文リスト
- Egocentric Speaker Classification in Child-Adult Dyadic Interactions: From Sensing to Computational Modeling [30.099739460287566]
自閉症スペクトラム障害(Autism spectrum disorder、ASD)は、社会的コミュニケーション、反復行動、感覚処理における課題を特徴とする神経発達状態である。
ASDにおける重要な研究領域は、治療中の子供の行動変化を評価することである。
これらの相互作用における子どもの行動を理解する基本的な側面は、自動音声理解である。
論文 参考訳(メタデータ) (2024-09-14T07:03:08Z) - Developing an End-to-End Framework for Predicting the Social Communication Severity Scores of Children with Autism Spectrum Disorder [6.197934754799159]
本稿では、生音声データから、ASDを持つ子どもの社会的コミュニケーションの重症度を自動的に予測するエンドツーエンドフレームワークを提案する。
ピアソン相関係数の0.6566と人間評価スコアを達成し,ASD評価のためのアクセシブルで客観的なツールとしての可能性を示した。
論文 参考訳(メタデータ) (2024-08-30T14:43:58Z) - Modality-Order Matters! A Novel Hierarchical Feature Fusion Method for CoSAm: A Code-Switched Autism Corpus [3.06952918690254]
本研究は,小児における早期ASD検出の促進を目的とした,新しい階層的特徴融合法を提案する。
この手法は、コードスイッチされた音声コーパスであるCoSAmを、ASDと一致した制御グループと診断された子供から収集する。
このデータセットは、ASDと診断された30人の子供から61人の音声記録と、神経型児から31人の音声記録を含んでおり、3歳から13歳の間である。
論文 参考訳(メタデータ) (2024-07-19T14:06:01Z) - An Initial Investigation of Language Adaptation for TTS Systems under Low-resource Scenarios [76.11409260727459]
本稿では,最近のSSLベースの多言語TSシステムであるZMM-TTSの言語適応性について検討する。
本研究では,事前学習言語と対象言語との音声学的な類似性が,対象言語の適応性能に影響を及ぼすことを示す。
論文 参考訳(メタデータ) (2024-06-13T08:16:52Z) - Exploring Speech Pattern Disorders in Autism using Machine Learning [12.469348589699766]
本研究は, 被験者と患者との対話の分析を通じて, 独特の音声パターンを識別するための包括的アプローチを提案する。
我々は,40の音声関連特徴を抽出し,周波数,ゼロクロス速度,エネルギー,スペクトル特性,メル周波数ケプストラル係数(MFCC),バランスに分類した。
分類モデルはASDと非ASDを区別することを目的としており、精度は87.75%である。
論文 参考訳(メタデータ) (2024-05-03T02:59:15Z) - Understanding Spoken Language Development of Children with ASD Using
Pre-trained Speech Embeddings [26.703275678213135]
自然言語サンプル(NLS)分析は,従来の手法を補完する有望な手法として注目されている。
本稿では,子どもの音声言語発達の自動評価を支援するために,音声処理技術の応用を提案する。
論文 参考訳(メタデータ) (2023-05-23T14:39:49Z) - Analysing the Impact of Audio Quality on the Use of Naturalistic
Long-Form Recordings for Infant-Directed Speech Research [62.997667081978825]
早期言語習得のモデリングは、幼児が言語スキルをブートストラップする方法を理解することを目的としている。
近年の進歩により、より自然主義的なトレーニングデータを計算モデルに利用できるようになった。
音質がこれらのデータに対する分析やモデリング実験にどう影響するかは、現時点では不明である。
論文 参考訳(メタデータ) (2023-05-03T08:25:37Z) - Decoding speech perception from non-invasive brain recordings [48.46819575538446]
非侵襲的な記録から知覚音声の自己教師付き表現をデコードするために、コントラスト学習で訓練されたモデルを導入する。
我々のモデルでは、3秒のMEG信号から、1,000以上の異なる可能性から最大41%の精度で対応する音声セグメントを識別できる。
論文 参考訳(メタデータ) (2022-08-25T10:01:43Z) - Exploiting Cross-domain And Cross-Lingual Ultrasound Tongue Imaging
Features For Elderly And Dysarthric Speech Recognition [55.25565305101314]
調音機能は音響信号歪みに不変であり、音声認識システムにうまく組み込まれている。
本稿では,A2Aモデルにおける24時間TaLコーパスの並列音声・超音波舌画像(UTI)データを利用したクロスドメインおよびクロスランガルA2Aインバージョン手法を提案する。
生成した調音機能を組み込んだ3つのタスクの実験は、ベースラインのTDNNとコンフォーマーASRシステムより一貫して優れていた。
論文 参考訳(メタデータ) (2022-06-15T07:20:28Z) - Perception Point: Identifying Critical Learning Periods in Speech for
Bilingual Networks [58.24134321728942]
ディープニューラルベース視覚唇読解モデルにおける認知的側面を比較し,識別する。
我々は、認知心理学におけるこれらの理論と独自のモデリングの間に強い相関関係を観察する。
論文 参考訳(メタデータ) (2021-10-13T05:30:50Z) - Emotional Voice Conversion: Theory, Databases and ESD [84.62083515557886]
新たな感情音声データベース(ESD)の開発をモチベーションとする。
ESDデータベースは、10人のネイティブイングリッシュと10人のネイティブ中国語話者によって話される350のパラレル発話で構成されている。
本データベースは,多言語・多言語間音声変換研究に適したデータベースである。
論文 参考訳(メタデータ) (2021-05-31T07:48:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。