論文の概要: Understanding Spoken Language Development of Children with ASD Using
Pre-trained Speech Embeddings
- arxiv url: http://arxiv.org/abs/2305.14117v1
- Date: Tue, 23 May 2023 14:39:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-26 19:30:37.268818
- Title: Understanding Spoken Language Development of Children with ASD Using
Pre-trained Speech Embeddings
- Title(参考訳): プレトレーニング音声埋め込みを用いたASD児の音声言語発達の理解
- Authors: Anfeng Xu, Rajat Hebbar, Rimita Lahiri, Tiantian Feng, Lindsay Butler,
Lue Shen, Helen Tager-Flusberg, Shrikanth Narayanan
- Abstract要約: 自然言語サンプル(NLS)分析は,従来の手法を補完する有望な手法として注目されている。
本稿では,子どもの音声言語発達の自動評価を支援するために,音声処理技術の応用を提案する。
- 参考スコア(独自算出の注目度): 26.703275678213135
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Speech processing techniques are useful for analyzing speech and language
development in children with Autism Spectrum Disorder (ASD), who are often
varied and delayed in acquiring these skills. Early identification and
intervention are crucial, but traditional assessment methodologies such as
caregiver reports are not adequate for the requisite behavioral phenotyping.
Natural Language Sample (NLS) analysis has gained attention as a promising
complement. Researchers have developed benchmarks for spoken language
capabilities in children with ASD, obtainable through the analysis of NLS. This
paper proposes applications of speech processing technologies in support of
automated assessment of children's spoken language development by
classification between child and adult speech and between speech and nonverbal
vocalization in NLS, with respective F1 macro scores of 82.6% and 67.8%,
underscoring the potential for accurate and scalable tools for ASD research and
clinical use.
- Abstract(参考訳): 音声処理技術は自閉症スペクトラム障害(ASD)児の音声・言語発達を解析するのに有用である。
早期診断と介入は重要であるが,介護者報告のような従来の評価手法は,必要な行動表現型付けには不十分である。
自然言語サンプル(NLS)分析は有望な補完として注目されている。
研究者は、NLSの分析により取得可能な、ASDを持つ小児の音声言語能力のベンチマークを開発した。
本稿では,子供と成人の音声とNLSにおける音声・非言語音声の分類による言語発達の自動評価を支援するための音声処理技術の応用を提案し,それぞれのF1マクロスコアが82.6%,67.8%であり,ASD研究および臨床応用のための正確でスケーラブルなツールの可能性について考察する。
関連論文リスト
- Automatic Screening for Children with Speech Disorder using Automatic Speech Recognition: Opportunities and Challenges [15.727507607538874]
音声・言語アセスメント(SLA)は、熟練言語病理医(SLP)によって行われている。
人工知能を利用した効率的でスケーラブルなSLA手法の必要性が高まっている。
論文 参考訳(メタデータ) (2024-10-07T20:14:37Z) - Personalized Speech Recognition for Children with Test-Time Adaptation [21.882608966462932]
主に成人データに基づいて事前訓練されたオフザシェルフ自動音声認識(ASR)モデルは、子供の発話に悪影響を及ぼす傾向にある。
子どもの音声認識に教師なしテスト時間適応(TTA)手法を適用する新しいASRパイプラインを考案した。
以上の結果から,TTA法に適応したASRモデルは,個々の子話者の平均および統計的に,未適応のASRベースラインよりも有意に優れていた。
論文 参考訳(メタデータ) (2024-09-19T21:40:07Z) - Developing an End-to-End Framework for Predicting the Social Communication Severity Scores of Children with Autism Spectrum Disorder [6.197934754799159]
本稿では、生音声データから、ASDを持つ子どもの社会的コミュニケーションの重症度を自動的に予測するエンドツーエンドフレームワークを提案する。
ピアソン相関係数の0.6566と人間評価スコアを達成し,ASD評価のためのアクセシブルで客観的なツールとしての可能性を示した。
論文 参考訳(メタデータ) (2024-08-30T14:43:58Z) - Age-Dependent Analysis and Stochastic Generation of Child-Directed Speech [10.369750912567714]
本研究は,CDSの転写と年齢を訓練した言語モデルを用いて,子ども指向音声(CDS)の年齢依存性言語特性をモデル化するアプローチを提案する。
生成したCDSの特徴と年齢の異なる子供たちの実際の発話とを比較し, LMが年齢依存性のCDSの変化を捉えていることを示す。
論文 参考訳(メタデータ) (2024-05-13T12:35:10Z) - Speech Corpus for Korean Children with Autism Spectrum Disorder: Towards
Automatic Assessment Systems [7.153773998764661]
本稿では,韓国の子どもを対象とした音声コーパスについて紹介する。
音声・言語病理学者3人は,3点類似尺度を用いて,社会コミュニケーション重症度 (SCS) と発音能力 (PP) の評価を行った。
また,73児と9人のTD児を対象に,音声データから抽出した音響的特徴と言語学的特徴を分析した。
論文 参考訳(メタデータ) (2024-02-23T07:32:54Z) - BabySLM: language-acquisition-friendly benchmark of self-supervised
spoken language models [56.93604813379634]
音声表現を学習するための自己指導技術は、人間のラベルを必要とせずに、音声への露出から言語能力を高めることが示されている。
語彙および構文レベルで音声言語モデルを探索するために,言語習得に親しみやすいベンチマークを提案する。
テキストと音声のギャップを埋めることと、クリーンな音声とその内話のギャップを埋めることである。
論文 参考訳(メタデータ) (2023-06-02T12:54:38Z) - Analysing the Impact of Audio Quality on the Use of Naturalistic
Long-Form Recordings for Infant-Directed Speech Research [62.997667081978825]
早期言語習得のモデリングは、幼児が言語スキルをブートストラップする方法を理解することを目的としている。
近年の進歩により、より自然主義的なトレーニングデータを計算モデルに利用できるようになった。
音質がこれらのデータに対する分析やモデリング実験にどう影響するかは、現時点では不明である。
論文 参考訳(メタデータ) (2023-05-03T08:25:37Z) - Leveraging Pretrained Representations with Task-related Keywords for
Alzheimer's Disease Detection [69.53626024091076]
アルツハイマー病(AD)は高齢者に特に顕著である。
事前学習モデルの最近の進歩は、AD検出モデリングを低レベル特徴から高レベル表現にシフトさせる動機付けとなっている。
本稿では,高レベルの音響・言語的特徴から,より優れたAD関連手がかりを抽出する,いくつかの効率的な手法を提案する。
論文 参考訳(メタデータ) (2023-03-14T16:03:28Z) - HASA-net: A non-intrusive hearing-aid speech assessment network [52.83357278948373]
本稿では,DNNに基づく聴覚支援音声評価ネットワーク(HASA-Net)を提案する。
我々の知る限り、HASA-Netは、DNNに基づく統合型非侵襲的補聴器モデルを用いて、品質とインテリジェンスの評価を取り入れた最初の研究である。
実験結果から,HASA-Netの予測音声品質と難聴度スコアは,2つのよく知られた難聴度評価指標と高い相関を示した。
論文 参考訳(メタデータ) (2021-11-10T14:10:13Z) - Leveraging Pre-trained Language Model for Speech Sentiment Analysis [58.78839114092951]
本研究では、事前学習された言語モデルを用いて、文章の感情情報を学習し、音声の感情分析を行う。
本稿では,言語モデルを用いた擬似ラベルに基づく半教師付き訓練戦略を提案する。
論文 参考訳(メタデータ) (2021-06-11T20:15:21Z) - NUVA: A Naming Utterance Verifier for Aphasia Treatment [49.114436579008476]
失語症(PWA)患者の治療介入に対する反応の診断とモニタリングの両立のための画像命名タスクを用いた音声性能評価
本稿では,失語症脳卒中患者の「正しい」と「正しくない」を分類する深層学習要素を組み込んだ発話検証システムであるNUVAについて述べる。
イギリス系英語8ヶ国語でのテストでは、システムの性能精度は83.6%から93.6%の範囲であり、10倍のクロスバリデーション平均は89.5%であった。
論文 参考訳(メタデータ) (2021-02-10T13:00:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。