Fugu-MT 論文翻訳(概要): Understanding Spoken Language Development of Children with ASD Using Pre-trained Speech Embeddings

論文の概要: Understanding Spoken Language Development of Children with ASD Using Pre-trained Speech Embeddings

arxiv url: http://arxiv.org/abs/2305.14117v2
Date: Wed, 31 May 2023 22:32:33 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-02 23:25:58.903936
Title: Understanding Spoken Language Development of Children with ASD Using Pre-trained Speech Embeddings
Title（参考訳）: プレトレーニング音声埋め込みを用いたASD児の音声言語発達の理解
Authors: Anfeng Xu, Rajat Hebbar, Rimita Lahiri, Tiantian Feng, Lindsay Butler, Lue Shen, Helen Tager-Flusberg, Shrikanth Narayanan
Abstract要約: 自然言語サンプル(NLS)分析は,従来の手法を補完する有望な手法として注目されている。本稿では,子どもの音声言語発達の自動評価を支援するために,音声処理技術の応用を提案する。
参考スコア（独自算出の注目度）: 26.703275678213135
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Speech processing techniques are useful for analyzing speech and language development in children with Autism Spectrum Disorder (ASD), who are often varied and delayed in acquiring these skills. Early identification and intervention are crucial, but traditional assessment methodologies such as caregiver reports are not adequate for the requisite behavioral phenotyping. Natural Language Sample (NLS) analysis has gained attention as a promising complement. Researchers have developed benchmarks for spoken language capabilities in children with ASD, obtainable through the analysis of NLS. This paper proposes applications of speech processing technologies in support of automated assessment of children's spoken language development by classification between child and adult speech and between speech and nonverbal vocalization in NLS, with respective F1 macro scores of 82.6% and 67.8%, underscoring the potential for accurate and scalable tools for ASD research and clinical use.
Abstract（参考訳）: 音声処理技術は自閉症スペクトラム障害(ASD)児の音声・言語発達を解析するのに有用である。早期診断と介入は重要であるが,介護者報告のような従来の評価手法は,必要な行動表現型付けには不十分である。自然言語サンプル(NLS)分析は有望な補完として注目されている。研究者は、NLSの分析により取得可能な、ASDを持つ小児の音声言語能力のベンチマークを開発した。本稿では,子供と成人の音声とNLSにおける音声・非言語音声の分類による言語発達の自動評価を支援するための音声処理技術の応用を提案し,それぞれのF1マクロスコアが82.6%,67.8%であり,ASD研究および臨床応用のための正確でスケーラブルなツールの可能性について考察する。

関連論文リスト

KidSpeak: A General Multi-purpose LLM for Kids' Speech Recognition and Screening [29.54910094759367]
KidSpeakは、子どもの発話パターンに合わせて、生成的および差別的なタスクを同時に行うことができる、スピーチ強化基礎モデルである。本稿では,フレキシブル・アンド・オートマチック・スピーチ・アリグナー(FASA)を提案し,その手法を利用して高品質なデータセットを構築し,訓練と評価を行う。本発明の新しいアライメントツールは、ノイズの多いデータから子どもの音声の質を著しく向上させ、人間のアノテーションと比較してデータ品質を13.6倍に向上させる。
論文参考訳（メタデータ） (2025-12-01T00:19:37Z)
Can large audio language models understand child stuttering speech? speech summarization, and source separation [3.2684800403907506]
子どもの発話は、音響、韻律、言語発達における大人のスピーチとは異なる(反復、延長、ブロック) 近年の大規模音声言語モデル (LALM) は, クロスモーダルな音声理解を強く示している。我々は,現在あるLALMを,インタビュー(混合話者)と読書課題(単一子ども)の2つの設定で評価した。
論文参考訳（メタデータ） (2025-10-21T18:53:34Z)
Towards Inclusive Communication: A Unified Framework for Generating Spoken Language from Sign, Lip, and Audio [52.859261069569165]
音声テキスト生成のための手話,唇の動き,音声の多様な組み合わせを扱える最初の統一フレームワークを提案する。 i)不均一な入力を効果的に処理できる統一されたモダリティ非依存アーキテクチャの設計、(ii)モダリティ間の過小評価された相乗効果の探索、特に手話理解における非手動的手がかりとしての唇運動の役割、(iii)個々のタスクに特化した最先端モデルと同等以上のパフォーマンスを達成すること、の3つの目的に焦点をあてる。
論文参考訳（メタデータ） (2025-08-28T06:51:42Z)
Benchmarking Training Paradigms, Dataset Composition, and Model Scaling for Child ASR in ESPnet [72.53502346791814]
データセット、SSL表現(WavLM、XEUS)、デコーダアーキテクチャ間のフラットスタートトレーニングを比較した。 SSL表現は成人のスピーチに偏りがあり、子どものスピーチに対するフラットスタートトレーニングはこれらのバイアスを緩和する。年齢関連ASRと話者検証分析は、プロプライエタリモデルの限界を強調している。
論文参考訳（メタデータ） (2025-08-22T17:59:35Z)
Feature-based analysis of oral narratives from Afrikaans and isiXhosa children [14.74555743937968]
我々は,4歳から5歳のアフリカーンスとイシクソサ語を話す子供たちの話を分析した。語彙の多様性(一意的な単語)と長さに基づく特徴(平均発話長)を典型的な発達の指標として同定する。目標指向のストーリーテリングに関連する特定の動詞と補助詞の使用は、介入を必要とする可能性の低減と相関する。
論文参考訳（メタデータ） (2025-07-17T14:31:32Z)
Digitally Supported Analysis of Spontaneous Speech (DigiSpon): Benchmarking NLP-Supported Language Sample Analysis of Swiss Children's Speech [3.006342003043875]
商用大規模言語モデル(LLM)をベースとしない自然言語処理(NLP)手法を活用するアプローチを提案する。本研究の目的は,言語障害をより効率的に診断する上で,言語病理医を支援するための最適な手法を見出すことである。
論文参考訳（メタデータ） (2025-04-01T13:32:38Z)
Automatic Screening for Children with Speech Disorder using Automatic Speech Recognition: Opportunities and Challenges [15.727507607538874]
音声・言語アセスメント(SLA)は、熟練言語病理医(SLP)によって行われている。人工知能を利用した効率的でスケーラブルなSLA手法の必要性が高まっている。
論文参考訳（メタデータ） (2024-10-07T20:14:37Z)
Personalized Speech Recognition for Children with Test-Time Adaptation [21.882608966462932]
主に成人データに基づいて事前訓練されたオフザシェルフ自動音声認識(ASR)モデルは、子供の発話に悪影響を及ぼす傾向にある。子どもの音声認識に教師なしテスト時間適応(TTA)手法を適用する新しいASRパイプラインを考案した。以上の結果から,TTA法に適応したASRモデルは,個々の子話者の平均および統計的に,未適応のASRベースラインよりも有意に優れていた。
論文参考訳（メタデータ） (2024-09-19T21:40:07Z)
Developing an End-to-End Framework for Predicting the Social Communication Severity Scores of Children with Autism Spectrum Disorder [6.197934754799159]
本稿では、生音声データから、ASDを持つ子どもの社会的コミュニケーションの重症度を自動的に予測するエンドツーエンドフレームワークを提案する。ピアソン相関係数の0.6566と人間評価スコアを達成し,ASD評価のためのアクセシブルで客観的なツールとしての可能性を示した。
論文参考訳（メタデータ） (2024-08-30T14:43:58Z)
Age-Dependent Analysis and Stochastic Generation of Child-Directed Speech [10.369750912567714]
本研究は,CDSの転写と年齢を訓練した言語モデルを用いて,子ども指向音声(CDS)の年齢依存性言語特性をモデル化するアプローチを提案する。生成したCDSの特徴と年齢の異なる子供たちの実際の発話とを比較し, LMが年齢依存性のCDSの変化を捉えていることを示す。
論文参考訳（メタデータ） (2024-05-13T12:35:10Z)
Speech Corpus for Korean Children with Autism Spectrum Disorder: Towards Automatic Assessment Systems [7.153773998764661]
本稿では,韓国の子どもを対象とした音声コーパスについて紹介する。音声・言語病理学者3人は,3点類似尺度を用いて,社会コミュニケーション重症度 (SCS) と発音能力 (PP) の評価を行った。また,73児と9人のTD児を対象に,音声データから抽出した音響的特徴と言語学的特徴を分析した。
論文参考訳（メタデータ） (2024-02-23T07:32:54Z)
BabySLM: language-acquisition-friendly benchmark of self-supervised spoken language models [56.93604813379634]
音声表現を学習するための自己指導技術は、人間のラベルを必要とせずに、音声への露出から言語能力を高めることが示されている。語彙および構文レベルで音声言語モデルを探索するために,言語習得に親しみやすいベンチマークを提案する。テキストと音声のギャップを埋めることと、クリーンな音声とその内話のギャップを埋めることである。
論文参考訳（メタデータ） (2023-06-02T12:54:38Z)
Analysing the Impact of Audio Quality on the Use of Naturalistic Long-Form Recordings for Infant-Directed Speech Research [62.997667081978825]
早期言語習得のモデリングは、幼児が言語スキルをブートストラップする方法を理解することを目的としている。近年の進歩により、より自然主義的なトレーニングデータを計算モデルに利用できるようになった。音質がこれらのデータに対する分析やモデリング実験にどう影響するかは、現時点では不明である。
論文参考訳（メタデータ） (2023-05-03T08:25:37Z)
Leveraging Pretrained Representations with Task-related Keywords for Alzheimer's Disease Detection [69.53626024091076]
アルツハイマー病(AD)は高齢者に特に顕著である。事前学習モデルの最近の進歩は、AD検出モデリングを低レベル特徴から高レベル表現にシフトさせる動機付けとなっている。本稿では,高レベルの音響・言語的特徴から,より優れたAD関連手がかりを抽出する,いくつかの効率的な手法を提案する。
論文参考訳（メタデータ） (2023-03-14T16:03:28Z)
HASA-net: A non-intrusive hearing-aid speech assessment network [52.83357278948373]
本稿では,DNNに基づく聴覚支援音声評価ネットワーク(HASA-Net)を提案する。我々の知る限り、HASA-Netは、DNNに基づく統合型非侵襲的補聴器モデルを用いて、品質とインテリジェンスの評価を取り入れた最初の研究である。実験結果から,HASA-Netの予測音声品質と難聴度スコアは,2つのよく知られた難聴度評価指標と高い相関を示した。
論文参考訳（メタデータ） (2021-11-10T14:10:13Z)
Leveraging Pre-trained Language Model for Speech Sentiment Analysis [58.78839114092951]
本研究では、事前学習された言語モデルを用いて、文章の感情情報を学習し、音声の感情分析を行う。本稿では,言語モデルを用いた擬似ラベルに基づく半教師付き訓練戦略を提案する。
論文参考訳（メタデータ） (2021-06-11T20:15:21Z)
NUVA: A Naming Utterance Verifier for Aphasia Treatment [49.114436579008476]
失語症(PWA)患者の治療介入に対する反応の診断とモニタリングの両立のための画像命名タスクを用いた音声性能評価本稿では,失語症脳卒中患者の「正しい」と「正しくない」を分類する深層学習要素を組み込んだ発話検証システムであるNUVAについて述べる。イギリス系英語8ヶ国語でのテストでは、システムの性能精度は83.6%から93.6%の範囲であり、10倍のクロスバリデーション平均は89.5%であった。
論文参考訳（メタデータ） (2021-02-10T13:00:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。