論文の概要: Exploiting ultrasound tongue imaging for the automatic detection of
speech articulation errors
- arxiv url: http://arxiv.org/abs/2103.00324v1
- Date: Sat, 27 Feb 2021 21:16:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-03 16:10:36.704447
- Title: Exploiting ultrasound tongue imaging for the automatic detection of
speech articulation errors
- Title(参考訳): 発話誤りの自動検出のための超音波舌画像の探索
- Authors: Manuel Sam Ribeiro, Joanne Cleland, Aciel Eshky, Korin Richmond, Steve
Renals
- Abstract要約: 音声発話誤りの自動検出のための超音波舌画像の寄与について検討する。
我々のシステムは、通常、幼児音声の発達と、音声と超音波を用いた成人音声データベースの強化を訓練している。
総じて,音声明瞭度誤りの自動検出は,超音波介入ソフトウェアに統合される可能性が示唆された。
- 参考スコア(独自算出の注目度): 37.73028490351971
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Speech sound disorders are a common communication impairment in childhood.
Because speech disorders can negatively affect the lives and the development of
children, clinical intervention is often recommended. To help with diagnosis
and treatment, clinicians use instrumented methods such as spectrograms or
ultrasound tongue imaging to analyse speech articulations. Analysis with these
methods can be laborious for clinicians, therefore there is growing interest in
its automation. In this paper, we investigate the contribution of ultrasound
tongue imaging for the automatic detection of speech articulation errors. Our
systems are trained on typically developing child speech and augmented with a
database of adult speech using audio and ultrasound. Evaluation on typically
developing speech indicates that pre-training on adult speech and jointly using
ultrasound and audio gives the best results with an accuracy of 86.9%. To
evaluate on disordered speech, we collect pronunciation scores from experienced
speech and language therapists, focusing on cases of velar fronting and gliding
of /r/. The scores show good inter-annotator agreement for velar fronting, but
not for gliding errors. For automatic velar fronting error detection, the best
results are obtained when jointly using ultrasound and audio. The best system
correctly detects 86.6% of the errors identified by experienced clinicians. Out
of all the segments identified as errors by the best system, 73.2% match errors
identified by clinicians. Results on automatic gliding detection are harder to
interpret due to poor inter-annotator agreement, but appear promising. Overall
findings suggest that automatic detection of speech articulation errors has
potential to be integrated into ultrasound intervention software for
automatically quantifying progress during speech therapy.
- Abstract(参考訳): 音声障害は小児期において一般的なコミュニケーション障害である。
発話障害は子供の生活や発達に悪影響を及ぼす可能性があるため、臨床介入はしばしば推奨される。
診断と治療を助けるために、臨床医は音声の明瞭度を分析するために、スペクトログラムや超音波舌イメージングなどの計測方法を使用する。
これらの方法による分析は臨床医にとって手間がかかるため、自動化への関心が高まっている。
本論文では,音声の発話誤りの自動検出における超音波舌画像の寄与について検討する。
我々のシステムは、通常、幼児音声の発達と、音声と超音波を用いた成人音声データベースの強化を訓練している。
通常発達する音声の評価は、成人音声の事前訓練と超音波と音声による共同学習が86.9%の精度で最良の結果をもたらすことを示している。
障害のある音声を評価するために,経験者の音声と言語療法士の発音スコアを収集し,/r/の口蓋前頭および滑走症例に着目した。
このスコアは、前縁部に対する注釈間合意が良好であるが、滑空エラーには適さないことを示している。
自動ベラーフロンディングエラー検出のために、超音波とオーディオを共同使用するときに最良の結果が得られます。
最良のシステムは、経験豊富な臨床医が特定したエラーの86.6%を正しく検出する。
最良のシステムによってエラーとして特定された全てのセグメントのうち、73.2%は臨床医が特定したエラーと一致している。
自動グライディング検出の結果はアノテータ間合意の不一致により解釈が難しいが,有望と思われる。
総じて, 音声調音誤りの自動検出は, 音声治療中の経過を自動的に定量化するために, 超音波介入ソフトウェアに統合される可能性が示唆された。
関連論文リスト
- Self-supervised Speech Models for Word-Level Stuttered Speech Detection [66.46810024006712]
自己教師付き音声モデルを利用した単語レベルの発声音声検出モデルを提案する。
本評価は, 単語レベルの発声検出において, 従来の手法を超越していることを示す。
論文 参考訳(メタデータ) (2024-09-16T20:18:20Z) - Selfsupervised learning for pathological speech detection [0.0]
音声生成は、様々な神経変性疾患による影響と破壊を受けやすい。
これらの障害は、異常な発声パターンと不正確な調音を特徴とする病的発声を引き起こす。
ニューロタイプ話者とは異なり、言語障害や障害のある患者は、AlexaやSiriなど、さまざまなバーチャルアシスタントにアクセスできない。
論文 参考訳(メタデータ) (2024-05-16T07:12:47Z) - Multilingual Alzheimer's Dementia Recognition through Spontaneous
Speech: a Signal Processing Grand Challenge [18.684024762601215]
この信号処理グランドチャレンジ(SPGC)は、社会的・医療的関連性の難しい自動予測問題をターゲットにしている。
チャレンジは、ある言語(英語)における音声に基づいて構築された予測モデルが、他の言語(ギリシャ語)に一般化する程度を評価するように設計されている。
論文 参考訳(メタデータ) (2023-01-13T14:09:13Z) - The Far Side of Failure: Investigating the Impact of Speech Recognition
Errors on Subsequent Dementia Classification [8.032686410648274]
自然発話で検出される言語異常は、認知障害などの認知障害のスクリーニングなど、様々な臨床応用の可能性を示唆している。
自己教師付き学習(SSL)自動音声認識(ASR)モデルにおいて,臨床環境から抽出した難解な音声サンプルでは,有意な性能が得られない。
我々の重要な発見の1つは、パラドックス的に、比較的高いエラー率を持つASRシステムは、動詞の文字起こしに基づく分類よりも、より下流の分類精度の高い転写文を生成できるということである。
論文 参考訳(メタデータ) (2022-11-11T17:06:45Z) - Exploiting prompt learning with pre-trained language models for
Alzheimer's Disease detection [70.86672569101536]
アルツハイマー病(AD)の早期診断は予防ケアの促進とさらなる進行の遅らせに不可欠である。
本稿では,AD分類誤差をトレーニング対象関数として一貫して用いたPLMの高速微調整法について検討する。
論文 参考訳(メタデータ) (2022-10-29T09:18:41Z) - Investigation of Data Augmentation Techniques for Disordered Speech
Recognition [69.50670302435174]
本稿では,不規則音声認識のための一連のデータ拡張手法について検討する。
正常な音声と無秩序な音声の両方が増強過程に利用された。
UASpeechコーパスを用いた最終話者適応システムと、最大2.92%の絶対単語誤り率(WER)の速度摂動に基づく最良の拡張アプローチ
論文 参考訳(メタデータ) (2022-01-14T17:09:22Z) - Spectro-Temporal Deep Features for Disordered Speech Assessment and
Recognition [65.25325641528701]
音声スペクトルのSVD分解による深い特徴を埋め込んだ新しいスペクトル時空間ベースを提案する。
UASpeechコーパスで行った実験では、提案された分光時間深部特徴適応システムは、データ拡張の有無にかかわらず、ワードエラー率(WER)を最大263%(相対8.6%)削減することで、ベースラインi-適応を一貫して上回ったことが示唆された。
論文 参考訳(メタデータ) (2022-01-14T16:56:43Z) - Influence of ASR and Language Model on Alzheimer's Disease Detection [2.4698886064068555]
画像から参加者の音声記述を転写するために,SotA ASRシステムを用いて分析する。
本研究では,ASRから仮説を復号化するための言語モデルが欠如していることから,単語の非標準列を補正する言語モデルの影響について検討する。
提案システムは、韻律と声質に基づく音響と、最も一般的な単語の最初の出現に基づく語彙的特徴を組み合わせる。
論文 参考訳(メタデータ) (2021-09-20T10:41:39Z) - Analysis and Tuning of a Voice Assistant System for Dysfluent Speech [7.233685721929227]
音声認識システムは、音や単語の繰り返し、音の伸長、可聴ブロックなどの非効率な音声によく当てはまらない。
既存のハイブリッド音声認識システムにおける復号化パラメータを調整することにより、流速障害のある個人に対して、isWERを24%改善できることを示す。
論文 参考訳(メタデータ) (2021-06-18T20:58:34Z) - NUVA: A Naming Utterance Verifier for Aphasia Treatment [49.114436579008476]
失語症(PWA)患者の治療介入に対する反応の診断とモニタリングの両立のための画像命名タスクを用いた音声性能評価
本稿では,失語症脳卒中患者の「正しい」と「正しくない」を分類する深層学習要素を組み込んだ発話検証システムであるNUVAについて述べる。
イギリス系英語8ヶ国語でのテストでは、システムの性能精度は83.6%から93.6%の範囲であり、10倍のクロスバリデーション平均は89.5%であった。
論文 参考訳(メタデータ) (2021-02-10T13:00:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。