論文の概要: Automatic Speaker Independent Dysarthric Speech Intelligibility
Assessment System
- arxiv url: http://arxiv.org/abs/2103.06157v1
- Date: Wed, 10 Mar 2021 16:15:32 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-11 14:46:24.631068
- Title: Automatic Speaker Independent Dysarthric Speech Intelligibility
Assessment System
- Title(参考訳): 自動話者自立型構音明瞭度評価システム
- Authors: Ayush Tripathi and Swapnil Bhosale and Sunil Kumar Kopparapu
- Abstract要約: 構音障害(dysarthria)は、個人が発声において重要な役割を果たす筋肉を制御する能力を妨げる状態である。
唇、声帯、舌、横隔膜の動きを補助する筋肉の微細な制御の喪失は、異常な発声をもたらす。
個人が話す音声の知性を分析して、構音のレベルを評価することができる。
- 参考スコア(独自算出の注目度): 28.01689694536572
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Dysarthria is a condition which hampers the ability of an individual to
control the muscles that play a major role in speech delivery. The loss of fine
control over muscles that assist the movement of lips, vocal chords, tongue and
diaphragm results in abnormal speech delivery. One can assess the severity
level of dysarthria by analyzing the intelligibility of speech spoken by an
individual. Continuous intelligibility assessment helps speech language
pathologists not only study the impact of medication but also allows them to
plan personalized therapy. It helps the clinicians immensely if the
intelligibility assessment system is reliable, automatic, simple for (a)
patients to undergo and (b) clinicians to interpret. Lack of availability of
dysarthric data has resulted in development of speaker dependent automatic
intelligibility assessment systems which requires patients to speak a large
number of utterances. In this paper, we propose (a) a cost minimization
procedure to select an optimal (small) number of utterances that need to be
spoken by the dysarthric patient, (b) four different speaker independent
intelligibility assessment systems which require the patient to speak a small
number of words, and (c) the assessment score is close to the perceptual score
that the Speech Language Pathologist (SLP) can relate to. The need for small
number of utterances to be spoken by the patient and the score being relatable
to the SLP benefits both the dysarthric patient and the clinician from
usability perspective.
- Abstract(参考訳): 構音障害(dysarthria)は、個人が発声において重要な役割を果たす筋肉を制御する能力を妨げる状態である。
唇、声帯、舌、横隔膜の動きを補助する筋肉の微細な制御の喪失は、異常な発声をもたらす。
個人が話す音声の明瞭さを分析して、構音の重症度を評価することができる。
連続知性評価は、言語病理学者が薬の影響を研究するだけでなく、パーソナライズドセラピーの計画にも役立つ。
a) 患者が実施し, (b) 臨床医が解釈し, 信頼性が高く, 自動的, 簡便な臨床医を支援する。
dysarthricデータの可用性の欠如は、患者が大量の発話を話すことを必要とする話者依存型自動知性評価システムの開発につながった。
本稿では, (a) 構音障害患者が話す必要のある最適な(小さい)発話数を選択するためのコスト最小化手順, (b) 患者に少数の単語を話すことを要求する4つの異なる話者独立知性評価システム, (c) 評価スコアが言語病理学者(slp)が対応できる知覚スコアに近いことを提案する。
患者が発声する少数の発話の必要性とSLPに関連しうるスコアは, ユーザビリティの観点から, 変形性関節症患者と臨床医の双方に有益である。
関連論文リスト
- Self-supervised Speech Models for Word-Level Stuttered Speech Detection [66.46810024006712]
自己教師付き音声モデルを利用した単語レベルの発声音声検出モデルを提案する。
本評価は, 単語レベルの発声検出において, 従来の手法を超越していることを示す。
論文 参考訳(メタデータ) (2024-09-16T20:18:20Z) - A Comparative Study on Patient Language across Therapeutic Domains for Effective Patient Voice Classification in Online Health Discussions [0.48124799513933847]
本研究では,患者音声の正確な分類における言語的特徴の重要性を分析する。
我々は、類似した言語パターンと組み合わせたデータセットに基づいて事前学習した言語モデルを微調整し、高い精度で患者音声を自動分類した。
この話題の先駆的な研究として、ソーシャルメディアから真正の患者体験を抽出することに注力することは、医療基準の進歩に向けた重要なステップである。
論文 参考訳(メタデータ) (2024-07-23T15:51:46Z) - Speech-based Clinical Depression Screening: An Empirical Study [32.84863235794086]
本研究では,AIを用いた抑うつスクリーニングにおける音声信号の有用性について検討した。
参加者には、北京大学第6病院の外来から採用されているうつ病患者が含まれる。
音声と深部音声の特徴を各参加者の分節録音から抽出した。
論文 参考訳(メタデータ) (2024-06-05T09:43:54Z) - Identification of Cognitive Decline from Spoken Language through Feature
Selection and the Bag of Acoustic Words Model [0.0]
記憶障害の症状の早期発見は、集団の健康確保に重要な役割を担っている。
臨床環境における標準化された音声テストの欠如は、自然音声言語を解析するための自動機械学習技術の開発にますます重点を置いている。
この研究は特徴選択に関するアプローチを示し、ジュネーブの最小音響パラメータセットと相対音声停止から診断に必要な重要な特徴を自動的に選択することを可能にする。
論文 参考訳(メタデータ) (2024-02-02T17:06:03Z) - Automatically measuring speech fluency in people with aphasia: first
achievements using read-speech data [55.84746218227712]
本研究の目的は,言語習得の分野で開発された信号処理algorithmの関連性を評価することである。
論文 参考訳(メタデータ) (2023-08-09T07:51:40Z) - Disentangled Latent Speech Representation for Automatic Pathological
Intelligibility Assessment [10.93598143328628]
そこで本研究では,無拘束音声表現が病的音声の明瞭度自動評価に有効であることを示す。
以上の結果から,解離した音声表現が病的音声の明瞭度の自動評価に有効であることが示された。
論文 参考訳(メタデータ) (2022-04-08T12:02:14Z) - Investigation of Data Augmentation Techniques for Disordered Speech
Recognition [69.50670302435174]
本稿では,不規則音声認識のための一連のデータ拡張手法について検討する。
正常な音声と無秩序な音声の両方が増強過程に利用された。
UASpeechコーパスを用いた最終話者適応システムと、最大2.92%の絶対単語誤り率(WER)の速度摂動に基づく最良の拡張アプローチ
論文 参考訳(メタデータ) (2022-01-14T17:09:22Z) - STAN: A stuttering therapy analysis helper [59.37911277681339]
発声は、繰り返し、音、音節または単語の延長、発話中のブロックによって識別される複雑な音声障害である。
本稿では, 言語療法士を支援するシステムSTANについて紹介する。
論文 参考訳(メタデータ) (2021-06-15T13:48:12Z) - A Preliminary Study of a Two-Stage Paradigm for Preserving Speaker
Identity in Dysarthric Voice Conversion [50.040466658605524]
変形性音声変換(DVC)における話者同一性維持のための新しいパラダイムを提案する。
変形性音声の質は統計VCによって大幅に改善される。
しかし, 変形性関節症患者の通常の発話は, ほとんど収集できないため, 過去の研究は患者の個性を取り戻すことはできなかった。
論文 参考訳(メタデータ) (2021-06-02T18:41:03Z) - NUVA: A Naming Utterance Verifier for Aphasia Treatment [49.114436579008476]
失語症(PWA)患者の治療介入に対する反応の診断とモニタリングの両立のための画像命名タスクを用いた音声性能評価
本稿では,失語症脳卒中患者の「正しい」と「正しくない」を分類する深層学習要素を組み込んだ発話検証システムであるNUVAについて述べる。
イギリス系英語8ヶ国語でのテストでは、システムの性能精度は83.6%から93.6%の範囲であり、10倍のクロスバリデーション平均は89.5%であった。
論文 参考訳(メタデータ) (2021-02-10T13:00:29Z) - Comparison of Speaker Role Recognition and Speaker Enrollment Protocol
for conversational Clinical Interviews [9.728371067160941]
エンドツーエンドのニューラルネットワークアーキテクチャをトレーニングし、各タスクに適応し、各アプローチを同じメトリクスで評価します。
結果は面接者の人口統計にも依存せず,その臨床的意義を浮き彫りにした。
論文 参考訳(メタデータ) (2020-10-30T09:07:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。