論文の概要: The Phonetic Footprint of Parkinson's Disease
- arxiv url: http://arxiv.org/abs/2112.11514v1
- Date: Tue, 21 Dec 2021 20:44:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-23 15:11:53.841987
- Title: The Phonetic Footprint of Parkinson's Disease
- Title(参考訳): パーキンソン病の音声的足跡
- Authors: Philipp Klumpp, Tom\'as Arias-Vergara, Juan Camilo V\'asquez-Correa,
Paula Andrea P\'erez-Toro, Juan Rafael Orozco-Arroyave, Anton Batliner, Elmar
N\"oth
- Abstract要約: パーキンソン病(PD)は患者の運動能力に重大な影響を及ぼす。
母音の不安定性、スラリー発音、遅い発声などの特徴パターンは、影響を受けた個人によく見られる。
健常者を対象に訓練した音声認識器を用いて, PDが患者の音声足跡に与える影響について検討した。
- 参考スコア(独自算出の注目度): 16.64383793837174
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: As one of the most prevalent neurodegenerative disorders, Parkinson's disease
(PD) has a significant impact on the fine motor skills of patients. The complex
interplay of different articulators during speech production and realization of
required muscle tension become increasingly difficult, thus leading to a
dysarthric speech. Characteristic patterns such as vowel instability, slurred
pronunciation and slow speech can often be observed in the affected individuals
and were analyzed in previous studies to determine the presence and progression
of PD. In this work, we used a phonetic recognizer trained exclusively on
healthy speech data to investigate how PD affected the phonetic footprint of
patients. We rediscovered numerous patterns that had been described in previous
contributions although our system had never seen any pathological speech
previously. Furthermore, we could show that intermediate activations from the
neural network could serve as feature vectors encoding information related to
the disease state of individuals. We were also able to directly correlate the
expert-rated intelligibility of a speaker with the mean confidence of phonetic
predictions. Our results support the assumption that pathological data is not
necessarily required to train systems that are capable of analyzing PD speech.
- Abstract(参考訳): 最も一般的な神経変性疾患の1つとして、パーキンソン病(pd)は患者の運動スキルに大きな影響を与える。
音声の合成と筋緊張の実現において異なる調音器の複雑な相互作用はますます難しくなり、変形性発声に繋がる。
母音の不安定性,スラリー発音,遅い発声などの特徴パターンは,患者によく見られ,過去の研究ではPDの存在と進行を決定するために分析された。
本研究では,健常者を対象とした音声認識装置を用いて,PDが患者の音声足跡に与える影響について検討した。
当システムでは, これまで病的発言は見られなかったが, 過去のコントリビューションで記述された多くのパターンが再発見された。
さらに,ニューラルネットワークからの中間活性化は,個人の疾患状態に関連する情報をエンコードする特徴ベクトルとして機能する可能性が示唆された。
また, 話者の有能感を音声予測の信頼性の平均値と直接相関させることができた。
本研究は,PD音声を解析可能なシステムにおいて,病理データが必ずしも必要ではないという仮定を支持する。
関連論文リスト
- Self-supervised Speech Models for Word-Level Stuttered Speech Detection [66.46810024006712]
自己教師付き音声モデルを利用した単語レベルの発声音声検出モデルを提案する。
本評価は, 単語レベルの発声検出において, 従来の手法を超越していることを示す。
論文 参考訳(メタデータ) (2024-09-16T20:18:20Z) - Selfsupervised learning for pathological speech detection [0.0]
音声生成は、様々な神経変性疾患による影響と破壊を受けやすい。
これらの障害は、異常な発声パターンと不正確な調音を特徴とする病的発声を引き起こす。
ニューロタイプ話者とは異なり、言語障害や障害のある患者は、AlexaやSiriなど、さまざまなバーチャルアシスタントにアクセスできない。
論文 参考訳(メタデータ) (2024-05-16T07:12:47Z) - Exploring Speech Pattern Disorders in Autism using Machine Learning [12.469348589699766]
本研究は, 被験者と患者との対話の分析を通じて, 独特の音声パターンを識別するための包括的アプローチを提案する。
我々は,40の音声関連特徴を抽出し,周波数,ゼロクロス速度,エネルギー,スペクトル特性,メル周波数ケプストラル係数(MFCC),バランスに分類した。
分類モデルはASDと非ASDを区別することを目的としており、精度は87.75%である。
論文 参考訳(メタデータ) (2024-05-03T02:59:15Z) - NeuroVoz: a Castillian Spanish corpus of parkinsonian speech [36.23298373892936]
NeuroVozは、平均26.88 pm 3.35$のオーディオ録音2,903枚で構成されている。
このデータセットは、すでにいくつかの研究を基盤にしており、PD音声パターン識別のベンチマーク精度は89%に達している。
論文 参考訳(メタデータ) (2024-03-04T16:17:39Z) - Decoding speech perception from non-invasive brain recordings [48.46819575538446]
非侵襲的な記録から知覚音声の自己教師付き表現をデコードするために、コントラスト学習で訓練されたモデルを導入する。
我々のモデルでは、3秒のMEG信号から、1,000以上の異なる可能性から最大41%の精度で対応する音声セグメントを識別できる。
論文 参考訳(メタデータ) (2022-08-25T10:01:43Z) - Investigation of Data Augmentation Techniques for Disordered Speech
Recognition [69.50670302435174]
本稿では,不規則音声認識のための一連のデータ拡張手法について検討する。
正常な音声と無秩序な音声の両方が増強過程に利用された。
UASpeechコーパスを用いた最終話者適応システムと、最大2.92%の絶対単語誤り率(WER)の速度摂動に基づく最良の拡張アプローチ
論文 参考訳(メタデータ) (2022-01-14T17:09:22Z) - Perception Point: Identifying Critical Learning Periods in Speech for
Bilingual Networks [58.24134321728942]
ディープニューラルベース視覚唇読解モデルにおける認知的側面を比較し,識別する。
我々は、認知心理学におけるこれらの理論と独自のモデリングの間に強い相関関係を観察する。
論文 参考訳(メタデータ) (2021-10-13T05:30:50Z) - A Longitudinal Multi-modal Dataset for Dementia Monitoring and Diagnosis [22.672055089496972]
健常者や認知症者から収集した, 細粒度長大な多モードコーパスについて紹介した。
コーパスは音声による会話で構成され、そのサブセットは書き起こされ、型付けされた思考と関連する言語外情報から構成される。
論文 参考訳(メタデータ) (2021-09-03T14:02:12Z) - A Preliminary Study of a Two-Stage Paradigm for Preserving Speaker
Identity in Dysarthric Voice Conversion [50.040466658605524]
変形性音声変換(DVC)における話者同一性維持のための新しいパラダイムを提案する。
変形性音声の質は統計VCによって大幅に改善される。
しかし, 変形性関節症患者の通常の発話は, ほとんど収集できないため, 過去の研究は患者の個性を取り戻すことはできなかった。
論文 参考訳(メタデータ) (2021-06-02T18:41:03Z) - Parkinsonian Chinese Speech Analysis towards Automatic Classification of
Parkinson's Disease [31.431256876809343]
パーキンソン病(PD)の早期に発する発声障害
中国語の音声コーパスを新たに構築し,PD患者の分類について検討した。
我々の分類精度は最先端の研究をはるかに上回った。
論文 参考訳(メタデータ) (2021-05-31T04:51:44Z) - Silent Speech Interfaces for Speech Restoration: A Review [59.68902463890532]
サイレント音声インタフェース (SSI) の研究は、重度音声障害の患者に対して、代替的で拡張的なコミュニケーション方法を提供することを目的としている。
SSIは、コミュニケーションを可能にするために、音声生成中に人体によって生成される非音響バイオシグナーに依存している。
現在、ほとんどのSSIは、健康なユーザーのために実験室でのみ検証されている。
論文 参考訳(メタデータ) (2020-09-04T11:05:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。