論文の概要: Dementia Assessment Using Mandarin Speech with an Attention-based Speech
Recognition Encoder
- arxiv url: http://arxiv.org/abs/2310.03985v2
- Date: Fri, 15 Dec 2023 13:07:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-18 18:44:42.780130
- Title: Dementia Assessment Using Mandarin Speech with an Attention-based Speech
Recognition Encoder
- Title(参考訳): 注意型音声認識エンコーダを用いたマンダリン音声を用いた認知症評価
- Authors: Zih-Jyun Lin, Yi-Ju Chen, Po-Chih Kuo, Likai Huang, Chaur-Jong Hu,
Cheng-Yu Chen
- Abstract要約: 本稿では,マンダリン話者に適した認知症評価システムを構築するために,音声認識モデルを利用する。
99名の被験者からマンダリン音声データを収集し, 地域病院から臨床評価を得た。
アルツハイマー病の診断では92.04%の精度で, 平均絶対誤差は9%であった。
- 参考スコア(独自算出の注目度): 0.4369058206183195
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dementia diagnosis requires a series of different testing methods, which is
complex and time-consuming. Early detection of dementia is crucial as it can
prevent further deterioration of the condition. This paper utilizes a speech
recognition model to construct a dementia assessment system tailored for
Mandarin speakers during the picture description task. By training an
attention-based speech recognition model on voice data closely resembling
real-world scenarios, we have significantly enhanced the model's recognition
capabilities. Subsequently, we extracted the encoder from the speech
recognition model and added a linear layer for dementia assessment. We
collected Mandarin speech data from 99 subjects and acquired their clinical
assessments from a local hospital. We achieved an accuracy of 92.04% in
Alzheimer's disease detection and a mean absolute error of 9% in clinical
dementia rating score prediction.
- Abstract(参考訳): 認知症診断には様々な検査方法が必要であり、複雑で時間がかかる。
認知症の早期発見は、状態のさらなる悪化を予防できるため重要である。
本稿では,マンダリン話者を対象とした認知症評価システムを構築するために,音声認識モデルを用いた。
実世界のシナリオによく似た音声データに対して注意に基づく音声認識モデルを訓練することにより,モデルの認識能力を大幅に向上させた。
その後,音声認識モデルからエンコーダを抽出し,認知症評価のための線形層を追加した。
99名の被験者からマンダリン音声データを収集し,地域病院から臨床評価を得た。
アルツハイマー病検出の精度は92.04%であり, 臨床認知症スコア予測の絶対誤差は9%であった。
関連論文リスト
- Self-supervised Speech Models for Word-Level Stuttered Speech Detection [66.46810024006712]
自己教師付き音声モデルを利用した単語レベルの発声音声検出モデルを提案する。
本評価は, 単語レベルの発声検出において, 従来の手法を超越していることを示す。
論文 参考訳(メタデータ) (2024-09-16T20:18:20Z) - Prosody-Driven Privacy-Preserving Dementia Detection [3.9530780161144667]
本研究の目的は,認知症検出のための診断ユーティリティを保ちつつ,埋め込みを匿名化することである。
本稿では,認知症に関連する韻律的特徴を話者埋め込みから切り離すために,ドメイン知識を活用した新しいアプローチを提案する。
論文 参考訳(メタデータ) (2024-07-03T19:34:47Z) - Identification of Cognitive Decline from Spoken Language through Feature
Selection and the Bag of Acoustic Words Model [0.0]
記憶障害の症状の早期発見は、集団の健康確保に重要な役割を担っている。
臨床環境における標準化された音声テストの欠如は、自然音声言語を解析するための自動機械学習技術の開発にますます重点を置いている。
この研究は特徴選択に関するアプローチを示し、ジュネーブの最小音響パラメータセットと相対音声停止から診断に必要な重要な特徴を自動的に選択することを可能にする。
論文 参考訳(メタデータ) (2024-02-02T17:06:03Z) - Automatically measuring speech fluency in people with aphasia: first
achievements using read-speech data [55.84746218227712]
本研究の目的は,言語習得の分野で開発された信号処理algorithmの関連性を評価することである。
論文 参考訳(メタデータ) (2023-08-09T07:51:40Z) - Multilingual Alzheimer's Dementia Recognition through Spontaneous
Speech: a Signal Processing Grand Challenge [18.684024762601215]
この信号処理グランドチャレンジ(SPGC)は、社会的・医療的関連性の難しい自動予測問題をターゲットにしている。
チャレンジは、ある言語(英語)における音声に基づいて構築された予測モデルが、他の言語(ギリシャ語)に一般化する程度を評価するように設計されている。
論文 参考訳(メタデータ) (2023-01-13T14:09:13Z) - Conformer Based Elderly Speech Recognition System for Alzheimer's
Disease Detection [62.23830810096617]
アルツハイマー病(AD)の早期診断は、予防ケアがさらなる進行を遅らせるのに不可欠である。
本稿では,DementiaBank Pitt コーパスをベースとした最新のコンバータに基づく音声認識システムの開発について述べる。
論文 参考訳(メタデータ) (2022-06-23T12:50:55Z) - Investigation of Data Augmentation Techniques for Disordered Speech
Recognition [69.50670302435174]
本稿では,不規則音声認識のための一連のデータ拡張手法について検討する。
正常な音声と無秩序な音声の両方が増強過程に利用された。
UASpeechコーパスを用いた最終話者適応システムと、最大2.92%の絶対単語誤り率(WER)の速度摂動に基づく最良の拡張アプローチ
論文 参考訳(メタデータ) (2022-01-14T17:09:22Z) - Multi-modal fusion with gating using audio, lexical and disfluency
features for Alzheimer's Dementia recognition from spontaneous speech [11.34426502082293]
本論文は、自発音声(ADReSS)によるアルツハイマー認知症への挑戦である。
本研究の目的は、音声データからアルツハイマー病の重症度の自動予測を支援する方法を開発することである。
論文 参考訳(メタデータ) (2021-06-17T17:20:57Z) - NUVA: A Naming Utterance Verifier for Aphasia Treatment [49.114436579008476]
失語症(PWA)患者の治療介入に対する反応の診断とモニタリングの両立のための画像命名タスクを用いた音声性能評価
本稿では,失語症脳卒中患者の「正しい」と「正しくない」を分類する深層学習要素を組み込んだ発話検証システムであるNUVAについて述べる。
イギリス系英語8ヶ国語でのテストでは、システムの性能精度は83.6%から93.6%の範囲であり、10倍のクロスバリデーション平均は89.5%であった。
論文 参考訳(メタデータ) (2021-02-10T13:00:29Z) - Bulbar ALS Detection Based on Analysis of Voice Perturbation and Vibrato [68.97335984455059]
本研究の目的は,ALS患者の自動検出のための持続母音発声テストの有用性を検証することである。
そこで我々は,音声信号から測定値の計算に必要な基本周期への分離手順の強化を提案した。
論文 参考訳(メタデータ) (2020-03-24T12:49:25Z) - Identification of Dementia Using Audio Biomarkers [15.740689461116762]
本研究の目的は、認知症のステージを自動的に識別するために、音声処理と機械学習技術を使用することである。
非言語的音響パラメータはこの目的のために使われ、言語に依存しないアプローチとなっている。
我々は, スペクトル, 時間, ケプストラム等の音響特性の寄与と, 認知症ステージの同定への選択について分析した。
論文 参考訳(メタデータ) (2020-02-27T13:54:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。