論文の概要: Speech Paralinguistic Approach for Detecting Dementia Using Gated
Convolutional Neural Network
- arxiv url: http://arxiv.org/abs/2004.07992v3
- Date: Tue, 6 Oct 2020 13:00:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-12 22:20:40.950711
- Title: Speech Paralinguistic Approach for Detecting Dementia Using Gated
Convolutional Neural Network
- Title(参考訳): ゲート型畳み込みニューラルネットワークを用いた認知症検出のための音声パラ言語的アプローチ
- Authors: Mariana Rodrigues Makiuchi, Tifani Warnita, Nakamasa Inoue, Koichi
Shinoda, Michitaka Yoshimura, Momoko Kitazawa, Kei Funaki, Yoko Eguchi,
Taishiro Kishimoto
- Abstract要約: 音声のみを用いて認知症を自動的に検出する非侵襲的で費用対効果の高い手法を提案する。
短い音声セグメントのパラ言語的特徴を抽出し、GCNN(Gated Convolutional Neural Networks)を用いて認知症や健康に分類する。
- 参考スコア(独自算出の注目度): 11.620767229470358
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a non-invasive and cost-effective method to automatically detect
dementia by utilizing solely speech audio data. We extract paralinguistic
features for a short speech segment and use Gated Convolutional Neural Networks
(GCNN) to classify it into dementia or healthy. We evaluate our method on the
Pitt Corpus and on our own dataset, the PROMPT Database. Our method yields the
accuracy of 73.1% on the Pitt Corpus using an average of 114 seconds of speech
data. In the PROMPT Database, our method yields the accuracy of 74.7% using 4
seconds of speech data and it improves to 80.8% when we use all the patient's
speech data. Furthermore, we evaluate our method on a three-class
classification problem in which we included the Mild Cognitive Impairment (MCI)
class and achieved the accuracy of 60.6% with 40 seconds of speech data.
- Abstract(参考訳): 音声データのみを利用して認知症を自動的に検出する非侵襲的かつ費用効果の高い手法を提案する。
短い音声セグメントのパラ言語的特徴を抽出し、GCNN(Gated Convolutional Neural Networks)を用いて認知症や健康に分類する。
我々は,Pitt Corpus の手法と,我々のデータセットである PROMPT Database を用いて評価を行った。
提案手法は平均114秒の音声データを用いてPitt Corpus上で73.1%の精度が得られる。
PROMPTデータベースでは,4秒の音声データを用いて74.7%の精度を示し,全患者の音声データを使用すると80.8%に向上する。
さらに,ミルド認知障害(MCI)クラスを含む3クラス分類問題に対して,40秒の音声データを用いて,60.6%の精度で評価を行った。
関連論文リスト
- Detecting Speech Abnormalities with a Perceiver-based Sequence
Classifier that Leverages a Universal Speech Model [4.503292461488901]
いくつかの神経疾患の音声反射異常を検出するPerceiver-based sequenceを提案する。
このシーケンスとUniversal Speech Model (USM)を組み合わせ、1200万時間に及ぶ多様な音声録音をトレーニング(教師なし)する。
我々のモデルは標準変圧器 (80.9%) および知覚器 (81.8%) モデルより優れ、平均精度は83.1%である。
論文 参考訳(メタデータ) (2023-10-16T21:07:12Z) - Dementia Assessment Using Mandarin Speech with an Attention-based Speech
Recognition Encoder [0.4369058206183195]
本稿では,マンダリン話者に適した認知症評価システムを構築するために,音声認識モデルを利用する。
99名の被験者からマンダリン音声データを収集し, 地域病院から臨床評価を得た。
アルツハイマー病の診断では92.04%の精度で, 平均絶対誤差は9%であった。
論文 参考訳(メタデータ) (2023-10-06T03:04:11Z) - A New Benchmark of Aphasia Speech Recognition and Detection Based on
E-Branchformer and Multi-task Learning [29.916793641951507]
本稿では,最新の音声認識技術を用いた失語症音声認識のための新しいベンチマークを提案する。
CTC/Attentionアーキテクチャに基づく2つのマルチタスク学習手法を導入し、両方のタスクを同時に実行する。
当システムでは,中等度失語症患者に対して,最先端の話者レベル検出精度(97.3%)と相対的なWER低下率(1%)を達成している。
論文 参考訳(メタデータ) (2023-05-19T15:10:36Z) - Multilingual Alzheimer's Dementia Recognition through Spontaneous
Speech: a Signal Processing Grand Challenge [18.684024762601215]
この信号処理グランドチャレンジ(SPGC)は、社会的・医療的関連性の難しい自動予測問題をターゲットにしている。
チャレンジは、ある言語(英語)における音声に基づいて構築された予測モデルが、他の言語(ギリシャ語)に一般化する程度を評価するように設計されている。
論文 参考訳(メタデータ) (2023-01-13T14:09:13Z) - Conformer Based Elderly Speech Recognition System for Alzheimer's
Disease Detection [62.23830810096617]
アルツハイマー病(AD)の早期診断は、予防ケアがさらなる進行を遅らせるのに不可欠である。
本稿では,DementiaBank Pitt コーパスをベースとした最新のコンバータに基づく音声認識システムの開発について述べる。
論文 参考訳(メタデータ) (2022-06-23T12:50:55Z) - Exploiting Cross-domain And Cross-Lingual Ultrasound Tongue Imaging
Features For Elderly And Dysarthric Speech Recognition [55.25565305101314]
調音機能は音響信号歪みに不変であり、音声認識システムにうまく組み込まれている。
本稿では,A2Aモデルにおける24時間TaLコーパスの並列音声・超音波舌画像(UTI)データを利用したクロスドメインおよびクロスランガルA2Aインバージョン手法を提案する。
生成した調音機能を組み込んだ3つのタスクの実験は、ベースラインのTDNNとコンフォーマーASRシステムより一貫して優れていた。
論文 参考訳(メタデータ) (2022-06-15T07:20:28Z) - Deep Learning for Hate Speech Detection: A Comparative Study [54.42226495344908]
ここでは, ディープ・ヘイト・音声検出法と浅いヘイト・音声検出法を大規模に比較した。
私たちの目標は、この地域の進歩を照らし、現在の最先端の強みと弱点を特定することです。
そこで我々は,ヘイトスピーチ検出の実践的利用に関するガイダンスの提供,最先端の定量化,今後の研究方向の特定を目的としている。
論文 参考訳(メタデータ) (2022-02-19T03:48:20Z) - Investigation of Data Augmentation Techniques for Disordered Speech
Recognition [69.50670302435174]
本稿では,不規則音声認識のための一連のデータ拡張手法について検討する。
正常な音声と無秩序な音声の両方が増強過程に利用された。
UASpeechコーパスを用いた最終話者適応システムと、最大2.92%の絶対単語誤り率(WER)の速度摂動に基づく最良の拡張アプローチ
論文 参考訳(メタデータ) (2022-01-14T17:09:22Z) - EMT-NET: Efficient multitask network for computer-aided diagnosis of
breast cancer [58.720142291102135]
乳腺腫瘍の分類と分別を同時に行うための,効率的で軽量な学習アーキテクチャを提案する。
腫瘍分類ネットワークにセグメンテーションタスクを組み込むことにより,腫瘍領域に着目したバックボーンネットワークで表現を学習する。
腫瘍分類の精度、感度、特異性はそれぞれ88.6%、94.1%、85.3%である。
論文 参考訳(メタデータ) (2022-01-13T05:24:40Z) - NUVA: A Naming Utterance Verifier for Aphasia Treatment [49.114436579008476]
失語症(PWA)患者の治療介入に対する反応の診断とモニタリングの両立のための画像命名タスクを用いた音声性能評価
本稿では,失語症脳卒中患者の「正しい」と「正しくない」を分類する深層学習要素を組み込んだ発話検証システムであるNUVAについて述べる。
イギリス系英語8ヶ国語でのテストでは、システムの性能精度は83.6%から93.6%の範囲であり、10倍のクロスバリデーション平均は89.5%であった。
論文 参考訳(メタデータ) (2021-02-10T13:00:29Z) - Multi-Modal Detection of Alzheimer's Disease from Speech and Text [3.702631194466718]
本稿では,アルツハイマー病(AD)の診断に音声と対応する文字を同時に利用する深層学習手法を提案する。
提案手法は,Dementiabank Pitt corpus のトレーニングおよび評価において,85.3%のクロスバリデーション精度を実現する。
論文 参考訳(メタデータ) (2020-11-30T21:18:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。