論文の概要: NUVA: A Naming Utterance Verifier for Aphasia Treatment
- arxiv url: http://arxiv.org/abs/2102.05408v1
- Date: Wed, 10 Feb 2021 13:00:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-11 19:36:01.536428
- Title: NUVA: A Naming Utterance Verifier for Aphasia Treatment
- Title(参考訳): NUVA:失語症治療のためのネーミング発話検証器
- Authors: David Sabate Barbera, Mark Huckvale, Victoria Fleming, Emily Upton,
Henry Coley-Fisher, Catherine Doogan, Ian Shaw, William Latham, Alexander P.
Leff, Jenny Crinion
- Abstract要約: 失語症(PWA)患者の治療介入に対する反応の診断とモニタリングの両立のための画像命名タスクを用いた音声性能評価
本稿では,失語症脳卒中患者の「正しい」と「正しくない」を分類する深層学習要素を組み込んだ発話検証システムであるNUVAについて述べる。
イギリス系英語8ヶ国語でのテストでは、システムの性能精度は83.6%から93.6%の範囲であり、10倍のクロスバリデーション平均は89.5%であった。
- 参考スコア(独自算出の注目度): 49.114436579008476
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Anomia (word-finding difficulties) is the hallmark of aphasia, an acquired
language disorder most commonly caused by stroke. Assessment of speech
performance using picture naming tasks is a key method for both diagnosis and
monitoring of responses to treatment interventions by people with aphasia
(PWA). Currently, this assessment is conducted manually by speech and language
therapists (SLT). Surprisingly, despite advancements in automatic speech
recognition (ASR) and artificial intelligence with technologies like deep
learning, research on developing automated systems for this task has been
scarce. Here we present NUVA, an utterance verification system incorporating a
deep learning element that classifies 'correct' versus' incorrect' naming
attempts from aphasic stroke patients. When tested on eight native
British-English speaking PWA the system's performance accuracy ranged between
83.6% to 93.6%, with a 10-fold cross-validation mean of 89.5%. This performance
was not only significantly better than a baseline created for this study using
one of the leading commercially available ASRs (Google speech-to-text service)
but also comparable in some instances with two independent SLT ratings for the
same dataset.
- Abstract(参考訳): 失語症(アノミア、英: Anomia)は、脳卒中によって最も一般的に引き起こされる言語障害である。
失語症(PWA)患者の治療介入に対する反応の診断とモニタリングの両面において,画像命名タスクを用いた音声性能の評価が重要である。
現在,この評価は言語療法士(SLT)によって手作業で行われている。
驚くべきことに、自動音声認識(ASR)とディープラーニングのような技術による人工知能の進歩にもかかわらず、このタスクのための自動システムの開発の研究は少なかった。
本稿では,失語症患者に対する「正しい」対「正しくない」命名の試みを分類する深層学習要素を組み込んだ発話検証システムであるnuvaを提案する。
8つの英英会話pwaでテストしたところ、システムの性能は83.6%から93.6%で、10倍のクロスバリデーション平均は89.5%であった。
このパフォーマンスは、主要な商用ASR(Googleの音声テキストサービス)を使用して、この研究のために作成されたベースラインよりも大幅に向上しただけでなく、同じデータセットに対して2つの独立したSLTレーティングを持つケースでも同等であった。
関連論文リスト
- Automatically measuring speech fluency in people with aphasia: first
achievements using read-speech data [55.84746218227712]
本研究の目的は,言語習得の分野で開発された信号処理algorithmの関連性を評価することである。
論文 参考訳(メタデータ) (2023-08-09T07:51:40Z) - A New Benchmark of Aphasia Speech Recognition and Detection Based on
E-Branchformer and Multi-task Learning [29.916793641951507]
本稿では,最新の音声認識技術を用いた失語症音声認識のための新しいベンチマークを提案する。
CTC/Attentionアーキテクチャに基づく2つのマルチタスク学習手法を導入し、両方のタスクを同時に実行する。
当システムでは,中等度失語症患者に対して,最先端の話者レベル検出精度(97.3%)と相対的なWER低下率(1%)を達成している。
論文 参考訳(メタデータ) (2023-05-19T15:10:36Z) - Cross-lingual Alzheimer's Disease detection based on paralinguistic and
pre-trained features [6.928826160866143]
本稿ではICASSP-SPGC-2023 ADReSS-M Challenge Taskについて述べる。
この課題は、アルツハイマー病の予測のために、どの音響特徴を一般化し、言語間で伝達できるかを検討することである。
我々は、openSmileツールキットとXLSR-53を用いた音響特性を用いてパラ言語的特徴を抽出する。
本手法は分類タスクの69.6%の精度と回帰タスクの4.788の根平均二乗誤差(RMSE)を実現する。
論文 参考訳(メタデータ) (2023-03-14T06:34:18Z) - Exploiting prompt learning with pre-trained language models for
Alzheimer's Disease detection [70.86672569101536]
アルツハイマー病(AD)の早期診断は予防ケアの促進とさらなる進行の遅らせに不可欠である。
本稿では,AD分類誤差をトレーニング対象関数として一貫して用いたPLMの高速微調整法について検討する。
論文 参考訳(メタデータ) (2022-10-29T09:18:41Z) - Exploiting Cross-domain And Cross-Lingual Ultrasound Tongue Imaging
Features For Elderly And Dysarthric Speech Recognition [55.25565305101314]
調音機能は音響信号歪みに不変であり、音声認識システムにうまく組み込まれている。
本稿では,A2Aモデルにおける24時間TaLコーパスの並列音声・超音波舌画像(UTI)データを利用したクロスドメインおよびクロスランガルA2Aインバージョン手法を提案する。
生成した調音機能を組み込んだ3つのタスクの実験は、ベースラインのTDNNとコンフォーマーASRシステムより一貫して優れていた。
論文 参考訳(メタデータ) (2022-06-15T07:20:28Z) - Zero-Shot Cross-lingual Aphasia Detection using Automatic Speech
Recognition [3.2631198264090746]
失語症(英: Aphasia)は、一般的には脳損傷や脳卒中によって引き起こされる言語障害であり、世界中の何百万人もの人々に影響を及ぼす。
本稿では,言語間音声表現を共用する事前学習型自動音声認識(ASR)モデルを用いたエンドツーエンドパイプラインを提案する。
論文 参考訳(メタデータ) (2022-04-01T14:05:02Z) - Sequence-level self-learning with multiple hypotheses [53.04725240411895]
我々は、自動音声認識(ASR)のためのアテンションベースシーケンス・ツー・シーケンス(seq2seq)モデルを用いた新しい自己学習手法を開発した。
従来の教師なし学習手法とは対照的に,我々はEmphmulti-task Learning(MTL)フレームワークを採用する。
実験の結果,本手法は,英語データのみを用いてトレーニングしたベースラインモデルと比較して,英文音声データのWERを14.55%から10.36%に削減できることがわかった。
論文 参考訳(メタデータ) (2021-12-10T20:47:58Z) - Influence of ASR and Language Model on Alzheimer's Disease Detection [2.4698886064068555]
画像から参加者の音声記述を転写するために,SotA ASRシステムを用いて分析する。
本研究では,ASRから仮説を復号化するための言語モデルが欠如していることから,単語の非標準列を補正する言語モデルの影響について検討する。
提案システムは、韻律と声質に基づく音響と、最も一般的な単語の最初の出現に基づく語彙的特徴を組み合わせる。
論文 参考訳(メタデータ) (2021-09-20T10:41:39Z) - Explainable Identification of Dementia from Transcripts using
Transformer Networks [0.0]
アルツハイマー病(英語: Alzheimer's disease, AD)は、認知症の主要な原因であり、記憶喪失を伴い、時間通りに診断されない場合の日常生活に深刻な結果をもたらす可能性がある。
本稿では,2つのマルチタスク学習モデルを紹介し,主課題は認知症(バイナリ分類)の同定であり,補助課題は認知症の重症度(マルチクラス分類)の同定に対応する。
マルチタスク学習環境におけるAD患者検出の精度は84.99%である。
論文 参考訳(メタデータ) (2021-09-14T21:49:05Z) - Dynamic Acoustic Unit Augmentation With BPE-Dropout for Low-Resource
End-to-End Speech Recognition [62.94773371761236]
我々は、OOVレートの高い低リソースセットアップで効果的なエンドツーエンドASRシステムを構築することを検討します。
本稿では,BPE-dropout法に基づく動的音響ユニット拡張法を提案する。
我々の単言語トルココンフォーマーは22.2%の文字誤り率(CER)と38.9%の単語誤り率(WER)の競争結果を確立した。
論文 参考訳(メタデータ) (2021-03-12T10:10:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。