論文の概要: Influence of ASR and Language Model on Alzheimer's Disease Detection
- arxiv url: http://arxiv.org/abs/2110.15704v1
- Date: Mon, 20 Sep 2021 10:41:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-14 05:21:09.017185
- Title: Influence of ASR and Language Model on Alzheimer's Disease Detection
- Title(参考訳): ASRと言語モデルがアルツハイマー病の検出に及ぼす影響
- Authors: Joan Codina-Filb\`a and Guillermo C\'ambara and Jordi Luque and Mireia
Farr\'us
- Abstract要約: 画像から参加者の音声記述を転写するために,SotA ASRシステムを用いて分析する。
本研究では,ASRから仮説を復号化するための言語モデルが欠如していることから,単語の非標準列を補正する言語モデルの影響について検討する。
提案システムは、韻律と声質に基づく音響と、最も一般的な単語の最初の出現に基づく語彙的特徴を組み合わせる。
- 参考スコア(独自算出の注目度): 2.4698886064068555
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Alzheimer's Disease is the most common form of dementia. Automatic detection
from speech could help to identify symptoms at early stages, so that preventive
actions can be carried out. This research is a contribution to the ADReSSo
Challenge, we analyze the usage of a SotA ASR system to transcribe
participant's spoken descriptions from a picture. We analyse the loss of
performance regarding the use of human transcriptions (measured using
transcriptions from the 2020 ADReSS Challenge). Furthermore, we study the
influence of a language model -- which tends to correct non-standard sequences
of words -- with the lack of language model to decode the hypothesis from the
ASR. This aims at studying the language bias and get more meaningful
transcriptions based only on the acoustic information from patients. The
proposed system combines acoustic -- based on prosody and voice quality -- and
lexical features based on the first occurrence of the most common words. The
reported results show the effect of using automatic transcripts with or without
language model. The best fully automatic system achieves up to 76.06 % of
accuracy (without language model), significantly higher, 3 % above, than a
system employing word transcriptions decoded using general purpose language
models.
- Abstract(参考訳): アルツハイマー病は認知症の最も一般的な形態である。
音声からの自動検出は、早期の症状を識別するのに役立ち、予防行動を実行することができる。
本研究はADReSSo Challengeへの貢献であり,画像から参加者の音声記述を転写するためのSotA ASRシステムの使用状況を分析する。
本研究は,2020年のadressチャレンジにおけるヒトの転写の使用に関する性能の低下を分析した。
さらに,ASRから仮説を復号する言語モデルが欠如していることから,単語の非標準順序を補正する言語モデルの影響について検討する。このシステムは,患者からの音響情報のみに基づいて,言語バイアスを研究し,より意味のある書き起こしを得ることを目的としている。提案システムは,韻律と声質に基づく音響と,最も一般的な単語の最初の出現に基づく語彙的特徴を組み合わせた。
報告した結果から,言語モデルの有無にかかわらず,自動書き起こしを用いることの効果が示された。
最高の完全自動システムは76.06 %の精度を達成する(言語モデルなしで)が、汎用言語モデルを用いて復号された単語の書き起こしを用いるシステムよりも大幅に高く、3%高い。
関連論文リスト
- Swin-BERT: A Feature Fusion System designed for Speech-based Alzheimer's Dementia Detection [4.668008953332776]
認知症自動検出のための音声ベースシステムSwin-BERTを提案する。
音響的部分については,移動窓のマルチヘッドアテンションを用いて音響系を設計する。
言語的部分については、ADの有無によって異なるリズム関連情報を削除し、音声記録を転写文に書き起こしする。
論文 参考訳(メタデータ) (2024-10-09T06:58:20Z) - Profiling Patient Transcript Using Large Language Model Reasoning Augmentation for Alzheimer's Disease Detection [4.961581278723015]
アルツハイマー病(AD)は認知症の主要な原因であり、徐々に音声や言語能力の低下が特徴である。
近年の深層学習は自発音声によるAD自動検出を容易にする。
各発話中のテキストパターンを,患者の言語的特徴をグローバルに把握せずに直接モデル化する。
論文 参考訳(メタデータ) (2024-09-19T07:58:07Z) - HyPoradise: An Open Baseline for Generative Speech Recognition with
Large Language Models [81.56455625624041]
ASRの誤り訂正に外部の大規模言語モデル(LLM)を利用する最初のオープンソースベンチマークを導入する。
提案したベンチマークには、334,000組以上のN-best仮説を含む新しいデータセットHyPoradise (HP)が含まれている。
合理的なプロンプトと生成能力を持つLLMは、N-bestリストに欠けているトークンを修正できる。
論文 参考訳(メタデータ) (2023-09-27T14:44:10Z) - Leveraging Pretrained Representations with Task-related Keywords for
Alzheimer's Disease Detection [69.53626024091076]
アルツハイマー病(AD)は高齢者に特に顕著である。
事前学習モデルの最近の進歩は、AD検出モデリングを低レベル特徴から高レベル表現にシフトさせる動機付けとなっている。
本稿では,高レベルの音響・言語的特徴から,より優れたAD関連手がかりを抽出する,いくつかの効率的な手法を提案する。
論文 参考訳(メタデータ) (2023-03-14T16:03:28Z) - Cross-lingual Alzheimer's Disease detection based on paralinguistic and
pre-trained features [6.928826160866143]
本稿ではICASSP-SPGC-2023 ADReSS-M Challenge Taskについて述べる。
この課題は、アルツハイマー病の予測のために、どの音響特徴を一般化し、言語間で伝達できるかを検討することである。
我々は、openSmileツールキットとXLSR-53を用いた音響特性を用いてパラ言語的特徴を抽出する。
本手法は分類タスクの69.6%の精度と回帰タスクの4.788の根平均二乗誤差(RMSE)を実現する。
論文 参考訳(メタデータ) (2023-03-14T06:34:18Z) - Multilingual Alzheimer's Dementia Recognition through Spontaneous
Speech: a Signal Processing Grand Challenge [18.684024762601215]
この信号処理グランドチャレンジ(SPGC)は、社会的・医療的関連性の難しい自動予測問題をターゲットにしている。
チャレンジは、ある言語(英語)における音声に基づいて構築された予測モデルが、他の言語(ギリシャ語)に一般化する程度を評価するように設計されている。
論文 参考訳(メタデータ) (2023-01-13T14:09:13Z) - Exploiting prompt learning with pre-trained language models for
Alzheimer's Disease detection [70.86672569101536]
アルツハイマー病(AD)の早期診断は予防ケアの促進とさらなる進行の遅らせに不可欠である。
本稿では,AD分類誤差をトレーニング対象関数として一貫して用いたPLMの高速微調整法について検討する。
論文 参考訳(メタデータ) (2022-10-29T09:18:41Z) - Exploring linguistic feature and model combination for speech
recognition based automatic AD detection [61.91708957996086]
音声ベースの自動ADスクリーニングシステムは、他の臨床スクリーニング技術に代わる非侵襲的でスケーラブルな代替手段を提供する。
専門的なデータの収集は、そのようなシステムを開発する際に、モデル選択と特徴学習の両方に不確実性をもたらす。
本稿では,BERT と Roberta の事前学習したテキストエンコーダのドメイン微調整の堅牢性向上のための特徴とモデルの組み合わせ手法について検討する。
論文 参考訳(メタデータ) (2022-06-28T05:09:01Z) - Exploiting Cross-domain And Cross-Lingual Ultrasound Tongue Imaging
Features For Elderly And Dysarthric Speech Recognition [55.25565305101314]
調音機能は音響信号歪みに不変であり、音声認識システムにうまく組み込まれている。
本稿では,A2Aモデルにおける24時間TaLコーパスの並列音声・超音波舌画像(UTI)データを利用したクロスドメインおよびクロスランガルA2Aインバージョン手法を提案する。
生成した調音機能を組み込んだ3つのタスクの実験は、ベースラインのTDNNとコンフォーマーASRシステムより一貫して優れていた。
論文 参考訳(メタデータ) (2022-06-15T07:20:28Z) - Zero-Shot Cross-lingual Aphasia Detection using Automatic Speech
Recognition [3.2631198264090746]
失語症(英: Aphasia)は、一般的には脳損傷や脳卒中によって引き起こされる言語障害であり、世界中の何百万人もの人々に影響を及ぼす。
本稿では,言語間音声表現を共用する事前学習型自動音声認識(ASR)モデルを用いたエンドツーエンドパイプラインを提案する。
論文 参考訳(メタデータ) (2022-04-01T14:05:02Z) - NUVA: A Naming Utterance Verifier for Aphasia Treatment [49.114436579008476]
失語症(PWA)患者の治療介入に対する反応の診断とモニタリングの両立のための画像命名タスクを用いた音声性能評価
本稿では,失語症脳卒中患者の「正しい」と「正しくない」を分類する深層学習要素を組み込んだ発話検証システムであるNUVAについて述べる。
イギリス系英語8ヶ国語でのテストでは、システムの性能精度は83.6%から93.6%の範囲であり、10倍のクロスバリデーション平均は89.5%であった。
論文 参考訳(メタデータ) (2021-02-10T13:00:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。