論文の概要: Multi-modal fusion with gating using audio, lexical and disfluency
features for Alzheimer's Dementia recognition from spontaneous speech
- arxiv url: http://arxiv.org/abs/2106.09668v1
- Date: Thu, 17 Jun 2021 17:20:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-18 18:08:23.199440
- Title: Multi-modal fusion with gating using audio, lexical and disfluency
features for Alzheimer's Dementia recognition from spontaneous speech
- Title(参考訳): 自然発声によるアルツハイマー認知症に対する音声・語彙・逆流機能を用いたマルチモーダル融合法
- Authors: Morteza Rohanian, Julian Hough, Matthew Purver
- Abstract要約: 本論文は、自発音声(ADReSS)によるアルツハイマー認知症への挑戦である。
本研究の目的は、音声データからアルツハイマー病の重症度の自動予測を支援する方法を開発することである。
- 参考スコア(独自算出の注目度): 11.34426502082293
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper is a submission to the Alzheimer's Dementia Recognition through
Spontaneous Speech (ADReSS) challenge, which aims to develop methods that can
assist in the automated prediction of severity of Alzheimer's Disease from
speech data. We focus on acoustic and natural language features for cognitive
impairment detection in spontaneous speech in the context of Alzheimer's
Disease Diagnosis and the mini-mental state examination (MMSE) score
prediction. We proposed a model that obtains unimodal decisions from different
LSTMs, one for each modality of text and audio, and then combines them using a
gating mechanism for the final prediction. We focused on sequential modelling
of text and audio and investigated whether the disfluencies present in
individuals' speech relate to the extent of their cognitive impairment. Our
results show that the proposed classification and regression schemes obtain
very promising results on both development and test sets. This suggests
Alzheimer's Disease can be detected successfully with sequence modeling of the
speech data of medical sessions.
- Abstract(参考訳): 本稿では,アルツハイマー病の重症度を音声データから自動予測する手法の開発を目的として,自発的発話(adress)チャレンジによるアルツハイマー認知症認識への提案を行う。
我々は,アルツハイマー病診断とMMSEスコア予測の文脈において,自然発話における認知障害検出のための音響的・自然言語的特徴に着目した。
そこで本研究では,テキストと音声のモダリティごとに異なるLSTMから一様決定を得られるモデルを提案し,最終的な予測にゲーティング機構を用いて組み合わせた。
テキストと音声の逐次モデリングに着目し,個人の発話における不均一性が認知障害の程度に関連しているかを検討した。
その結果,提案する分類と回帰スキームは,開発とテストの両方において非常に有望な結果が得られることがわかった。
このことは、アルツハイマー病が医療セッションの音声データのシーケンスモデリングで正常に検出できることを示唆している。
関連論文リスト
- Self-supervised Speech Models for Word-Level Stuttered Speech Detection [66.46810024006712]
自己教師付き音声モデルを利用した単語レベルの発声音声検出モデルを提案する。
本評価は, 単語レベルの発声検出において, 従来の手法を超越していることを示す。
論文 参考訳(メタデータ) (2024-09-16T20:18:20Z) - Exploring Speech Pattern Disorders in Autism using Machine Learning [12.469348589699766]
本研究は, 被験者と患者との対話の分析を通じて, 独特の音声パターンを識別するための包括的アプローチを提案する。
我々は,40の音声関連特徴を抽出し,周波数,ゼロクロス速度,エネルギー,スペクトル特性,メル周波数ケプストラル係数(MFCC),バランスに分類した。
分類モデルはASDと非ASDを区別することを目的としており、精度は87.75%である。
論文 参考訳(メタデータ) (2024-05-03T02:59:15Z) - Leveraging Pretrained Representations with Task-related Keywords for
Alzheimer's Disease Detection [69.53626024091076]
アルツハイマー病(AD)は高齢者に特に顕著である。
事前学習モデルの最近の進歩は、AD検出モデリングを低レベル特徴から高レベル表現にシフトさせる動機付けとなっている。
本稿では,高レベルの音響・言語的特徴から,より優れたAD関連手がかりを抽出する,いくつかの効率的な手法を提案する。
論文 参考訳(メタデータ) (2023-03-14T16:03:28Z) - Multilingual Alzheimer's Dementia Recognition through Spontaneous
Speech: a Signal Processing Grand Challenge [18.684024762601215]
この信号処理グランドチャレンジ(SPGC)は、社会的・医療的関連性の難しい自動予測問題をターゲットにしている。
チャレンジは、ある言語(英語)における音声に基づいて構築された予測モデルが、他の言語(ギリシャ語)に一般化する程度を評価するように設計されている。
論文 参考訳(メタデータ) (2023-01-13T14:09:13Z) - Exploring linguistic feature and model combination for speech
recognition based automatic AD detection [61.91708957996086]
音声ベースの自動ADスクリーニングシステムは、他の臨床スクリーニング技術に代わる非侵襲的でスケーラブルな代替手段を提供する。
専門的なデータの収集は、そのようなシステムを開発する際に、モデル選択と特徴学習の両方に不確実性をもたらす。
本稿では,BERT と Roberta の事前学習したテキストエンコーダのドメイン微調整の堅牢性向上のための特徴とモデルの組み合わせ手法について検討する。
論文 参考訳(メタデータ) (2022-06-28T05:09:01Z) - Conformer Based Elderly Speech Recognition System for Alzheimer's
Disease Detection [62.23830810096617]
アルツハイマー病(AD)の早期診断は、予防ケアがさらなる進行を遅らせるのに不可欠である。
本稿では,DementiaBank Pitt コーパスをベースとした最新のコンバータに基づく音声認識システムの開発について述べる。
論文 参考訳(メタデータ) (2022-06-23T12:50:55Z) - A Preliminary Study of a Two-Stage Paradigm for Preserving Speaker
Identity in Dysarthric Voice Conversion [50.040466658605524]
変形性音声変換(DVC)における話者同一性維持のための新しいパラダイムを提案する。
変形性音声の質は統計VCによって大幅に改善される。
しかし, 変形性関節症患者の通常の発話は, ほとんど収集できないため, 過去の研究は患者の個性を取り戻すことはできなかった。
論文 参考訳(メタデータ) (2021-06-02T18:41:03Z) - Comparing Natural Language Processing Techniques for Alzheimer's
Dementia Prediction in Spontaneous Speech [1.2805268849262246]
アルツハイマー認知症(英語: Alzheimer's Dementia、AD)は、認知機能に影響を与える不治の、不安定で進行性の神経変性疾患である。
自発音声タスクによるアルツハイマー認知は、ADの分類と予測のために、音響的に前処理とバランスの取れたデータセットを提供する。
論文 参考訳(メタデータ) (2020-06-12T17:51:16Z) - A Graph Gaussian Embedding Method for Predicting Alzheimer's Disease
Progression with MEG Brain Networks [59.15734147867412]
アルツハイマー病(AD)に関連する機能的脳ネットワークの微妙な変化を特徴付けることは、疾患進行の早期診断と予測に重要である。
我々は、多重グラフガウス埋め込みモデル(MG2G)と呼ばれる新しいディープラーニング手法を開発した。
我々はMG2Gを用いて、MEG脳ネットワークの内在性潜在性次元を検出し、軽度認知障害(MCI)患者のADへの進行を予測し、MCIに関連するネットワーク変化を伴う脳領域を同定した。
論文 参考訳(メタデータ) (2020-05-08T02:29:24Z) - Alzheimer's Dementia Recognition through Spontaneous Speech: The ADReSS
Challenge [10.497861245133086]
InterSPEECH 2020のADReSS Challengeでは、アルツハイマー認知症の自動認識に対する異なるアプローチを比較可能な共有タスクを定義している。
ADReSSは、年齢と性別の面で音響的に前処理されバランスが取れた、ベンチマーク音声データセットを研究者に提供する。
論文 参考訳(メタデータ) (2020-04-14T23:25:09Z) - Identification of Dementia Using Audio Biomarkers [15.740689461116762]
本研究の目的は、認知症のステージを自動的に識別するために、音声処理と機械学習技術を使用することである。
非言語的音響パラメータはこの目的のために使われ、言語に依存しないアプローチとなっている。
我々は, スペクトル, 時間, ケプストラム等の音響特性の寄与と, 認知症ステージの同定への選択について分析した。
論文 参考訳(メタデータ) (2020-02-27T13:54:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。