論文の概要: Going Beyond the Cookie Theft Picture Test: Detecting Cognitive
Impairments using Acoustic Features
- arxiv url: http://arxiv.org/abs/2206.05018v1
- Date: Fri, 10 Jun 2022 12:04:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-13 15:00:03.768363
- Title: Going Beyond the Cookie Theft Picture Test: Detecting Cognitive
Impairments using Acoustic Features
- Title(参考訳): クッキー盗難画像検査を超える:音響的特徴を用いた認知障害の検出
- Authors: Franziska Braun, Andreas Erzigkeit, Hartmut Lehfeld, Thomas
Hillemacher, Korbinian Riedhammer, and Sebastian P. Bayerl
- Abstract要約: 標準化されたテストの音響的特徴は、認知障害者と非障害者とを確実に識別するために有効であることを示す。
インタビューのランダムな音声サンプルから抽出した特徴でさえ、認知障害の識別要因であることを示す。
- 参考スコア(独自算出の注目度): 0.18472148461613155
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Standardized tests play a crucial role in the detection of cognitive
impairment. Previous work demonstrated that automatic detection of cognitive
impairment is possible using audio data from a standardized picture description
task. The presented study goes beyond that, evaluating our methods on data
taken from two standardized neuropsychological tests, namely the German SKT and
a German version of the CERAD-NB, and a semi-structured clinical interview
between a patient and a psychologist. For the tests, we focus on speech
recordings of three sub-tests: reading numbers (SKT 3), interference (SKT 7),
and verbal fluency (CERAD-NB 1). We show that acoustic features from
standardized tests can be used to reliably discriminate cognitively impaired
individuals from non-impaired ones. Furthermore, we provide evidence that even
features extracted from random speech samples of the interview can be a
discriminator of cognitive impairment. In our baseline experiments, we use
OpenSMILE features and Support Vector Machine classifiers. In an improved
setup, we show that using wav2vec 2.0 features instead, we can achieve an
accuracy of up to 85%.
- Abstract(参考訳): 標準化されたテストは認知障害の検出において重要な役割を果たす。
従来,画像記述タスクの音声データを用いて認知障害の自動検出が可能であった。
この研究は、ドイツのsktとドイツのcerad-nb、そして患者と心理学者の半構造化臨床面接という2つの標準的な神経心理学検査から得られたデータに基づいて、我々の方法を評価するものである。
本試験では, 読解数(SKT3), 干渉(SKT 7), 言語流速(CERAD-NB 1)の3つのサブテストの音声記録に焦点を当てた。
標準テストから得られた音響特徴は,認知障害のある個人と非障害者を確実に判別するために有効である。
さらに,インタビューのランダムな音声サンプルから抽出した特徴でさえ,認知障害の識別要因となりうることを示す。
ベースライン実験では、OpenSMILE機能とSupport Vector Machine分類器を使用します。
改良されたセットアップでは、代わりにwav2vec 2.0機能を使用することで、最大85%の精度を実現することができる。
関連論文リスト
- Infusing Acoustic Pause Context into Text-Based Dementia Assessment [7.8642589679025034]
本研究は, 認知障害のない被験者の認知状態, 軽度認知障害, およびアルツハイマー認知症を, 臨床的評価に基づいて区別するために, 言語モデルにおける停止強調文字の使用について検討した。
この性能は、ドイツ語の言語頻度テストと画像記述テストの実験を通じて評価され、異なる音声生成コンテキストにおけるモデルの有効性を比較した。
論文 参考訳(メタデータ) (2024-08-27T16:44:41Z) - Identification of Cognitive Decline from Spoken Language through Feature
Selection and the Bag of Acoustic Words Model [0.0]
記憶障害の症状の早期発見は、集団の健康確保に重要な役割を担っている。
臨床環境における標準化された音声テストの欠如は、自然音声言語を解析するための自動機械学習技術の開発にますます重点を置いている。
この研究は特徴選択に関するアプローチを示し、ジュネーブの最小音響パラメータセットと相対音声停止から診断に必要な重要な特徴を自動的に選択することを可能にする。
論文 参考訳(メタデータ) (2024-02-02T17:06:03Z) - PsyCoT: Psychological Questionnaire as Powerful Chain-of-Thought for
Personality Detection [50.66968526809069]
PsyCoTと呼ばれる新しい人格検出手法を提案する。これは、個人がマルチターン対話方式で心理的質問を完遂する方法を模倣するものである。
実験の結果,PsyCoTは人格検出におけるGPT-3.5の性能とロバスト性を大幅に向上させることがわかった。
論文 参考訳(メタデータ) (2023-10-31T08:23:33Z) - A New Benchmark of Aphasia Speech Recognition and Detection Based on
E-Branchformer and Multi-task Learning [29.916793641951507]
本稿では,最新の音声認識技術を用いた失語症音声認識のための新しいベンチマークを提案する。
CTC/Attentionアーキテクチャに基づく2つのマルチタスク学習手法を導入し、両方のタスクを同時に実行する。
当システムでは,中等度失語症患者に対して,最先端の話者レベル検出精度(97.3%)と相対的なWER低下率(1%)を達成している。
論文 参考訳(メタデータ) (2023-05-19T15:10:36Z) - Anomalous Sound Detection using Audio Representation with Machine ID
based Contrastive Learning Pretraining [52.191658157204856]
コントラスト学習を用いて、各音声サンプルではなく、各機械IDの音声表現を洗練する。
提案手法では、コントラスト学習を用いて音声表現モデルを事前学習する。
実験の結果,本手法はコントラスト学習や自己教師型分類を用いて最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2023-04-07T11:08:31Z) - Automated Evaluation of Standardized Dementia Screening Tests [0.18472148461613155]
半標準化された歴史と2つの標準化された神経心理学的テストからなる研究について報告する。
テストには、名前オブジェクトや単語リストの学習といった基本的なタスクだけでなく、MMSEのような広く使われているツールも含まれている。
単語代替語を用いることで、認識誤りを軽減し、その後、専門家のスコアとの相関性を改善することが示される。
論文 参考訳(メタデータ) (2022-06-13T14:41:27Z) - Spotting adversarial samples for speaker verification by neural vocoders [102.1486475058963]
我々は、自動話者検証(ASV)のための敵対サンプルを見つけるために、ニューラルボコーダを採用する。
元の音声と再合成音声のASVスコアの違いは、真正と逆正のサンプルの識別に良い指標であることがわかった。
私たちのコードは、将来的な比較作業のためにオープンソースにされます。
論文 参考訳(メタデータ) (2021-07-01T08:58:16Z) - CogAlign: Learning to Align Textual Neural Representations to Cognitive
Language Processing Signals [60.921888445317705]
自然言語処理モデルに認知言語処理信号を統合するためのCogAlignアプローチを提案する。
我々は、CogAlignが、パブリックデータセット上の最先端モデルよりも、複数の認知機能で大幅な改善を実現していることを示す。
論文 参考訳(メタデータ) (2021-06-10T07:10:25Z) - NUVA: A Naming Utterance Verifier for Aphasia Treatment [49.114436579008476]
失語症(PWA)患者の治療介入に対する反応の診断とモニタリングの両立のための画像命名タスクを用いた音声性能評価
本稿では,失語症脳卒中患者の「正しい」と「正しくない」を分類する深層学習要素を組み込んだ発話検証システムであるNUVAについて述べる。
イギリス系英語8ヶ国語でのテストでは、システムの性能精度は83.6%から93.6%の範囲であり、10倍のクロスバリデーション平均は89.5%であった。
論文 参考訳(メタデータ) (2021-02-10T13:00:29Z) - Speech Enhancement using Self-Adaptation and Multi-Head Self-Attention [70.82604384963679]
本稿では,補助的話者認識機能を用いた音声強調のための自己適応手法について検討する。
テスト発話から直接適応に用いる話者表現を抽出する。
論文 参考訳(メタデータ) (2020-02-14T05:05:36Z) - Accelerating Psychometric Screening Tests With Bayesian Active
Differential Selection [5.1779694507922835]
本稿では,患者の心理指標関数の推定値の変化に対する迅速スクリーニング法を提案する。
我々は,国立労働安全衛生研究所NIOSH(National Institute of Occupational Safety and Health NIOSH)の音声測定データを用いてアプローチを検証する。
論文 参考訳(メタデータ) (2020-02-04T21:35:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。