論文の概要: Is Everything Fine, Grandma? Acoustic and Linguistic Modeling for Robust
Elderly Speech Emotion Recognition
- arxiv url: http://arxiv.org/abs/2009.03432v1
- Date: Mon, 7 Sep 2020 21:19:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-21 02:29:12.467854
- Title: Is Everything Fine, Grandma? Acoustic and Linguistic Modeling for Robust
Elderly Speech Emotion Recognition
- Title(参考訳): おばあちゃん、大丈夫?
頑健な高齢者感情認識のための音響・言語モデル
- Authors: Gizem So\u{g}anc{\i}o\u{g}lu, Oxana Verkholyak, Heysem Kaya, Dmitrii
Fedotov, Tobias Cad\`ee, Albert Ali Salah, Alexey Karpov
- Abstract要約: 本稿では,InterSPEECH 2020 Computational Paralinguistics Challenge (ComParE) への貢献について述べる。
本稿では,これらのタスクを最先端の音響的特徴と言語的特徴を用いてモデル化するバイモーダル・フレームワークを提案する。
本研究では,タスク固有の辞書やリソースを活用すれば,言語モデルの性能が向上することを示す。
- 参考スコア(独自算出の注目度): 7.579298439023323
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Acoustic and linguistic analysis for elderly emotion recognition is an
under-studied and challenging research direction, but essential for the
creation of digital assistants for the elderly, as well as unobtrusive
telemonitoring of elderly in their residences for mental healthcare purposes.
This paper presents our contribution to the INTERSPEECH 2020 Computational
Paralinguistics Challenge (ComParE) - Elderly Emotion Sub-Challenge, which is
comprised of two ternary classification tasks for arousal and valence
recognition. We propose a bi-modal framework, where these tasks are modeled
using state-of-the-art acoustic and linguistic features, respectively. In this
study, we demonstrate that exploiting task-specific dictionaries and resources
can boost the performance of linguistic models, when the amount of labeled data
is small. Observing a high mismatch between development and test set
performances of various models, we also propose alternative training and
decision fusion strategies to better estimate and improve the generalization
performance.
- Abstract(参考訳): 高齢者の感情認識のための音響的・言語的分析は、未研究かつ困難な研究の方向性であるが、高齢者のためのデジタルアシスタントの作成には不可欠である。
本稿は,覚醒度と原子価の認識のための3段階の分類タスクからなる,InterSPEECH 2020 Computational Paralinguistics Challenge (ComParE) への貢献について述べる。
そこで本稿では,これらの課題を音響的特徴と言語的特徴を用いてモデル化するバイモーダル・フレームワークを提案する。
本研究では,ラベル付きデータの量が小さい場合,タスク固有の辞書や資源の利用によって言語モデルの性能が向上することを示す。
また,様々なモデルの開発とテストセットのパフォーマンスの高いミスマッチを観察し,一般化性能を推定し改善するための代替訓練と意思決定の融合戦略を提案する。
関連論文リスト
- Identification of Cognitive Decline from Spoken Language through Feature
Selection and the Bag of Acoustic Words Model [0.0]
記憶障害の症状の早期発見は、集団の健康確保に重要な役割を担っている。
臨床環境における標準化された音声テストの欠如は、自然音声言語を解析するための自動機械学習技術の開発にますます重点を置いている。
この研究は特徴選択に関するアプローチを示し、ジュネーブの最小音響パラメータセットと相対音声停止から診断に必要な重要な特徴を自動的に選択することを可能にする。
論文 参考訳(メタデータ) (2024-02-02T17:06:03Z) - BabySLM: language-acquisition-friendly benchmark of self-supervised
spoken language models [56.93604813379634]
音声表現を学習するための自己指導技術は、人間のラベルを必要とせずに、音声への露出から言語能力を高めることが示されている。
語彙および構文レベルで音声言語モデルを探索するために,言語習得に親しみやすいベンチマークを提案する。
テキストと音声のギャップを埋めることと、クリーンな音声とその内話のギャップを埋めることである。
論文 参考訳(メタデータ) (2023-06-02T12:54:38Z) - A Hierarchical Regression Chain Framework for Affective Vocal Burst
Recognition [72.36055502078193]
本稿では,声帯からの感情認識のための連鎖回帰モデルに基づく階層的枠組みを提案する。
データスパシティの課題に対処するため、レイヤワイドおよび時間アグリゲーションモジュールを備えた自己教師付き学習(SSL)表現も使用しています。
提案されたシステムは、ACII Affective Vocal Burst (A-VB) Challenge 2022に参加し、「TWO」および「CULTURE」タスクで第1位となった。
論文 参考訳(メタデータ) (2023-03-14T16:08:45Z) - Leveraging Pretrained Representations with Task-related Keywords for
Alzheimer's Disease Detection [69.53626024091076]
アルツハイマー病(AD)は高齢者に特に顕著である。
事前学習モデルの最近の進歩は、AD検出モデリングを低レベル特徴から高レベル表現にシフトさせる動機付けとなっている。
本稿では,高レベルの音響・言語的特徴から,より優れたAD関連手がかりを抽出する,いくつかの効率的な手法を提案する。
論文 参考訳(メタデータ) (2023-03-14T16:03:28Z) - Sentiment recognition of Italian elderly through domain adaptation on
cross-corpus speech dataset [77.99182201815763]
本研究の目的は、イタリアの高齢者の自然な会話において、肯定的、中立的、否定的な感情を認識することができる音声感情認識(SER)モデルを定義することである。
論文 参考訳(メタデータ) (2022-11-14T12:39:41Z) - Acoustic-Linguistic Features for Modeling Neurological Task Score in
Alzheimer's [1.290382979353427]
自然言語処理と機械学習はアルツハイマー病を確実に検出するための有望な技術を提供する。
我々は,10種類の線形回帰モデルの性能を比較し,比較した。
与えられたタスクに対して,手作りの言語的特徴は音響的特徴や学習的特徴よりも重要であることがわかった。
論文 参考訳(メタデータ) (2022-09-13T15:35:31Z) - Self-Supervised Speech Representation Learning: A Review [105.1545308184483]
自己教師付き表現学習法は、幅広いタスクやドメインに利益をもたらす単一の普遍的モデルを約束する。
音声表現学習は、生成的、コントラスト的、予測的という3つの主要なカテゴリで同様の進歩を経験している。
本稿では,自己指導型音声表現学習のアプローチと,他の研究領域との関係について述べる。
論文 参考訳(メタデータ) (2022-05-21T16:52:57Z) - Automated Speech Scoring System Under The Lens: Evaluating and
interpreting the linguistic cues for language proficiency [26.70127591966917]
従来の機械学習モデルを用いて、音声認識タスクを分類と回帰問題の両方として定式化する。
まず,5つのカテゴリー(頻度,発音,内容,文法,語彙,音響)で言語学の特徴を抽出し,応答を学習する。
比較すると,回帰に基づくモデルでは,分類法と同等かそれ以上の性能があることがわかった。
論文 参考訳(メタデータ) (2021-11-30T06:28:58Z) - Alzheimer's Dementia Recognition through Spontaneous Speech: The ADReSS
Challenge [10.497861245133086]
InterSPEECH 2020のADReSS Challengeでは、アルツハイマー認知症の自動認識に対する異なるアプローチを比較可能な共有タスクを定義している。
ADReSSは、年齢と性別の面で音響的に前処理されバランスが取れた、ベンチマーク音声データセットを研究者に提供する。
論文 参考訳(メタデータ) (2020-04-14T23:25:09Z) - Speech Enhancement using Self-Adaptation and Multi-Head Self-Attention [70.82604384963679]
本稿では,補助的話者認識機能を用いた音声強調のための自己適応手法について検討する。
テスト発話から直接適応に用いる話者表現を抽出する。
論文 参考訳(メタデータ) (2020-02-14T05:05:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。