論文の概要: Attention-Based Acoustic Feature Fusion Network for Depression Detection
- arxiv url: http://arxiv.org/abs/2308.12478v1
- Date: Thu, 24 Aug 2023 00:31:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-25 15:58:30.062493
- Title: Attention-Based Acoustic Feature Fusion Network for Depression Detection
- Title(参考訳): 抑うつ検出のための注意型音響特徴融合ネットワーク
- Authors: Xiao Xu, Yang Wang, Xinru Wei, Fei Wang, Xizhe Zhang
- Abstract要約: 抑うつ検出のためのアテンションベース音響特徴融合ネットワーク(ABAFnet)を提案する。
ABAFnetは、4つの異なる音響特徴を包括的ディープラーニングモデルに組み合わせ、多層的特徴を効果的に統合し、ブレンドする。
本稿では,これらの特徴を効果的に合成することにより,性能を向上する,遅延核融合のための新しい重量調整モジュールを提案する。
- 参考スコア(独自算出の注目度): 11.972591489278988
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Depression, a common mental disorder, significantly influences individuals
and imposes considerable societal impacts. The complexity and heterogeneity of
the disorder necessitate prompt and effective detection, which nonetheless,
poses a difficult challenge. This situation highlights an urgent requirement
for improved detection methods. Exploiting auditory data through advanced
machine learning paradigms presents promising research directions. Yet,
existing techniques mainly rely on single-dimensional feature models,
potentially neglecting the abundance of information hidden in various speech
characteristics. To rectify this, we present the novel Attention-Based Acoustic
Feature Fusion Network (ABAFnet) for depression detection. ABAFnet combines
four different acoustic features into a comprehensive deep learning model,
thereby effectively integrating and blending multi-tiered features. We present
a novel weight adjustment module for late fusion that boosts performance by
efficaciously synthesizing these features. The effectiveness of our approach is
confirmed via extensive validation on two clinical speech databases, CNRAC and
CS-NRAC, thereby outperforming previous methods in depression detection and
subtype classification. Further in-depth analysis confirms the key role of each
feature and highlights the importance of MFCCrelated features in speech-based
depression detection.
- Abstract(参考訳): 一般的な精神障害であるうつ病は、個人に大きな影響を与え、社会的な影響を与える。
障害の複雑さと多様性は、迅速かつ効果的な検出を必要とするが、それでも難しい課題となる。
この状況は、検出方法の改善に対する緊急の要求を強調している。
高度な機械学習パラダイムによる聴覚データの利用は、有望な研究の方向性を示す。
しかし、既存の技術は主に1次元の特徴モデルに依存しており、様々な音声特性に隠された情報の多さを無視する可能性がある。
そこで本研究では,抑うつ検出のための注意型音響特徴融合ネットワーク(abafnet)を提案する。
ABAFnetは、4つの異なる音響特徴を包括的ディープラーニングモデルに組み合わせ、多層的特徴を効果的に統合しブレンドする。
本稿では,これらの特徴を効果的に合成することにより,性能を向上させるための新しい重量調整モジュールを提案する。
提案手法の有効性は,CNRACとCS-NRACの2つの臨床音声データベースに対する広範な検証により確認され,うつ病検出法やサブタイプ分類法よりも優れていた。
さらに詳細な分析により、各特徴の重要な役割が確認され、音声による抑うつ検出におけるMFCC関連の特徴の重要性が強調される。
関連論文リスト
- Optimizing Skin Lesion Classification via Multimodal Data and Auxiliary
Task Integration [54.76511683427566]
本研究は, スマートフォンで撮影した画像と本質的な臨床および人口統計情報を統合することで, 皮膚病変を分類する新しいマルチモーダル手法を提案する。
この手法の特徴は、超高解像度画像予測に焦点を当てた補助的なタスクの統合である。
PAD-UFES20データセットを用いて,様々なディープラーニングアーキテクチャを用いて実験を行った。
論文 参考訳(メタデータ) (2024-02-16T05:16:20Z) - What to Remember: Self-Adaptive Continual Learning for Audio Deepfake
Detection [53.063161380423715]
既存の検出モデルは、既知のディープフェイク音声を識別することに成功したが、新しい攻撃タイプに遭遇する際には苦労している。
本稿では,Radian Weight Modification (RWM) と呼ばれる連続的な学習手法を提案する。
論文 参考訳(メタデータ) (2023-12-15T09:52:17Z) - A Discrepancy Aware Framework for Robust Anomaly Detection [51.710249807397695]
本稿では,DAF(Disdisrepancy Aware Framework)を提案する。
本手法は,デコーダの欠陥同定に外見に依存しないキューを利用して,その合成外観への依存を緩和する。
単純な合成戦略の下では,既存の手法を大きなマージンで上回り,また,最先端のローカライゼーション性能も達成している。
論文 参考訳(メタデータ) (2023-10-11T15:21:40Z) - On the Onset of Robust Overfitting in Adversarial Training [66.27055915739331]
Adversarial Training (AT)は、堅牢なニューラルネットワークを構築するために広く使われているアルゴリズムである。
ATは、堅牢なオーバーフィッティングの問題に悩まされているが、その基本的なメカニズムはまだ不明だ。
論文 参考訳(メタデータ) (2023-10-01T07:57:03Z) - DEPAC: a Corpus for Depression and Anxiety Detection from Speech [3.2154432166999465]
本稿では、うつ病と不安スクリーニングツールの確立したしきい値に基づいてラベル付けされた、心的苦痛分析オーディオデータセットDEPACを紹介する。
この大きなデータセットは、個人ごとの複数の音声タスクと、関連する人口統計情報から構成される。
人間の音声における精神疾患の徴候の同定に有効な,手作業による音響的特徴と言語的特徴からなる特徴セットを提案する。
論文 参考訳(メタデータ) (2023-06-20T12:21:06Z) - Multi-resolution Spatiotemporal Enhanced Transformer Denoising with
Functional Diffusive GANs for Constructing Brain Effective Connectivity in
MCI analysis [46.04319515616324]
効果的な接続性は、脳領域間の因果パターンを記述することができる。
これらのパターンは、病態のメカニズムを明らかにし、早期診断と認知疾患に対する効果的な薬物開発を促進する可能性がある。
本稿では,機能的磁気共鳴画像(fMRI)を軽度認知障害(MCI)解析に有効な接続性に変換するために,新しいマルチレゾリューションStemporal Enhanced Transformer Denoising Networkを提案する。
論文 参考訳(メタデータ) (2023-05-18T06:54:56Z) - Leveraging Pretrained Representations with Task-related Keywords for
Alzheimer's Disease Detection [69.53626024091076]
アルツハイマー病(AD)は高齢者に特に顕著である。
事前学習モデルの最近の進歩は、AD検出モデリングを低レベル特徴から高レベル表現にシフトさせる動機付けとなっている。
本稿では,高レベルの音響・言語的特徴から,より優れたAD関連手がかりを抽出する,いくつかの効率的な手法を提案する。
論文 参考訳(メタデータ) (2023-03-14T16:03:28Z) - Automatic Depression Detection via Learning and Fusing Features from
Visual Cues [42.71590961896457]
本稿では,視覚的手がかりから特徴を学習し,融合させることにより,新しい自動抑うつ検出法を提案する。
本手法は,DAIC_WOZデータセット上での最先端性能を,他の視覚的特徴に基づく手法と比較して達成する。
論文 参考訳(メタデータ) (2022-03-01T09:28:12Z) - Alzheimer's Dementia Recognition Using Acoustic, Lexical, Disfluency and
Speech Pause Features Robust to Noisy Inputs [11.34426502082293]
本稿では, 話者がアルツハイマー病を患っているか否かを分類するために, ASR で書き起こされた音声と音響データを同時に消費する2つの多モード融合型深層学習モデルを提案する。
我々の最良モデルである、単語、単語確率、拡散特性、ポーズ情報、および様々な音響特徴を用いたハイウェイ層付きBiLSTMは、MMSE認知スコアに対して84%の精度とRSME誤差予測を4.26の精度で達成する。
論文 参考訳(メタデータ) (2021-06-29T19:24:29Z) - Multimodal Depression Severity Prediction from medical bio-markers using
Machine Learning Tools and Technologies [0.0]
うつ病は世界中の精神疾患の主要な原因となっている。
近年,うつ病の診断とステージ予測の自動化に行動的手がかりが用いられている。
ラベル付き行動データセットの欠如と、膨大な量のバリエーションが、タスクを達成する上で大きな課題であることが証明されている。
論文 参考訳(メタデータ) (2020-09-11T20:44:28Z) - Audio Impairment Recognition Using a Correlation-Based Feature
Representation [85.08880949780894]
本稿では,特徴対の相関に基づく手作り特徴の新しい表現を提案する。
実験段階において,コンパクトな特徴次元と計算速度の向上の観点から,優れた性能を示す。
論文 参考訳(メタデータ) (2020-03-22T13:34:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。