論文の概要: Detecting the Severity of Major Depressive Disorder from Speech: A Novel
HARD-Training Methodology
- arxiv url: http://arxiv.org/abs/2206.01542v2
- Date: Thu, 25 May 2023 17:24:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-27 00:15:56.456168
- Title: Detecting the Severity of Major Depressive Disorder from Speech: A Novel
HARD-Training Methodology
- Title(参考訳): 音声から大うつ病の重症度を検出する:新しいハード・トレーニング法
- Authors: Edward L. Campbell, Judith Dineley, Pauline Conde, Faith Matcham,
Femke Lamers, Sara Siddi, Laura Docio-Fernandez, Carmen Garcia-Mateo,
Nicholas Cummins and the RADAR-CNS Consortium
- Abstract要約: メジャー・うつ病(Major Depressive Disorder、MDD)は、社会経済的コストの高い世界的メンタルヘルス問題である。
したがって、MDDの予測と自動検出は社会に大きな影響を与える可能性がある。
RADAR-MDDは、音声やその他のデジタルバイオマーカーを収集する観察コホート研究である。
- 参考スコア(独自算出の注目度): 8.832823703632073
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Major Depressive Disorder (MDD) is a common worldwide mental health issue
with high associated socioeconomic costs. The prediction and automatic
detection of MDD can, therefore, make a huge impact on society. Speech, as a
non-invasive, easy to collect signal, is a promising marker to aid the
diagnosis and assessment of MDD. In this regard, speech samples were collected
as part of the Remote Assessment of Disease and Relapse in Major Depressive
Disorder (RADAR-MDD) research programme. RADAR-MDD was an observational cohort
study in which speech and other digital biomarkers were collected from a cohort
of individuals with a history of MDD in Spain, United Kingdom and the
Netherlands. In this paper, the RADAR-MDD speech corpus was taken as an
experimental framework to test the efficacy of a Sequence-to-Sequence model
with a local attention mechanism in a two-class depression severity
classification paradigm. Additionally, a novel training method, HARD-Training,
is proposed. It is a methodology based on the selection of more ambiguous
samples for the model training, and inspired by the curriculum learning
paradigm. HARD-Training was found to consistently improve - with an average
increment of 8.6% - the performance of our classifiers for both of two speech
elicitation tasks used and each collection site of the RADAR-MDD speech corpus.
With this novel methodology, our Sequence-to-Sequence model was able to
effectively detect MDD severity regardless of language. Finally, recognising
the need for greater awareness of potential algorithmic bias, we conduct an
additional analysis of our results separately for each gender.
- Abstract(参考訳): メジャー・うつ病(Major Depressive Disorder、MDD)は、社会経済的コストの高い世界的メンタルヘルス問題である。
したがって、MDDの予測と自動検出は社会に大きな影響を与える可能性がある。
非侵襲的で信号の収集が容易な音声は、MDDの診断と評価に役立つ有望なマーカーである。
この観点からは,大うつ病(radar-mdd)研究プログラムにおける遠隔診断の一環として,音声サンプルを収集した。
RADAR-MDDは、スペイン、イギリス、オランダにおけるMDDの歴史を持つ個人のコホートから、スピーチやその他のデジタルバイオマーカーを収集する観察的コホート研究である。
本稿では, RAAR-MDD音声コーパスを, 局所的な注意機構を持つシーケンス・ツー・シーケンスモデルの有効性を, 2階層の抑うつ重度分類パラダイムで検証するための実験的枠組みとして用いた。
また,新しいトレーニング手法であるHARD-Trainingを提案する。
モデル学習のためのより曖昧なサンプルの選択に基づく方法論であり、カリキュラム学習パラダイムに触発されたものである。
HARD-Training は平均 8.6% の増分で連続的に改善し,使用する2つの音声誘発タスクと RADAR-MDD 音声コーパスの各収集部位の分類器の性能が向上した。
本手法では, 言語によらずMDDの重大度を効果的に検出することができた。
最後に,潜在的なアルゴリズムバイアスに対する意識を高める必要性を認識し,性別別に結果のさらなる分析を行う。
関連論文リスト
- Towards Within-Class Variation in Alzheimer's Disease Detection from Spontaneous Speech [60.08015780474457]
アルツハイマー病(AD)の検出は、機械学習の分類モデルを使用する有望な研究領域として浮上している。
我々は、AD検出において、クラス内変異が重要な課題であると考え、ADを持つ個人は認知障害のスペクトルを示す。
本稿では,ソフトターゲット蒸留 (SoTD) とインスタンスレベルの再分散 (InRe) の2つの新しい手法を提案する。
論文 参考訳(メタデータ) (2024-09-22T02:06:05Z) - DenseNet and Support Vector Machine classifications of major depressive
disorder using vertex-wise cortical features [2.29023553248714]
大うつ病 (Major depressive disorder, MDD) は、世界中の数億の個人に影響を及ぼす複雑な精神疾患である。
ディープラーニングツールのニューロイメージングデータへの応用は、MDDの診断および予測バイオマーカーを提供する可能性がある。
MDD患者と健康管理 (HC) を線形機械学習による分節的大脳皮質の特徴に基づいて解離させる試みは, 精度が低いことが報告されている。
論文 参考訳(メタデータ) (2023-11-18T11:46:25Z) - Phonological Level wav2vec2-based Mispronunciation Detection and
Diagnosis Method [11.069975459609829]
音声特徴量検出に基づく低レベルの誤認識検出と診断(MDD)手法を提案する。
提案手法は,母国語からの英語学習者から収集したL2音声コーパスに適用した。
論文 参考訳(メタデータ) (2023-11-13T02:41:41Z) - Leveraging Pretrained Representations with Task-related Keywords for
Alzheimer's Disease Detection [69.53626024091076]
アルツハイマー病(AD)は高齢者に特に顕著である。
事前学習モデルの最近の進歩は、AD検出モデリングを低レベル特徴から高レベル表現にシフトさせる動機付けとなっている。
本稿では,高レベルの音響・言語的特徴から,より優れたAD関連手がかりを抽出する,いくつかの効率的な手法を提案する。
論文 参考訳(メタデータ) (2023-03-14T16:03:28Z) - Cross-lingual Alzheimer's Disease detection based on paralinguistic and
pre-trained features [6.928826160866143]
本稿ではICASSP-SPGC-2023 ADReSS-M Challenge Taskについて述べる。
この課題は、アルツハイマー病の予測のために、どの音響特徴を一般化し、言語間で伝達できるかを検討することである。
我々は、openSmileツールキットとXLSR-53を用いた音響特性を用いてパラ言語的特徴を抽出する。
本手法は分類タスクの69.6%の精度と回帰タスクの4.788の根平均二乗誤差(RMSE)を実現する。
論文 参考訳(メタデータ) (2023-03-14T06:34:18Z) - Patched Diffusion Models for Unsupervised Anomaly Detection in Brain MRI [55.78588835407174]
本稿では,正常脳解剖のパッチベース推定法として拡散モデルの生成タスクを再構築する手法を提案する。
腫瘍と多発性硬化症について検討し,既存のベースラインと比較して25.1%の改善がみられた。
論文 参考訳(メタデータ) (2023-03-07T09:40:22Z) - Semantic Coherence Markers for the Early Diagnosis of the Alzheimer
Disease [0.0]
パープレキシティはもともと、与えられた言語モデルがテキストシーケンスを予測するのにどの程度適しているかを評価するための情報理論の尺度として考え出された。
我々は2グラムから5グラムまでのN-gramとトランスフォーマーベース言語モデルであるGPT-2を多種多様な言語モデルに適用した。
ベストパフォーマンスモデルでは、ADクラスと制御対象の両方から対象を分類する際に、完全精度とFスコア(精度/特異度とリコール/感度のそれぞれ1.00)を達成した。
論文 参考訳(メタデータ) (2023-02-02T11:40:16Z) - Ontology-aware Learning and Evaluation for Audio Tagging [56.59107110017436]
平均平均精度(mAP)は、異なる種類の音をそれらの関係を考慮せずに独立したクラスとして扱う。
オントロジー認識平均平均精度(OmAP)は、評価中にAudioSetオントロジー情報を利用することで、mAPの弱点に対処する。
我々は人間の評価を行い、OmAPはmAPよりも人間の知覚と一致していることを示した。
論文 参考訳(メタデータ) (2022-11-22T11:35:14Z) - Multi-modal fusion with gating using audio, lexical and disfluency
features for Alzheimer's Dementia recognition from spontaneous speech [11.34426502082293]
本論文は、自発音声(ADReSS)によるアルツハイマー認知症への挑戦である。
本研究の目的は、音声データからアルツハイマー病の重症度の自動予測を支援する方法を開発することである。
論文 参考訳(メタデータ) (2021-06-17T17:20:57Z) - NUVA: A Naming Utterance Verifier for Aphasia Treatment [49.114436579008476]
失語症(PWA)患者の治療介入に対する反応の診断とモニタリングの両立のための画像命名タスクを用いた音声性能評価
本稿では,失語症脳卒中患者の「正しい」と「正しくない」を分類する深層学習要素を組み込んだ発話検証システムであるNUVAについて述べる。
イギリス系英語8ヶ国語でのテストでは、システムの性能精度は83.6%から93.6%の範囲であり、10倍のクロスバリデーション平均は89.5%であった。
論文 参考訳(メタデータ) (2021-02-10T13:00:29Z) - Detecting Parkinsonian Tremor from IMU Data Collected In-The-Wild using
Deep Multiple-Instance Learning [59.74684475991192]
パーキンソン病(英: Parkinson's Disease、PD)は、60歳以上の人口の約1%に影響を与える徐々に進化する神経学的疾患である。
PD症状には、震動、剛性、ブレイキネジアがある。
本稿では,スマートフォン端末から受信したIMU信号に基づいて,PDに関連するトレモラスなエピソードを自動的に識別する手法を提案する。
論文 参考訳(メタデータ) (2020-05-06T09:02:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。