論文の概要: Recurrence-Based Nonlinear Vocal Dynamics as Digital Biomarkers for Depression Detection from Conversational Speech
- arxiv url: http://arxiv.org/abs/2604.26242v1
- Date: Wed, 29 Apr 2026 02:51:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-30 15:59:36.231867
- Title: Recurrence-Based Nonlinear Vocal Dynamics as Digital Biomarkers for Depression Detection from Conversational Speech
- Title(参考訳): 会話音声からの抑うつ検出のためのディジタルバイオマーカーとしての残響に基づく非線形音声ダイナミクス
- Authors: Himadri S Samanta,
- Abstract要約: 我々は,抑うつは声道系における再発構造の変化と関連していると仮定した。
74の声道チャネルから再発に基づくバイオマーカーを抽出した。
以上の結果から,抑うつは声道動態の変化によって特徴づけられる可能性が示唆された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Digital biomarkers for depression have largely relied on static acoustic descriptors, pooled summary statistics, or conventional machine learning representations. Such approaches may miss nonlinear temporal organization embedded in conversational vocal dynamics. We hypothesized that depression is associated with altered recurrence structure in vocal state trajectories, reflecting changes in how the vocal system revisits acoustic states over time. Using the depression subset of the DAIC-WOZ corpus with 142 labeled participants, we modeled frame-level COVAREP trajectories as nonlinear dynamical systems and derived recurrence-based biomarkers from 74 vocal channels. Logistic regression with feature selection and stratified cross-validation evaluated classification performance. Recurrence-based biomarkers achieved a mean cross-validated AUC of 0.689, exceeding static acoustic baselines, entropy-dynamics features, Hurst exponent features, determinism features, and Lyapunov-like instability proxies. Permutation testing indicated statistical significance with $p=0.004$. Pooled cross-validated predictions yielded AUC 0.665 with a 95\% bootstrap confidence interval of [0.568, 0.758]. These findings suggest that depression may be characterized by altered recurrence structure in conversational vocal dynamics and support nonlinear state-space analysis as a promising direction for digital psychiatric biomarkers.
- Abstract(参考訳): うつ病のデジタルバイオマーカーは、静的音響記述子、プール化された要約統計、あるいは従来の機械学習表現に大きく依存している。
このようなアプローチは、会話音声力学に埋め込まれた非線形時間的組織を見逃す可能性がある。
我々は,抑うつは声道系における再発構造の変化と関連し,声道系が時間の経過とともに音響的状態を再考する方法の変化を反映していると仮定した。
142名の被験者によるDAIC-WOZコーパスの抑うつサブセットを用いて, フレームレベルのCOVAREPトラジェクトリを非線形力学系, 74名の声道からの再発に基づくバイオマーカーとしてモデル化した。
特徴選択によるロジスティック回帰と階層化クロスバリデーションによる分類性能の評価
再帰性に基づくバイオマーカーは平均値0.689のAUCを達成し、静的音響ベースライン、エントロピー力学特性、ハースト指数特性、決定性特性、リャプノフのような不安定性プロキシを超越した。
置換試験では,$p=0.004$で統計的に有意な値を示した。
AUC 0.665は[0.568, 0.758]の95%のブートストラップ信頼区間を持つ。
以上の結果から,抑うつは会話音声力学における再帰構造の変化を特徴とし,非線型状態空間解析をデジタル精神科バイオマーカーの有望な方向としてサポートしていることが示唆された。
関連論文リスト
- Predicting Neuromodulation Outcome for Parkinson's Disease with Generative Virtual Brain Model [95.41752463487008]
パーキンソン病は世界中で1千万人以上に影響している。
個人間変異は経験的治療の選択を制限し、非無視的な外科的リスクとコストを増大させる。
我々は、このギャップをトレーニング済みのファインタニングフレームワークで埋めて、静止状態fMRIから直接結果を予測する。
論文 参考訳(メタデータ) (2026-03-31T02:36:10Z) - Impact of automatic speech recognition quality on Alzheimer's disease detection from spontaneous speech: a reproducible benchmark study with lexical modeling and statistical validation [0.0]
自然発声からアルツハイマー病を早期に検出することは、有望な非侵襲的スクリーニングアプローチとして現れている。
本稿では,ADReSSo 2021 診断データセット上でWhisper ASR 転写産物から得られた語彙的特徴を用いたアルツハイマー病の検出について検討した。
Whisper-based transcripts でトレーニングされたモデルは、Linear SVM で 0.7850 以上のバランスの取れた精度を達成するため、一貫してWhisper-base transcripts よりも優れていた。
論文 参考訳(メタデータ) (2026-03-18T19:46:29Z) - Huntington Disease Automatic Speech Recognition with Biomarker Supervision [9.152892112388708]
エンドツーエンドのASR訓練に使用しなかった高忠実度臨床音声コーパスを用いた体系的HD-ASR研究を行った。
We compare multiple ASR family under a unified evaluation, analysis as the WER as also as substitution, deletion, and insert pattern。
HD音声はアーキテクチャ固有のエラーシステマを誘導し、Parakeet-TDTはエンコーダデコーダとCTCベースラインを上回ります。
論文 参考訳(メタデータ) (2026-03-11T18:00:02Z) - Suppressing Prior-Comparison Hallucinations in Radiology Report Generation via Semantically Decoupled Latent Steering [94.37535002230504]
本研究では,Semantically Decoupled Latent Steeringと呼ばれる学習自由な推論時間制御フレームワークを開発した。
提案手法は,大言語モデル (LLM) による意味分解による意味のない介入ベクトルを構築する。
本手法は歴史的幻覚の可能性を著しく低下させることを示す。
論文 参考訳(メタデータ) (2026-02-27T04:49:01Z) - DepFlow: Disentangled Speech Generation to Mitigate Semantic Bias in Depression Detection [54.209716321122194]
抑うつ条件付きテキスト音声合成フレームワークであるDepFlowについて述べる。
抑うつ音響カモフラージュは、対向訓練を通じて話者と内容不変の抑うつ埋め込みを学習する。
フローマッチングTTSモデルとFiLM変調はこれらの埋め込みを合成に注入し、うつ病の重症度を制御する。
プロトタイプベースの重度マッピング機構は、うつ病連続体を滑らかかつ解釈可能な操作を提供する。
論文 参考訳(メタデータ) (2026-01-01T10:44:38Z) - Temporal-Aware Iterative Speech Model for Dementia Detection [0.0]
音声を用いた認知症自動検出の現在の手法は,静的,時間に依存しない特徴や集約された言語コンテンツに依存している。
本稿では,認知症検出のための自然発話を動的にモデル化するテンポラル・アウェア・イテレーティブ・フレームワークであるTAI-Speechを紹介する。
私たちの研究は、より柔軟で堅牢な認知評価ソリューションを提供し、生のオーディオのダイナミクスを直接操作します。
論文 参考訳(メタデータ) (2025-09-26T01:56:07Z) - Reading Between the Lines: Combining Pause Dynamics and Semantic Coherence for Automated Assessment of Thought Disorder [8.239710313549466]
本研究では,ポーズ機能と3つのデータセット間のセマンティックコヒーレンスメトリクスを統合する。
重要な発見は、停止機能だけで形式的思考障害(FTD)の重症度を確実に予測できることである。
これらの結果から,時間的分析と意味的分析を組み合わせたフレームワークが,非編成音声の評価を洗練するためのロードマップを提供する可能性が示唆された。
論文 参考訳(メタデータ) (2025-07-17T22:00:16Z) - Microelectrode Signal Dynamics as Biomarkers of Subthalamic Nucleus Entry on Deep Brain Stimulation: A Nonlinear Feature Approach [0.0]
本稿では、非線形力学とエントロピーに基づくメトリクスを利用して、STN内外から記録された神経活動の分類を行うフレームワークを提案する。
本研究は,DBS手術中におけるリアルタイム・データ駆動意思決定支援における非線形・エントロピー信号記述子の可能性を明らかにするものである。
論文 参考訳(メタデータ) (2025-06-14T23:23:26Z) - Simulation-based Inference for Cardiovascular Models [43.55219268578912]
シミュレーションに基づく推論を用いて、波形をプラプシブルな生理的パラメータにマッピングする逆問題を解決する。
臨床応用5種類のバイオマーカーのin-silico不確実性解析を行った。
我々はMIMIC-III波形データベースを用いて,ビビオとシリカのギャップについて検討した。
論文 参考訳(メタデータ) (2023-07-26T02:34:57Z) - Bulbar ALS Detection Based on Analysis of Voice Perturbation and Vibrato [68.97335984455059]
本研究の目的は,ALS患者の自動検出のための持続母音発声テストの有用性を検証することである。
そこで我々は,音声信号から測定値の計算に必要な基本周期への分離手順の強化を提案した。
論文 参考訳(メタデータ) (2020-03-24T12:49:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。