論文の概要: Exploration of Perceptual Speech Features for Clinical Decision-Support in Mental Health Care
- arxiv url: http://arxiv.org/abs/2605.24678v2
- Date: Wed, 27 May 2026 14:37:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:54.971996
- Title: Exploration of Perceptual Speech Features for Clinical Decision-Support in Mental Health Care
- Title(参考訳): 臨床診断のための知覚的音声特徴の探索-メンタルヘルスにおける課題-
- Authors: Vassilis Lyberatos, Edmund G. Dervakos, Eleni Adamidi, Athanasios Voulodimos, Giorgos Stamou,
- Abstract要約: 本稿では,音響的特徴と言語的特徴を利用したシステム的特徴量分析フレームワークを提案する。
抑うつ,不安,ADHDの症状と音声特徴との関連について検討した。
- 参考スコア(独自算出の注目度): 9.076849209532414
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Speech and language technologies offer valuable opportunities for supporting mental health assessment through objective and interpretable cues. We present a systematic feature-based analysis framework leveraging perceptually grounded acoustic and linguistic characteristics, including prosody, vocal quality, semantic coherence, syntactic structure, and sarcasm. Using statistical analysis and interpretable machine learning (XGBoost with SHAP and LIME), we examine associations between speech features and validated symptom measures of depression, anxiety, and ADHD. Evaluated on both controlled benchmark datasets (StressID, DAIC-WOZ, Androids, EATD) and a real-world clinical dataset, the framework reveals stable and consistent relationships between symptom severity and vocal irregularities (e.g., shimmer, jitter), lexical-syntactic patterns, and affective tone. An ablation study conducted across all datasets further identifies the most informative feature groups. This work explores a transparent and clinically interpretable approach to speech-based mental health analysis.
- Abstract(参考訳): 音声と言語技術は客観的かつ解釈可能な手段を通じてメンタルヘルスアセスメントを支援する貴重な機会を提供する。
本稿では, 韻律, 声質, 意味的一貫性, 構文構造, 皮肉など, 知覚的基盤を持つ音響的・言語的特徴を利用した特徴量分析フレームワークを提案する。
統計的解析と解釈可能な機械学習(XGBoost with SHAP and LIME)を用いて,抑うつ,不安,ADHDの症状と音声特徴との関連性を検討した。
コントロールされたベンチマークデータセット(StressID、DAIC-WOZ、Androids、EATD)と実際の臨床データセットの両方に基づいて、このフレームワークは症状の重症度と発声の不規則性(例えば、シマー、ジッター)、語彙とシンタクティックパターン、感情のトーンの間の安定的で一貫性のある関係を明らかにする。
すべてのデータセットを対象としたアブレーション調査では、最も情報に富む特徴群がさらに特定される。
本研究は、音声に基づくメンタルヘルス分析に対する透明で臨床的に解釈可能なアプローチを探求する。
関連論文リスト
- A multimodal Bayesian Network for symptom-level depression and anxiety prediction from voice and speech data [36.77792803657935]
ベイジアン・ネットワーク・モデリングを用いて,導入におけるいくつかの重要な障壁に対処できることを論じる。
大規模データセットにおける音声・音声特徴からの抑うつ・不安症状予測モデルの評価を行った。
論文 参考訳(メタデータ) (2025-12-08T17:28:09Z) - Quantifying Articulatory Coordination as a Biomarker for Schizophrenia [3.9389809100079614]
統合失調症 (Schizophrenia) は、言語障害や社会的離脱など多様な症状を持つ複雑な疾患である。
本稿では,声道協調の定量化に音声特徴を利用した解釈可能なフレームワークを提案する。
このアプローチは、統合失調症に対する透明で重症度に敏感なバイオマーカーを提供し、臨床的に解釈可能な音声ベースのアセスメントツールの可能性を推し進める。
論文 参考訳(メタデータ) (2025-11-05T00:19:05Z) - Interpretable Neuropsychiatric Diagnosis via Concept-Guided Graph Neural Networks [56.75602443936853]
青少年の5人に1人は、不安、うつ病、行動障害などの精神状態または行動の健康状態と診断されている。
従来の研究では、障害予測にグラフニューラルネットワーク(GNN)アプローチを使用していたが、ブラックボックスのままであり、信頼性と臨床翻訳を制限している。
本研究では,解釈可能な機能接続の概念を符号化する概念に基づく診断フレームワークを提案する。
我々の設計は臨床的に意味のある接続パターンを通じて予測を保証し、解釈可能性と強い予測性能の両方を可能にする。
論文 参考訳(メタデータ) (2025-10-02T19:38:46Z) - A Comprehensive Review of Datasets for Clinical Mental Health AI Systems [55.67299586253951]
本稿では,AIを活用した臨床アシスタントの訓練・開発に関連する臨床精神保健データセットの総合的調査を行う。
本調査では, 縦断データの欠如, 文化・言語表現の制限, 一貫性のない収集・注釈基準, 合成データのモダリティの欠如など, 重要なギャップを明らかにした。
論文 参考訳(メタデータ) (2025-08-13T13:42:35Z) - MoodAngels: A Retrieval-augmented Multi-agent Framework for Psychiatry Diagnosis [58.67342568632529]
MoodAngelsは、気分障害の診断のための最初の特殊なマルチエージェントフレームワークである。
MoodSynは、合成精神医学の1,173件のオープンソースデータセットである。
論文 参考訳(メタデータ) (2025-06-04T09:18:25Z) - Detecting Neurocognitive Disorders through Analyses of Topic Evolution and Cross-modal Consistency in Visual-Stimulated Narratives [83.15653194899126]
神経認知障害(NCD)の早期発見は、時間的介入と疾患管理に不可欠である。
現在のVSNベースのNCD検出法は主にボトムアップ、刺激駆動認知プロセスと密接に結びついている言語マイクロ構造に焦点を当てている。
本稿では,話題の時間的変化を追跡する動的トピックモデル(DTM)と,物語と視覚刺激の相互整合性を測定するテキスト画像時間アライメントネットワーク(TITAN)の2つの新しいマクロ構造手法を提案する。
論文 参考訳(メタデータ) (2025-01-07T12:16:26Z) - A Tutorial on Clinical Speech AI Development: From Data Collection to Model Validation [19.367198670893778]
本稿では,臨床音声AIの堅牢な開発に必要な要素について概説する。
目的は、入力と出力がより解釈可能で臨床的に意味のある音声の側面にリンクするモデルの構築に関する包括的なガイダンスを提供することである。
論文 参考訳(メタデータ) (2024-10-29T00:58:15Z) - Exploring Speech Pattern Disorders in Autism using Machine Learning [12.469348589699766]
本研究は, 被験者と患者との対話の分析を通じて, 独特の音声パターンを識別するための包括的アプローチを提案する。
我々は,40の音声関連特徴を抽出し,周波数,ゼロクロス速度,エネルギー,スペクトル特性,メル周波数ケプストラル係数(MFCC),バランスに分類した。
分類モデルはASDと非ASDを区別することを目的としており、精度は87.75%である。
論文 参考訳(メタデータ) (2024-05-03T02:59:15Z) - Identification of Cognitive Decline from Spoken Language through Feature
Selection and the Bag of Acoustic Words Model [0.0]
記憶障害の症状の早期発見は、集団の健康確保に重要な役割を担っている。
臨床環境における標準化された音声テストの欠如は、自然音声言語を解析するための自動機械学習技術の開発にますます重点を置いている。
この研究は特徴選択に関するアプローチを示し、ジュネーブの最小音響パラメータセットと相対音声停止から診断に必要な重要な特徴を自動的に選択することを可能にする。
論文 参考訳(メタデータ) (2024-02-02T17:06:03Z) - Pose-based Body Language Recognition for Emotion and Psychiatric Symptom
Interpretation [75.3147962600095]
通常のRGBビデオから始まるボディーランゲージに基づく感情認識のための自動フレームワークを提案する。
心理学者との連携により,精神症状予測の枠組みを拡張した。
提案されたフレームワークの特定のアプリケーションドメインは限られた量のデータしか供給しないため、フレームワークは小さなトレーニングセットで動作するように設計されている。
論文 参考訳(メタデータ) (2020-10-30T18:45:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。