論文の概要: A multimodal Bayesian Network for symptom-level depression and anxiety prediction from voice and speech data
- arxiv url: http://arxiv.org/abs/2512.07741v1
- Date: Mon, 08 Dec 2025 17:28:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-09 22:03:54.982039
- Title: A multimodal Bayesian Network for symptom-level depression and anxiety prediction from voice and speech data
- Title(参考訳): 声・音声データからの症状レベル抑うつ・不安予測のためのマルチモーダルベイズネットワーク
- Authors: Agnes Norbury, George Fairs, Alexandra L. Georgescu, Matthew M. Nour, Emilia Molimpakis, Stefano Goria,
- Abstract要約: ベイジアン・ネットワーク・モデリングを用いて,導入におけるいくつかの重要な障壁に対処できることを論じる。
大規模データセットにおける音声・音声特徴からの抑うつ・不安症状予測モデルの評価を行った。
- 参考スコア(独自算出の注目度): 36.77792803657935
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: During psychiatric assessment, clinicians observe not only what patients report, but important nonverbal signs such as tone, speech rate, fluency, responsiveness, and body language. Weighing and integrating these different information sources is a challenging task and a good candidate for support by intelligence-driven tools - however this is yet to be realized in the clinic. Here, we argue that several important barriers to adoption can be addressed using Bayesian network modelling. To demonstrate this, we evaluate a model for depression and anxiety symptom prediction from voice and speech features in large-scale datasets (30,135 unique speakers). Alongside performance for conditions and symptoms (for depression, anxiety ROC-AUC=0.842,0.831 ECE=0.018,0.015; core individual symptom ROC-AUC>0.74), we assess demographic fairness and investigate integration across and redundancy between different input modality types. Clinical usefulness metrics and acceptability to mental health service users are explored. When provided with sufficiently rich and large-scale multimodal data streams and specified to represent common mental conditions at the symptom rather than disorder level, such models are a principled approach for building robust assessment support tools: providing clinically-relevant outputs in a transparent and explainable format that is directly amenable to expert clinical supervision.
- Abstract(参考訳): 精神医学的な評価において、臨床医は患者の報告だけでなく、声調、発話速度、流感、応答性、身体言語といった重要な非言語的な兆候も観察する。
これらの異なる情報ソースの優先順位付けと統合は難しい作業であり、インテリジェンス駆動のツールによるサポートのよい候補である。
ここではベイジアン・ネットワーク・モデリングを用いて,導入におけるいくつかの重要な障壁に対処できると論じる。
これを示すために,大規模データセット(30,135人のユニークな話者)における音声・音声特徴からの抑うつ・不安症状予測モデルの評価を行った。
ROC-AUC=0.842,0.831 ECE=0.018,0.015,コア個人症状 (ROC-AUC>0.74) の病態と症状の評価とともに, 異なる入力モードタイプ間の相互統合と冗長性について検討した。
精神保健サービス利用者に対する臨床的有用性指標と受容性について検討した。
十分にリッチで大規模なマルチモーダルなデータストリームが提供され、障害レベルよりも症状における一般的な精神状態を表現するように指定された場合、このようなモデルは、堅牢な評価支援ツールを構築するための原則化されたアプローチである。
関連論文リスト
- A Comprehensive Review of Datasets for Clinical Mental Health AI Systems [55.67299586253951]
本稿では,AIを活用した臨床アシスタントの訓練・開発に関連する臨床精神保健データセットの総合的調査を行う。
本調査では, 縦断データの欠如, 文化・言語表現の制限, 一貫性のない収集・注釈基準, 合成データのモダリティの欠如など, 重要なギャップを明らかにした。
論文 参考訳(メタデータ) (2025-08-13T13:42:35Z) - MoodAngels: A Retrieval-augmented Multi-agent Framework for Psychiatry Diagnosis [58.67342568632529]
MoodAngelsは、気分障害の診断のための最初の特殊なマルチエージェントフレームワークである。
MoodSynは、合成精神医学の1,173件のオープンソースデータセットである。
論文 参考訳(メタデータ) (2025-06-04T09:18:25Z) - Multimodal Biomarkers for Schizophrenia: Towards Individual Symptom Severity Estimation [4.599023238114995]
本研究は,マルチモーダルアプローチによる個々の症状推定に焦点を移す。
精度と重大性を改善するために,各モードに対する一様モデルとマルチモーダル・フレームワークを開発した。
論文 参考訳(メタデータ) (2025-05-21T21:55:35Z) - Uncertainty-aware Medical Diagnostic Phrase Identification and Grounding [72.18719355481052]
MRG(Messical Report Grounding)と呼ばれる新しい課題について紹介する。
MRGは医療報告から診断フレーズとその対応する接地箱を直接エンドツーエンドで識別することを目的としている。
マルチモーダルな大規模言語モデルを用いて診断フレーズを予測する,堅牢で信頼性の高いフレームワークである uMedGround を提案する。
論文 参考訳(メタデータ) (2024-04-10T07:41:35Z) - Identification of Cognitive Decline from Spoken Language through Feature
Selection and the Bag of Acoustic Words Model [0.0]
記憶障害の症状の早期発見は、集団の健康確保に重要な役割を担っている。
臨床環境における標準化された音声テストの欠如は、自然音声言語を解析するための自動機械学習技術の開発にますます重点を置いている。
この研究は特徴選択に関するアプローチを示し、ジュネーブの最小音響パラメータセットと相対音声停止から診断に必要な重要な特徴を自動的に選択することを可能にする。
論文 参考訳(メタデータ) (2024-02-02T17:06:03Z) - From Classification to Clinical Insights: Towards Analyzing and Reasoning About Mobile and Behavioral Health Data With Large Language Models [21.427976533706737]
我々は,多センサデータから臨床的に有用な知見を合成するために,大規模言語モデルを活用する新しいアプローチを採っている。
うつ病や不安などの症状とデータの傾向がどのように関連しているかを,LSMを用いて推論する思考促進手法の連鎖を構築した。
GPT-4のようなモデルでは数値データの75%を正確に参照しており、臨床参加者は、この手法を用いて自己追跡データを解釈することへの強い関心を表明している。
論文 参考訳(メタデータ) (2023-11-21T23:53:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。