論文の概要: Speech as a Multimodal Digital Phenotype for Multi-Task LLM-based Mental Health Prediction
- arxiv url: http://arxiv.org/abs/2505.23822v1
- Date: Wed, 28 May 2025 04:07:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-02 19:47:52.538272
- Title: Speech as a Multimodal Digital Phenotype for Multi-Task LLM-based Mental Health Prediction
- Title(参考訳): マルチタスクLDMを用いたメンタルヘルス予測のためのマルチモーダルデジタル表現型としての音声
- Authors: Mai Ali, Christopher Lucasius, Tanmay P. Patel, Madison Aitken, Jacob Vorstman, Peter Szatmari, Marco Battaglia, Deepa Kundur,
- Abstract要約: うつ病検出のための3モーダルマルチメディアデータソースとして,患者音声データの処理を提案する。
提案手法は,抑うつ早期警戒データセットを用いて,3モーダル長手MLLを特徴とする手法である。
バランスの取れた精度は70.8%で、これは一方向、単一タスク、および非縦方向のそれぞれの方法よりも高い。
- 参考スコア(独自算出の注目度): 0.4517077427559345
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Speech is a noninvasive digital phenotype that can offer valuable insights into mental health conditions, but it is often treated as a single modality. In contrast, we propose the treatment of patient speech data as a trimodal multimedia data source for depression detection. This study explores the potential of large language model-based architectures for speech-based depression prediction in a multimodal regime that integrates speech-derived text, acoustic landmarks, and vocal biomarkers. Adolescent depression presents a significant challenge and is often comorbid with multiple disorders, such as suicidal ideation and sleep disturbances. This presents an additional opportunity to integrate multi-task learning (MTL) into our study by simultaneously predicting depression, suicidal ideation, and sleep disturbances using the multimodal formulation. We also propose a longitudinal analysis strategy that models temporal changes across multiple clinical interactions, allowing for a comprehensive understanding of the conditions' progression. Our proposed approach, featuring trimodal, longitudinal MTL is evaluated on the Depression Early Warning dataset. It achieves a balanced accuracy of 70.8%, which is higher than each of the unimodal, single-task, and non-longitudinal methods.
- Abstract(参考訳): 音声は非侵襲的なデジタル表現型であり、精神状態に関する貴重な洞察を与えることができるが、しばしば単一のモダリティとして扱われる。
対照的に、うつ病検出のための3モーダルマルチメディアデータソースとして、患者音声データの扱いを提案する。
本研究では,音声由来のテキスト,アコースティックランドマーク,および音声バイオマーカーを統合したマルチモーダルシステムにおいて,音声に基づく抑うつ予測のための大規模言語モデルに基づくアーキテクチャの可能性について検討する。
思春期うつ病は重大な課題を呈し、自殺観念や睡眠障害など、複数の障害を伴っていることが多い。
本研究は,マルチモーダル定式化を用いた抑うつ,自殺観念,睡眠障害を同時に予測することにより,マルチタスク学習(MTL)を本研究に統合する新たな機会を提供する。
また,複数の臨床的相互作用にまたがる時間変化をモデル化し,その進行状況を総合的に把握する縦断的分析戦略を提案する。
提案手法は,抑うつ早期警戒データセットを用いて,3モーダル長手MLLを特徴とする手法である。
バランスの取れた精度は70.8%で、これは一方向、単一タスク、および非縦方向のそれぞれの方法よりも高い。
関連論文リスト
- Generating Medically-Informed Explanations for Depression Detection using LLMs [1.325953054381901]
ソーシャルメディアデータからうつ病を早期に検出することは、タイムリーな介入の貴重な機会となる。
本稿では,LLM-MTD(Large Language Model for Multi-Task Depression Detection)を提案する。
論文 参考訳(メタデータ) (2025-03-18T19:23:22Z) - Structured Outputs Enable General-Purpose LLMs to be Medical Experts [50.02627258858336]
大規模言語モデル(LLM)は、しばしばオープンエンドの医学的問題に苦しむ。
本稿では,構造化医療推論を利用した新しいアプローチを提案する。
我々の手法は85.8のファクチュアリティスコアを達成し、微調整されたモデルを上回る。
論文 参考訳(メタデータ) (2025-03-05T05:24:55Z) - Innovative Framework for Early Estimation of Mental Disorder Scores to Enable Timely Interventions [0.9297614330263184]
本稿では,PTSDとうつ病の自動分類のための高度なマルチモーダル深層学習システムについて述べる。
提案手法は, うつ病では92%, PTSDでは93%の分類精度を達成し, 従来の単潮流法よりも優れていた。
論文 参考訳(メタデータ) (2025-02-06T10:57:10Z) - LlaMADRS: Prompting Large Language Models for Interview-Based Depression Assessment [75.44934940580112]
LlaMADRSは、オープンソースのLarge Language Models(LLM)を利用して、うつ病の重症度評価を自動化する新しいフレームワークである。
本研究は,クリニカルインタヴューの解釈・スコアリングにおけるモデル指導のために,慎重に設計された手がかりを用いたゼロショットプロンプト戦略を用いている。
実世界における236件のインタビューを対象とし,臨床評価と強い相関性を示した。
論文 参考訳(メタデータ) (2025-01-07T08:49:04Z) - Depression Detection and Analysis using Large Language Models on Textual and Audio-Visual Modalities [25.305909441170993]
うつ病は公衆衛生上の重大な問題であり、個人の心理的健康に大きな影響を与えている。
診断されていない場合、うつ病は重篤な健康問題を引き起こし、身体的に現れて自殺に至る。
論文 参考訳(メタデータ) (2024-07-08T17:00:51Z) - Empowering Psychotherapy with Large Language Models: Cognitive
Distortion Detection through Diagnosis of Thought Prompting [82.64015366154884]
本研究では,認知的歪み検出の課題について検討し,思考の早期発見(DoT)を提案する。
DoTは、事実と思考を分離するための主観的評価、思考と矛盾する推論プロセスを引き出すための対照的な推論、認知スキーマを要約するスキーマ分析という3つの段階を通して、患者のスピーチの診断を行う。
実験により、DoTは認知的歪み検出のためのChatGPTよりも大幅に改善され、一方で人間の専門家が承認した高品質な合理性を生成することが示された。
論文 参考訳(メタデータ) (2023-10-11T02:47:21Z) - Individualized Dosing Dynamics via Neural Eigen Decomposition [51.62933814971523]
ニューラル固有微分方程式アルゴリズム(NESDE)を導入する。
NESDEは個別化モデリング、新しい治療ポリシーへの調整可能な一般化、高速で連続的でクローズドな予測を提供する。
本研究は, 総合的・現実的な医療問題におけるNESDEの堅牢性を実証し, 学習力学を用いて, 模擬医療体育環境の公開を行う。
論文 参考訳(メタデータ) (2023-06-24T17:01:51Z) - Deep Multi-task Learning for Depression Detection and Prediction in
Longitudinal Data [50.02223091927777]
うつ病は最も多い精神疾患の1つであり、世界中の年齢の何百万人もの人々に影響を与えている。
機械学習技術は、早期介入と治療のためのうつ病の自動検出と予測を可能にしている。
本稿では、この課題に対処するために、2つの補助的タスクでうつ病分類を共同最適化する、新しいディープマルチタスクリカレントニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2020-12-05T05:14:14Z) - Multimodal Depression Severity Prediction from medical bio-markers using
Machine Learning Tools and Technologies [0.0]
うつ病は世界中の精神疾患の主要な原因となっている。
近年,うつ病の診断とステージ予測の自動化に行動的手がかりが用いられている。
ラベル付き行動データセットの欠如と、膨大な量のバリエーションが、タスクを達成する上で大きな課題であることが証明されている。
論文 参考訳(メタデータ) (2020-09-11T20:44:28Z) - Detecting Parkinsonian Tremor from IMU Data Collected In-The-Wild using
Deep Multiple-Instance Learning [59.74684475991192]
パーキンソン病(英: Parkinson's Disease、PD)は、60歳以上の人口の約1%に影響を与える徐々に進化する神経学的疾患である。
PD症状には、震動、剛性、ブレイキネジアがある。
本稿では,スマートフォン端末から受信したIMU信号に基づいて,PDに関連するトレモラスなエピソードを自動的に識別する手法を提案する。
論文 参考訳(メタデータ) (2020-05-06T09:02:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。