論文の概要: Large Language Models for Depression Recognition in Spoken Language Integrating Psychological Knowledge
- arxiv url: http://arxiv.org/abs/2505.22863v1
- Date: Wed, 28 May 2025 20:53:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-30 18:14:07.538075
- Title: Large Language Models for Depression Recognition in Spoken Language Integrating Psychological Knowledge
- Title(参考訳): 心理学的知識を統合した音声言語における抑うつ認識のための大規模言語モデル
- Authors: Yupei Li, Shuaijie Shao, Manuel Milling, Björn W. Schuller,
- Abstract要約: うつ病は公的な言論とAI研究の両方で注目を集める懸念が高まっている。
我々は,マルチモーダル型抑うつ検出への大規模言語モデルの最初の応用として,私たちの知る限りの最高の知識を提示する。
心理学的知識をLCMに組み込んで診断性能を高めるための新しい戦略を提案する。
- 参考スコア(独自算出の注目度): 38.52606718906513
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Depression is a growing concern gaining attention in both public discourse and AI research. While deep neural networks (DNNs) have been used for recognition, they still lack real-world effectiveness. Large language models (LLMs) show strong potential but require domain-specific fine-tuning and struggle with non-textual cues. Since depression is often expressed through vocal tone and behaviour rather than explicit text, relying on language alone is insufficient. Diagnostic accuracy also suffers without incorporating psychological expertise. To address these limitations, we present, to the best of our knowledge, the first application of LLMs to multimodal depression detection using the DAIC-WOZ dataset. We extract the audio features using the pre-trained model Wav2Vec, and mapped it to text-based LLMs for further processing. We also propose a novel strategy for incorporating psychological knowledge into LLMs to enhance diagnostic performance, specifically using a question and answer set to grant authorised knowledge to LLMs. Our approach yields a notable improvement in both Mean Absolute Error (MAE) and Root Mean Square Error (RMSE) compared to a base score proposed by the related original paper. The codes are available at https://github.com/myxp-lyp/Depression-detection.git
- Abstract(参考訳): うつ病は公的な言論とAI研究の両方で注目を集める懸念が高まっている。
ディープニューラルネットワーク(DNN)は認識に使用されているが、実際の有効性には欠ける。
大きな言語モデル(LLM)は強いポテンシャルを示すが、ドメイン固有の微調整が必要であり、非テクスチュアルなキューと競合する。
抑うつはしばしば明示的なテキストよりも声調や行動によって表現されるので、言語のみに依存することは不十分である。
診断精度も、心理学的専門知識を組み込まずに悩まされる。
これらの制約に対処するため,DAIC-WOZデータセットを用いたマルチモーダル抑うつ検出にLLMを最初に応用した。
事前学習したWav2Vecモデルを用いて音声の特徴を抽出し,テキストベースのLLMにマッピングしてさらなる処理を行う。
また,心理学的知識をLCMに取り入れて診断能力を高めるための新たな戦略を提案する。
本手法は, 平均絶対誤差 (MAE) とルート平均正方誤差 (RMSE) の両方において, 原論文で提案した基準値と比較して顕著な改善をもたらす。
コードはhttps://github.com/myxp-lyp/Depression-detection.gitで公開されている。
関連論文リスト
- Explainable Depression Detection in Clinical Interviews with Personalized Retrieval-Augmented Generation [32.163466666512996]
うつ病は広範な精神疾患であり、臨床面接は評価のための金の基準である。
現在のシステムは主にブラックボックスニューラルネットワークを使用し、解釈性に欠ける。
本稿では,説明可能な抑うつ検出のための検索拡張フレームワークREDを提案する。
論文 参考訳(メタデータ) (2025-03-03T08:59:34Z) - A BERT-Based Summarization approach for depression detection [1.7363112470483526]
うつ病は世界中で流行する精神疾患であり、対処されないと深刻な反感を引き起こす可能性がある。
機械学習と人工知能は、さまざまなデータソースからのうつ病指標を自律的に検出することができる。
本研究では,入力テキストの長さと複雑さを低減させる前処理手法として,テキスト要約を提案する。
論文 参考訳(メタデータ) (2024-09-13T02:14:34Z) - Negation Blindness in Large Language Models: Unveiling the NO Syndrome in Image Generation [63.064204206220936]
基礎的な大規模言語モデル(LLM)は、私たちが技術を理解する方法を変えました。
詩の執筆からコーディング、エッセイ生成、パズルの解決まで、様々な課題に長けていることが示されている。
画像生成機能の導入により、より包括的で汎用的なAIツールとなった。
現在特定されている欠陥には、幻覚、偏見、有害なコンテンツを生成するために制限されたコマンドをバイパスすることが含まれる。
論文 参考訳(メタデータ) (2024-08-27T14:40:16Z) - Knowledge Graph-Enhanced Large Language Models via Path Selection [58.228392005755026]
大規模言語モデル(LLM)は、様々な現実世界のアプリケーションで前例のない性能を示している。
LLMは実際に不正確な出力、すなわち幻覚の問題を発生させることが知られている。
上記の問題に対処する3段階の原理的フレームワークKELPを提案する。
論文 参考訳(メタデータ) (2024-06-19T21:45:20Z) - Depression Detection on Social Media with Large Language Models [23.075317886505193]
抑うつ検出は、ソーシャルメディア上の投稿履歴を分析して、個人が抑うつに苦しむかどうかを判断することを目的としている。
本稿では,医学的知識と大規模言語モデルの最近の進歩を融合した,DORISと呼ばれる新規なうつ病検出システムを提案する。
論文 参考訳(メタデータ) (2024-03-16T01:01:16Z) - Tuning-Free Accountable Intervention for LLM Deployment -- A
Metacognitive Approach [55.613461060997004]
大規模言語モデル(LLM)は、自然言語処理タスクの幅広い領域にわたる変換的進歩を触媒している。
我々は,自己認識型誤り識別と訂正機能を備えたLLMを実現するために,textbfCLEARと呼ばれる革新的なテキストメタ認知手法を提案する。
論文 参考訳(メタデータ) (2024-03-08T19:18:53Z) - When LLMs Meets Acoustic Landmarks: An Efficient Approach to Integrate Speech into Large Language Models for Depression Detection [17.018248242646365]
抑うつは世界的メンタルヘルスにおいて重要な関心事であり、AIに基づく検出方法の広範な研究を促している。
大規模言語モデル(LLM)は、メンタルヘルスケアアプリケーションにおいて、その汎用性において際立っている。
マルチモーダル抑うつ検出のためのLLMフレームワークに音声情報を統合するための革新的なアプローチを提案する。
論文 参考訳(メタデータ) (2024-02-17T09:39:46Z) - Enhancing Uncertainty-Based Hallucination Detection with Stronger Focus [99.33091772494751]
大規模言語モデル(LLM)は、様々な分野にわたる印象的なパフォーマンスで大きな人気を集めている。
LLMは、ユーザの期待を満たさない非現実的あるいは非感覚的なアウトプットを幻覚させる傾向がある。
LLMにおける幻覚を検出するための新しい基準のない不確実性に基づく手法を提案する。
論文 参考訳(メタデータ) (2023-11-22T08:39:17Z) - Are Large Language Models Really Robust to Word-Level Perturbations? [68.60618778027694]
本稿では,事前学習した報酬モデルを診断ツールとして活用する,新たな合理的評価手法を提案する。
より長い会話は、質問を理解する能力の観点から言語モデルの包括的把握を示す。
この結果から,LLMは日常言語でよく使われる単語レベルの摂動に対する脆弱性をしばしば示している。
論文 参考訳(メタデータ) (2023-09-20T09:23:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。