論文の概要: Speech-based Psychological Crisis Assessment using LLMs
- arxiv url: http://arxiv.org/abs/2605.10027v1
- Date: Mon, 11 May 2026 05:50:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.557379
- Title: Speech-based Psychological Crisis Assessment using LLMs
- Title(参考訳): LLMを用いた音声による心理的危機評価
- Authors: Terumi Chiba, Yang Luo, Ziyun Cui, Yongsheng Tong, Chao Zhang,
- Abstract要約: 本稿では,危機レベル自動分類のための大規模言語モデル(LLM)に基づくフレームワークを提案する。
音声会話における感情信号をよりよく捉えるために,パラ言語的注入法を導入する。
- 参考スコア(独自算出の注目度): 15.893490778343198
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Psychological support hotlines provide critical support for individuals experiencing mental health emergencies, yet current assessments largely rely on human operators whose judgments may vary with professional experience and are constrained by limited staffing resources. This paper proposes a large language model (LLM)-based framework for automated crisis level classification, a key indicator that supports many downstream tasks and improves the overall quality of hotline services. To better capture emotional signals in spoken conversations, we introduce a paralinguistic injection method that inserts identified non-verbal emotional cues into speech transcripts, enabling LLM-based reasoning to incorporate critical acoustic nuances. In addition, we propose a reasoning-enhanced training strategy that trains the model to generate diagnostic reasoning chains as an auxiliary task, which serves as a regulariser to improve classification performance. Combined with data augmentation, our final system achieves a macro F1-score of 0.802 and an accuracy of 0.805 on the three-class classification task under 5-fold cross-validation.
- Abstract(参考訳): 心理学的サポートホットラインは、メンタルヘルスの緊急事態を経験する個人に対して重要な支援を提供するが、現在の評価は、専門的な経験によって判断が異なり、限られた人材によって制限される人間のオペレーターに大きく依存している。
本稿では,多くのダウンストリームタスクをサポートし,ホットラインサービス全体の品質を向上させるキー指標である,自動危機レベル分類のための大規模言語モデル(LLM)に基づくフレームワークを提案する。
音声会話における感情信号をよりよく捉えるために,音声テキストに特定された非言語的感情的手がかりを挿入するパラ言語的注入法を導入し,LLMに基づく推論が重要な音響的ニュアンスを組み込むことを可能にする。
さらに,診断推論連鎖を補助的タスクとして生成するようモデルを訓練する推論強化トレーニング戦略を提案し,分類性能を向上させるためのレギュラーとして機能する。
データ拡張と組み合わせて、最終システムはマクロF1スコア0.802、精度0.805の3クラス分類タスクを5倍のクロスバリデーションで達成する。
関連論文リスト
- Detecting Stealth Sycophancy in Mental-Health Dialogue with Dynamic Emotional Signature Graphs [4.002154823241671]
最終審査員として大規模言語モデルに頼ることなく,多言語対応対話の評価を行う。
直接LLM判定器と対称テキスト類似度測定器は治療品質に不適合であることが判明した。
この問題に対処するため,動的感情署名グラフ(DESG)を提案する。
DESGは、分離された臨床状態を持つ対話ウィンドウを表現し、非対称な臨床幾何学を用いてそれらをスコアする。
論文 参考訳(メタデータ) (2026-05-05T07:56:20Z) - Agentic Cognitive Profiling: Realigning Automated Alzheimer's Disease Detection with Clinical Construct Validity [66.94391219005291]
本稿では,臨床プロトコルロジックによる自動スクリーニングを実現するエージェント認知プロファイリング(ACP)を提案する。
我々の設計の中心は、すべての定量化を決定論的関数呼び出しに委譲することで、測定から意味的理解を分離することである。
ACPは、タスク試験で90.5%のスコアマッチ率、AD予測で85.3%の精度を達成し、一般的な基準を上回っている。
論文 参考訳(メタデータ) (2026-03-18T06:15:35Z) - Towards Efficient and Robust Linguistic Emotion Diagnosis for Mental Health via Multi-Agent Instruction Refinement [33.26503728561297]
うつ病、不安、外傷などの感情の言語表現は、臨床ノート、カウンセリングダイアログ、オンラインのメンタルヘルスコミュニティに広く浸透している。
診断効率とロバスト性を改善するために,より広範かつきめ細かなプロンプト空間を体系的に探索するフレームワークであるAPOLOを提案する。
論文 参考訳(メタデータ) (2026-01-20T00:31:19Z) - Empathy Applicability Modeling for General Health Queries [16.390464387095175]
本稿では、感情反応や解釈の適用性の観点から、患者クエリを分類する理論駆動型アプローチである共感適応フレームワーク(EAF)を紹介する。
EAFは、応答生成前の共感のニーズを特定するためのフレームワークを提供し、予測共感モデリングのベンチマークを確立する。
論文 参考訳(メタデータ) (2026-01-14T18:47:02Z) - A multimodal Bayesian Network for symptom-level depression and anxiety prediction from voice and speech data [36.77792803657935]
ベイジアン・ネットワーク・モデリングを用いて,導入におけるいくつかの重要な障壁に対処できることを論じる。
大規模データセットにおける音声・音声特徴からの抑うつ・不安症状予測モデルの評価を行った。
論文 参考訳(メタデータ) (2025-12-08T17:28:09Z) - Medical Reasoning in the Era of LLMs: A Systematic Review of Enhancement Techniques and Applications [59.721265428780946]
医学における大きな言語モデル(LLM)は印象的な能力を実現しているが、体系的で透明で検証可能な推論を行う能力に重大なギャップが残っている。
本稿は、この新興分野に関する最初の体系的なレビューを提供する。
本稿では,学習時間戦略とテスト時間メカニズムに分類した推論強化手法の分類法を提案する。
論文 参考訳(メタデータ) (2025-08-01T14:41:31Z) - LlaMADRS: Prompting Large Language Models for Interview-Based Depression Assessment [75.44934940580112]
LlaMADRSは、オープンソースのLarge Language Models(LLM)を利用して、うつ病の重症度評価を自動化する新しいフレームワークである。
本研究は,クリニカルインタヴューの解釈・スコアリングにおけるモデル指導のために,慎重に設計された手がかりを用いたゼロショットプロンプト戦略を用いている。
実世界における236件のインタビューを対象とし,臨床評価と強い相関性を示した。
論文 参考訳(メタデータ) (2025-01-07T08:49:04Z) - MR-GSM8K: A Meta-Reasoning Benchmark for Large Language Model Evaluation [60.65820977963331]
大規模言語モデル(LLM)のための新しい評価パラダイムを導入する。
このパラダイムは、しばしば推論プロセスを無視する結果指向の評価から、より包括的な評価へと重点を移す。
GSM8Kデータセットにこのパラダイムを適用し,MR-GSM8Kベンチマークを開発した。
論文 参考訳(メタデータ) (2023-12-28T15:49:43Z) - Automatic Severity Classification of Dysarthric speech by using
Self-supervised Model with Multi-task Learning [4.947423926765435]
マルチタスク学習と連動した自己教師付きモデルを用いて,変形性音声の自動重大度評価手法を提案する。
Wav2vec 2.0 XLS-Rは重度分類と補助的自動音声認識(ASR)の2つのタスクで訓練される
本モデルでは,F1スコアの相対値が1.25%増加し,従来のベースライン法よりも優れていた。
論文 参考訳(メタデータ) (2022-10-27T12:48:10Z) - Automated Fidelity Assessment for Strategy Training in Inpatient
Rehabilitation using Natural Language Processing [53.096237570992294]
戦略トレーニング (Strategy Training) とは、脳卒中後の認知障害患者に障害を減らすためのスキルを教える、リハビリテーションのアプローチである。
標準化された忠実度評価は治療原則の遵守度を測定するために用いられる。
本研究では,ルールベースNLPアルゴリズム,長短項メモリ(LSTM)モデル,および変換器(BERT)モデルからの双方向エンコーダ表現を開発した。
論文 参考訳(メタデータ) (2022-09-14T15:33:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。