論文の概要: EmoTrack: Robust Depression Tracking from Counseling Transcripts across Session Regimes
- arxiv url: http://arxiv.org/abs/2605.22286v1
- Date: Thu, 21 May 2026 10:37:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:42.211628
- Title: EmoTrack: Robust Depression Tracking from Counseling Transcripts across Session Regimes
- Title(参考訳): EmoTrack: セッションレジームをまたがるコウンスリングトランスクリプトからのロバストなデプレッショントラッキング
- Authors: Zhaomin Wu, Jiayi Li, Bingsheng He,
- Abstract要約: シングルセッションおよびマルチセッション体制におけるカウンセリング書面からの堅牢な抑うつ追跡について検討した。
EmoTrackは、LPM抽出された臨床信号と凍結したターンレベルのセマンティック埋め込みを組み合わせたPHQ-8予測フレームワークである。
- 参考スコア(独自算出の注目度): 39.23035868785596
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Text-based counseling is an important interface for AI mental-health support, where transcripts may be used to monitor depression severity and flag sessions requiring timely human review. However, robust PHQ-8 prediction across session regimes remains challenging: fine-tuning-based methods can exploit richer supervision but may generalize poorly under data scarcity, while prompt-based LLM methods are data-efficient but usually treat each transcript holistically and provide limited support for longitudinal context. We study robust depression tracking from counseling transcripts across single-session and multi-session regimes. We introduce LongCounsel, a multi-session counseling dataset with session-level PHQ-8 supervision for evaluating repeated-session tracking under partial symptom disclosure and cross-session continuity. We further propose EmoTrack, a PHQ-8 prediction framework that combines LLM-extracted clinical signals with frozen turn-level semantic embeddings and trains symptom-specific predictors over the resulting transcript representation. When prior sessions are available, EmoTrack can further incorporate them through compact cross-session memory. Experiments on LongCounsel and DAIC-WOZ show that EmoTrack achieves a clear gain on the real single-session benchmark, including a 13.5% relative MAE reduction over the strongest DAIC-WOZ baseline, and remains competitive with the strongest longitudinal baseline on LongCounsel.
- Abstract(参考訳): テキストベースのカウンセリングは、AIのメンタルヘルスサポートにとって重要なインターフェースである。
微調整に基づく手法は、よりリッチな監視を活用できるが、データ不足下では一般化が不十分である一方、プロンプトベースのLLM法はデータ効率が良いが、通常、各文字起こしを論理的に扱い、文脈の限定的なサポートを提供する。
シングルセッションおよびマルチセッション体制におけるカウンセリング書面からの堅牢な抑うつ追跡について検討した。
セッションレベルのPHQ-8を監督するマルチセッションカウンセリングデータセットであるLongCounselを導入し、部分症状開示とクロスセッション継続性の下で繰り返しセッション追跡を評価する。
さらに,LLM抽出した臨床信号と凍結したターンレベルのセマンティック埋め込みを組み合わせたPHQ-8予測フレームワークであるEmoTrackを提案する。
以前のセッションが利用可能になったら、EmoTrackはさらにコンパクトなクロスセッションメモリを通じてそれらを組み込むことができる。
LongCounselとDAIC-WOZの実験では、EmoTrackは最も強いDAIC-WOZベースラインに対する13.5%のMAE削減を含む実際のシングルセッションベンチマークで明らかな利得を達成しており、LongCounselの最も強い長手ベースラインと競争力を維持している。
関連論文リスト
- Multimodal Hidden Markov Models for Persistent Emotional State Tracking [0.0]
全体として処理された個々の発話の感情を通じて会話の解釈可能な感情的弧を追跡することは、コミュニケーションの理解と指導の両方の中心である。
本稿では、会話感情を潜在感情状態の列としてモデル化する軽量な枠組みを提案する。
論文 参考訳(メタデータ) (2026-05-13T00:16:05Z) - Back to Basics: Let Conversational Agents Remember with Just Retrieval and Generation [36.056012318684175]
既存の会話記憶システムは、長期対話履歴を管理するために複雑な階層化や強化学習に依存している。
我々は2つの重要な現象を識別する:textitDecisive Evidence SparsityとtextitDual-Level Redundancy
これらの知見に触発されて,会話記憶を基本に戻す最小限のフレームワークであるメソッドを提案する。
論文 参考訳(メタデータ) (2026-04-13T15:38:43Z) - Omanic: Towards Step-wise Evaluation of Multi-hop Reasoning in Large Language Models [60.418191092851636]
OmanicはオープンドメインのマルチホップQAリソースであり、推論プロセスを分析するための構造アノテーションとして分解されたサブクエストと中間回答を提供する。
10,296個の機械によるトレーニング例(Omanic Synth)と967個の専門家による注釈付き評価例(OmanicBench)を含む。
論文 参考訳(メタデータ) (2026-03-17T15:23:37Z) - TheraMind: A Strategic and Adaptive Agent for Longitudinal Psychological Counseling [53.46927050949822]
縦断的心理カウンセリングのための戦略的適応型エージェントであるTheraMindを紹介する。
TheraMindの基盤は、カウンセリングプロセスをセッション内ループとクロスセッションループに分離する、新しいデュアルループアーキテクチャである。
クロスセッションループは、各セッション後の適用療法の有効性を評価し、その後の相互作用の方法を調整することにより、長期適応性を有するエージェントに権限を与える。
論文 参考訳(メタデータ) (2025-10-29T17:54:20Z) - Hierarchical Self-Supervised Representation Learning for Depression Detection from Speech [51.14752758616364]
音声による抑うつ検出 (SDD) は、従来の臨床評価に代わる有望で非侵襲的な代替手段である。
HAREN-CTCは,マルチタスク学習フレームワーク内でのクロスアテンションを用いて,多層SSL機能を統合した新しいアーキテクチャである。
このモデルはDAIC-WOZで0.81、MODMAで0.82の最先端マクロF1スコアを達成し、両方の評価シナリオで先行手法より優れている。
論文 参考訳(メタデータ) (2025-10-05T09:32:12Z) - Promptable Longitudinal Lesion Segmentation in Whole-Body CT [9.254535645473311]
我々は最近提案されたLongiSegフレームワークを拡張し、ポイントとマスクの相互作用による病変特異的な追跡を可能にする。
実験の結果,プレトレーニングにより,時間的文脈を活用できる能力が大幅に向上し,最大6Diceポイントの改善が得られた。
論文 参考訳(メタデータ) (2025-08-30T21:35:35Z) - Recent Trends in Distant Conversational Speech Recognition: A Review of CHiME-7 and 8 DASR Challenges [63.741916531380696]
CHiME-7と8つの遠隔音声認識(DASR)の課題は、多チャンネル、一般化可能、共同自動音声認識(ASR)、対話音声のダイアリゼーションである。
本稿では,参加者からの重要傾向を分析しつつ,課題の設計,評価指標,データセット,ベースラインシステムについて概説する。
論文 参考訳(メタデータ) (2025-07-24T07:56:24Z) - Innovative Framework for Early Estimation of Mental Disorder Scores to Enable Timely Interventions [0.9297614330263184]
本稿では,PTSDとうつ病の自動分類のための高度なマルチモーダル深層学習システムについて述べる。
提案手法は, うつ病では92%, PTSDでは93%の分類精度を達成し, 従来の単潮流法よりも優れていた。
論文 参考訳(メタデータ) (2025-02-06T10:57:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。