論文の概要: Development and Evaluation of HopeBot: an LLM-based chatbot for structured and interactive PHQ-9 depression screening
- arxiv url: http://arxiv.org/abs/2507.05984v1
- Date: Tue, 08 Jul 2025 13:41:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-09 16:34:38.139932
- Title: Development and Evaluation of HopeBot: an LLM-based chatbot for structured and interactive PHQ-9 depression screening
- Title(参考訳): 構造化・対話型PHQ-9うつ病スクリーニングのためのLLMベースのチャットボット、HopeBotの開発と評価
- Authors: Zhijun Guo, Alvina Lai, Julia Ive, Alexandru Petcu, Yutong Wang, Luyuan Qi, Johan H Thygesen, Kezhi Li,
- Abstract要約: HopeBotは、PHQ-9(Patent Health Questionnaire-9)を検索強化世代とリアルタイムの明確化を用いて管理する。
内部調査では、英国と中国の132人の成人が、自己管理版とチャットボット版の両方を完成させた。
全体の87.1%は、ホープボットの再利用や推奨を表明している。
- 参考スコア(独自算出の注目度): 48.355615275247786
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Static tools like the Patient Health Questionnaire-9 (PHQ-9) effectively screen depression but lack interactivity and adaptability. We developed HopeBot, a chatbot powered by a large language model (LLM) that administers the PHQ-9 using retrieval-augmented generation and real-time clarification. In a within-subject study, 132 adults in the United Kingdom and China completed both self-administered and chatbot versions. Scores demonstrated strong agreement (ICC = 0.91; 45% identical). Among 75 participants providing comparative feedback, 71% reported greater trust in the chatbot, highlighting clearer structure, interpretive guidance, and a supportive tone. Mean ratings (0-10) were 8.4 for comfort, 7.7 for voice clarity, 7.6 for handling sensitive topics, and 7.4 for recommendation helpfulness; the latter varied significantly by employment status and prior mental-health service use (p < 0.05). Overall, 87.1% expressed willingness to reuse or recommend HopeBot. These findings demonstrate voice-based LLM chatbots can feasibly serve as scalable, low-burden adjuncts for routine depression screening.
- Abstract(参考訳): 患者健康アンケート-9(PHQ-9)のような静的ツールはうつ病を効果的にスクリーニングするが、相互作用性と適応性に欠ける。
We developed HopeBot, a chatbot with a large language model (LLM) that manages the PHQ-9 using search-augmented generation and real-time clarification。
内部調査では、英国と中国の132人の成人が、自己管理版とチャットボット版の両方を完成させた。
スコアは強い一致を示した(ICC = 0.91; 45% 同一)。
比較フィードバックを提供する75人の参加者のうち、71%がチャットボットに対する信頼度を高め、より明確な構造、解釈指導、支持音を強調した。
平均格付け(0-10)は、快適性8.4、明瞭性7.7、センシティブなトピックに対処する7.6、推奨力7.4であり、後者は雇用状況と以前のメンタルヘルスサービス利用(p < 0.05)によって大きく異なる。
全体の87.1%は、ホープボットの再利用や推奨を表明している。
これらの結果は、音声ベースのLLMチャットボットが、日常的なうつ病スクリーニングのためのスケーラブルで低バーデントなアジェントとして機能することを実証している。
関連論文リスト
- Clean & Clear: Feasibility of Safe LLM Clinical Guidance [2.0194749607835014]
臨床ガイドラインは、現代医療における安全なエビデンスベースの医療の中心である。
オープンウェイトなLlama-3.1-8B LLMを開発した。
73%の回答が関連性が高いと評価され,臨床状況の理解が強かった。
論文 参考訳(メタデータ) (2025-03-26T19:36:43Z) - Prompt Engineering a Schizophrenia Chatbot: Utilizing a Multi-Agent Approach for Enhanced Compliance with Prompt Instructions [0.0699049312989311]
統合失調症の患者は、しばしば認知障害を伴い、自分の状態について学ぶ能力を妨げることがある。
大規模言語モデル(LLM)は、トピックのメンタルヘルス情報をよりアクセシビリティとエンゲージメントを高める可能性を秘めているが、それらのブラックボックスの性質は倫理と安全に関する懸念を喚起する。
論文 参考訳(メタデータ) (2024-10-10T09:49:24Z) - From Words and Exercises to Wellness: Farsi Chatbot for Self-Attachment Technique [1.7592522344393486]
私たちはFarsiでセルフアタッチメント(SAT)を通じてユーザを誘導する音声対応ロボットを開発した。
6000以上の発話のデータセットを収集し、ユーザー感情を12クラスに分類する新しい感情分析モジュールを開発し、精度は92%以上である。
当社のプラットフォームは,ほとんどのユーザ(75%),72%がインタラクションの後に気分が良くなり,74%がSAT Teacherのパフォーマンスに満足していた。
論文 参考訳(メタデータ) (2023-10-13T19:09:31Z) - CheerBots: Chatbots toward Empathy and Emotionusing Reinforcement
Learning [60.348822346249854]
本研究では,複数の共感型チャットボットがユーザの暗黙の感情を理解し,複数の対話のターンに対して共感的に応答する枠組みを提案する。
チャットボットをCheerBotsと呼びます。CheerBotsは検索ベースまたは生成ベースで、深い強化学習によって微調整されます。
共感的態度で反応するため,CheerBotsの学習支援としてシミュレーションエージェントである概念人間モデルを開発し,今後のユーザの感情状態の変化を考慮し,共感を喚起する。
論文 参考訳(メタデータ) (2021-10-08T07:44:47Z) - Put Chatbot into Its Interlocutor's Shoes: New Framework to Learn
Chatbot Responding with Intention [55.77218465471519]
本稿では,チャットボットに人間のような意図を持つための革新的なフレームワークを提案する。
我々のフレームワークには、ガイドロボットと人間の役割を担うインターロケータモデルが含まれていた。
本フレームワークを3つの実験的なセットアップを用いて検討し,4つの異なる指標を用いた誘導ロボットの評価を行い,柔軟性と性能の利点を実証した。
論文 参考訳(メタデータ) (2021-03-30T15:24:37Z) - NUVA: A Naming Utterance Verifier for Aphasia Treatment [49.114436579008476]
失語症(PWA)患者の治療介入に対する反応の診断とモニタリングの両立のための画像命名タスクを用いた音声性能評価
本稿では,失語症脳卒中患者の「正しい」と「正しくない」を分類する深層学習要素を組み込んだ発話検証システムであるNUVAについて述べる。
イギリス系英語8ヶ国語でのテストでは、システムの性能精度は83.6%から93.6%の範囲であり、10倍のクロスバリデーション平均は89.5%であった。
論文 参考訳(メタデータ) (2021-02-10T13:00:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。