論文の概要: Virtual Speech Therapist: A Clinician-in-the-Loop AI Speech Therapy Agent for Personalized and Supervised Therapy
- arxiv url: http://arxiv.org/abs/2605.01101v1
- Date: Fri, 01 May 2026 21:14:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.582403
- Title: Virtual Speech Therapist: A Clinician-in-the-Loop AI Speech Therapy Agent for Personalized and Supervised Therapy
- Title(参考訳): 仮想音声療法士 : パーソナライズ・監視治療のための対人AI音声治療エージェント
- Authors: Shakeel Sheikh, Patrick Marmaroli, MD Sahidullah, Slim Ouni, Fabrice Hirsch, Goncalo Leal, Bjorn W Schuller,
- Abstract要約: 本稿では、知的エージェントベースのプラットフォームであるVirtual Speech Therapist(VST)を開発した。
VSTは、最先端のディープラーニングベースのスタブリング分類と、エビデンスベースの臨床意思決定を支援するための多エージェント大規模言語モデル(LLM)を統合している。
- 参考スコア(独自算出の注目度): 8.877732578001098
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper develops Virtual Speech Therapist (VST), an intelligent agent-based platform that streamlines stuttering assessment and delivers customized therapy planning through automated and adaptive AI-driven workflows. VST integrates state-of-the-art deep learning-based stuttering classification, and multi-agent large language model (LLM) reasoning to support evidence-based clinical decision-making. The VST begins with the acquisition and feature extraction of patient speech samples, followed by robust classification of stuttering types. Building on these outputs, VST initiates an agentic reasoning process in which specialized LLM agents autonomously generate, critique, and iteratively refine individualized therapy plans. A dedicated critic agent evaluates all generated therapy plans to ensure clinical safety, methodological soundness, and alignment with peer-reviewed evidence and established professional guidelines. The resulting output is a comprehensive, patient-specific therapy draft intended for clinician review. Incorporating clinician feedback, the system then produces a finalized therapy plan suitable for patient delivery, thereby maintaining a clinician-in-the-loop paradigm. Experimental evaluation by expert speech therapists confirms that VST consistently generates high-quality, evidence-based therapy recommendations. These findings demonstrate the system's potential to augment clinical workflows, reduce clinician burden, and improve therapeutic outcomes for individuals with speech impairments. An interactive user interface for the proposed system is available online at: https://vocametrix.com/ai/stuttering-therapy-planning-agent , facilitating real-time stuttering assessment and personalized therapy planning.
- Abstract(参考訳): 本稿では、知的エージェントベースのプラットフォームであるVirtual Speech Therapist(VST)を開発した。
VSTは、最先端のディープラーニングベースのスタブリング分類と、エビデンスベースの臨床意思決定を支援するための多エージェント大規模言語モデル(LLM)を統合している。
VSTは、患者音声サンプルの取得と特徴抽出から始まり、続いて、発声型の堅牢な分類を行う。
これらのアウトプットに基づいて、VSTは、特殊LLMエージェントが自律的に個別化されたセラピー計画を生成し、批判し、反復的に洗練するエージェント推論プロセスを開始する。
専門批評家は、臨床安全性、方法論的健全性、およびピアレビューされた証拠との整合性を確保するために生成された全ての治療計画を評価し、専門家のガイドラインを確立する。
その結果得られたアウトプットは、臨床医のレビューを目的とした包括的、患者固有の治療草案である。
臨床医のフィードバックを取り入れたシステムでは,患者への提供に適した最終治療計画が作成され,臨床医のループパラダイムが維持される。
専門的な言語療法士による実験的評価は、VSTが常に高品質なエビデンスベースの治療レコメンデーションを生成することを確認している。
これらの結果から, 臨床ワークフローを増強し, 臨床負担を軽減し, 音声障害のある人に対する治療効果を向上させる可能性が示唆された。
提案システムの対話型ユーザインタフェースは, https://vocametrix.com/ai/stuttering-therapy-planning-agent でオンラインで公開されている。
関連論文リスト
- Tell Me: An LLM-powered Mental Well-being Assistant with RAG, Synthetic Dialogue Generation, and Agentic Planning [0.0]
Tell Meは、大きな言語モデルの進歩を活用して、ユーザと研究者にアクセシブルでコンテキスト対応のサポートを提供する、メンタルウェルビーイングシステムである。
i) パーソナライズされた知識基盤対話のための検索強化世代アシスタント(RAG) ; (ii) クライアントプロファイルに条件付き合成クライアントセラピスト対話ジェネレータで、治療言語とデータ拡張の研究を容易にする。
論文 参考訳(メタデータ) (2025-11-18T12:43:04Z) - Retrieval-Augmented Framework for LLM-Based Clinical Decision Support [0.19999259391104388]
本稿では,大言語モデル(LLM)を用いた臨床意思決定支援システムを提案する。
このフレームワークは自然言語処理と構造化された臨床入力を統合し、文脈に関連のあるレコメンデーションを生成する。
本稿では,表現表現のアライメントや生成戦略など,システムの技術的コンポーネントについて概説する。
論文 参考訳(メタデータ) (2025-10-01T18:45:25Z) - Medical Reasoning in the Era of LLMs: A Systematic Review of Enhancement Techniques and Applications [59.721265428780946]
医学における大きな言語モデル(LLM)は印象的な能力を実現しているが、体系的で透明で検証可能な推論を行う能力に重大なギャップが残っている。
本稿は、この新興分野に関する最初の体系的なレビューを提供する。
本稿では,学習時間戦略とテスト時間メカニズムに分類した推論強化手法の分類法を提案する。
論文 参考訳(メタデータ) (2025-08-01T14:41:31Z) - Reframe Your Life Story: Interactive Narrative Therapist and Innovative Moment Assessment with Large Language Models [72.36715571932696]
物語療法は、個人が問題のある人生の物語を代替品の力に変えるのに役立つ。
現在のアプローチでは、特殊精神療法ではリアリズムが欠如しており、時間とともに治療の進行を捉えることができない。
Int(Interactive Narrative Therapist)は、治療段階を計画し、反射レベルを誘導し、文脈的に適切な専門家のような反応を生成することによって、専門家の物語セラピストをシミュレートする。
論文 参考訳(メタデータ) (2025-07-27T11:52:09Z) - Ψ-Arena: Interactive Assessment and Optimization of LLM-based Psychological Counselors with Tripartite Feedback [51.26493826461026]
大規模言語モデル(LLM)の総合的評価と最適化のための対話型フレームワークであるPsi-Arenaを提案する。
アリーナは、心理学的にプロファイルされたNPCクライアントとの多段階対話を通じて現実世界のカウンセリングをシミュレートする現実的なアリーナ相互作用を特徴としている。
8つの最先端のLLM実験は、異なる実世界のシナリオと評価の観点で大きなパフォーマンス変化を示す。
論文 参考訳(メタデータ) (2025-05-06T08:22:51Z) - TRUST: An LLM-Based Dialogue System for Trauma Understanding and Structured Assessments [8.618945530676614]
本研究は,臨床症状を再現するLLMを用いた対話システムを開発することにより,メンタルヘルスアクセシビリティのギャップを埋めることを目的とする。
我々は、PTSDの正式な診断および評価を行うことができる協調LLMモジュールのフレームワークであるTRUSTを紹介する。
臨床医による時間と費用のかかる手動テストを置き換えるために,実生活の面接書に基づく患者シミュレーション手法を開発した。
論文 参考訳(メタデータ) (2025-04-30T17:58:06Z) - Script-Based Dialog Policy Planning for LLM-Powered Conversational Agents: A Basic Architecture for an "AI Therapist" [0.0]
大規模言語モデル(LLM)による会話エージェントは,行動医療の大規模サポートをユーザに提供する可能性を秘めている。
対話型エージェントにおける対話型ポリシー計画のための新しいパラダイムを導入し、専門家が書いた「スクリプト」に従って行動できるようにする。
我々は,異なるプロンプト技術を用いてスクリプトベースの対話ポリシー計画法を2種類実装し,LLM患者との合計100の会話を合成する。
論文 参考訳(メタデータ) (2024-12-13T12:12:47Z) - Dr-LLaVA: Visual Instruction Tuning with Symbolic Clinical Grounding [53.629132242389716]
VLM(Vision-Language Models)は、医用画像を分析し、自然言語の相互作用に関与することによって、臨床医を支援する。
VLMはしばしば「幻覚的」な振る舞いを示し、文脈的マルチモーダル情報に基づかないテキスト出力を生成する。
本稿では,臨床推論の象徴的表現を用いて医療知識にVLMを基盤とする新たなアライメントアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-05-29T23:19:28Z) - SupervisorBot: NLP-Annotated Real-Time Recommendations of Psychotherapy
Treatment Strategies with Deep Reinforcement Learning [13.173307471333619]
本稿では,心理療法セッション中のセラピストに対して,リアルタイムで治療戦略を提案するレコメンデーションシステムを提案する。
本システムでは,評価項目の深層埋め込みと患者が話している現在文との類似度スコアを計算し,治療結果を予測するターンレベル評価機構を用いる。
論文 参考訳(メタデータ) (2022-08-27T19:22:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。