論文の概要: LLM-as-a-Supervisor: Mistaken Therapeutic Behaviors Trigger Targeted Supervisory Feedback
- arxiv url: http://arxiv.org/abs/2508.09042v1
- Date: Tue, 12 Aug 2025 16:03:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-13 21:07:34.491622
- Title: LLM-as-a-Supervisor: Mistaken Therapeutic Behaviors Trigger Targeted Supervisory Feedback
- Title(参考訳): LLM-as-a-Supervisor: トリガーをターゲットとしたスーパーバイザフィードバックの誤治療行動
- Authors: Chen Xu, Zhenyu Lv, Tian Lan, Xianyang Wang, Luyao Ji, Leyang Cui, Minqiang Yang, Jian Shen, Qunxi Dong, Xiuling Liu, Juan Wang, Bin Hu,
- Abstract要約: 大規模言語モデル(LLM)は精神療法において大きな可能性を秘めているが、患者が直面するシナリオへの直接的な適用は倫理的および安全上の懸念を引き起こす。
この研究は、実際のセラピストを訓練するスーパーバイザーとしてLLMの開発へと移行する。
- 参考スコア(独自算出の注目度): 27.944400312023404
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Although large language models (LLMs) hold significant promise in psychotherapy, their direct application in patient-facing scenarios raises ethical and safety concerns. Therefore, this work shifts towards developing an LLM as a supervisor to train real therapists. In addition to the privacy of clinical therapist training data, a fundamental contradiction complicates the training of therapeutic behaviors: clear feedback standards are necessary to ensure a controlled training system, yet there is no absolute "gold standard" for appropriate therapeutic behaviors in practice. In contrast, many common therapeutic mistakes are universal and identifiable, making them effective triggers for targeted feedback that can serve as clearer evidence. Motivated by this, we create a novel therapist-training paradigm: (1) guidelines for mistaken behaviors and targeted correction strategies are first established as standards; (2) a human-in-the-loop dialogue-feedback dataset is then constructed, where a mistake-prone agent intentionally makes standard mistakes during interviews naturally, and a supervisor agent locates and identifies mistakes and provides targeted feedback; (3) after fine-tuning on this dataset, the final supervisor model is provided for real therapist training. The detailed experimental results of automated, human and downstream assessments demonstrate that models fine-tuned on our dataset MATE, can provide high-quality feedback according to the clinical guideline, showing significant potential for the therapist training scenario.
- Abstract(参考訳): 大規模言語モデル(LLM)は心理療法において大きな可能性を秘めているが、患者が直面するシナリオへの直接的な適用は倫理的および安全上の懸念を引き起こす。
そのため、本研究は、実際のセラピストを訓練するためのスーパーバイザーとしてLLMの開発へと移行する。
臨床療法士のトレーニングデータのプライバシーに加えて、基本的な矛盾は治療行動のトレーニングを複雑にする: コントロールされたトレーニングシステムを保証するためには明確なフィードバック標準が必要であるが、実際適切な治療行動のための絶対的な「金の標準」は存在しない。
対照的に、多くの一般的な治療ミスは普遍的で識別可能であり、より明確な証拠として機能するターゲットフィードバックの効果的なトリガーとなる。
そこで我々は,(1) 誤動作のガイドラインと目標修正戦略をまず標準として確立し,(2) ヒューマン・イン・ザ・ループの対話フィードバックデータセットを構築し,(2) 誤動作エージェントがインタビュー中に意図的に標準ミスを犯し,監督エージェントがミスを発見・特定し,目標とするフィードバックを提供する,(3) 詳細な学習を行った後, 最終スーパーバイザーモデルが実際のセラピスト訓練のために提供される,という,新しいセラピスト訓練パラダイムを構築した。
自動, 人, 下流アセスメントの詳細な実験結果から, 我々のデータセットMATEを微調整したモデルでは, 臨床ガイドラインに従って高品質なフィードバックが得られ, セラピストのトレーニングシナリオに有意な可能性を示唆している。
関連論文リスト
- Reframe Your Life Story: Interactive Narrative Therapist and Innovative Moment Assessment with Large Language Models [92.93521294357058]
物語療法は、個人が問題のある人生の物語を代替品の力に変えるのに役立つ。
現在のアプローチでは、特殊精神療法ではリアリズムが欠如しており、時間とともに治療の進行を捉えることができない。
Int(Interactive Narrative Therapist)は、治療段階を計画し、反射レベルを誘導し、文脈的に適切な専門家のような反応を生成することによって、専門家の物語セラピストをシミュレートする。
論文 参考訳(メタデータ) (2025-07-27T11:52:09Z) - Uncertainty-Driven Expert Control: Enhancing the Reliability of Medical Vision-Language Models [52.2001050216955]
既存の方法は、モデル構造を調整したり、高品質なデータで微調整したり、好みの微調整によって、医療ビジョン言語モデル(MedVLM)の性能を向上させることを目的としている。
我々は,MedVLMと臨床専門知識の連携を図るために,Expert-Controlled-Free Guidance (Expert-CFG) という,ループ内のエキスパート・イン・ザ・ループフレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-12T09:03:30Z) - A Risk Taxonomy for Evaluating AI-Powered Psychotherapy Agents [10.405048273969085]
我々は、会話型AI心理療法士の体系的評価に特化して設計された新しいリスク分類法を導入する。
我々は、カウンセリング会話中に認知モデルに基づくリスクファクターを監視して、安全でない逸脱を検出するという2つのユースケースと、シミュレーションされた患者とのAI心理療法士の自動ベンチマークについて詳細に論じる。
論文 参考訳(メタデータ) (2025-05-21T05:01:39Z) - Ψ-Arena: Interactive Assessment and Optimization of LLM-based Psychological Counselors with Tripartite Feedback [51.26493826461026]
大規模言語モデル(LLM)の総合的評価と最適化のための対話型フレームワークであるPsi-Arenaを提案する。
アリーナは、心理学的にプロファイルされたNPCクライアントとの多段階対話を通じて現実世界のカウンセリングをシミュレートする現実的なアリーナ相互作用を特徴としている。
8つの最先端のLLM実験は、異なる実世界のシナリオと評価の観点で大きなパフォーマンス変化を示す。
論文 参考訳(メタデータ) (2025-05-06T08:22:51Z) - Position: Beyond Assistance - Reimagining LLMs as Ethical and Adaptive Co-Creators in Mental Health Care [9.30684296057698]
このポジションペーパーは、大規模言語モデル(LLM)がメンタルヘルスドメインにどのように統合されるか、という変化を論じている。
我々は、単なる補助ツールではなく、共同創造者としての役割を主張する。
論文 参考訳(メタデータ) (2025-02-21T21:41:20Z) - Multi-Modal Self-Supervised Learning for Surgical Feedback Effectiveness Assessment [66.6041949490137]
そこで本研究では,音声による音声入力とそれに対応する手術映像からの情報を統合して,フィードバックの有効性を予測する手法を提案する。
以上の結果から,手書きフィードバックと手術映像の両方が,訓練者の行動変化を個別に予測できることがわかった。
本研究は,手術フィードバックの自動評価を推進するためのマルチモーダル学習の可能性を示すものである。
論文 参考訳(メタデータ) (2024-11-17T00:13:00Z) - From Barriers to Tactics: A Behavioral Science-Informed Agentic Workflow for Personalized Nutrition Coaching [0.2808786262095875]
本稿では,パーソナライズされた栄養指導を実現するために,LSMを利用した新しいエージェントワークフローを提案する。
特殊なLDMエージェントは、意図的に患者の食事障害の根本原因を調査し、特定する。
個別のLLMエージェントは、患者コンテキストでこれらの特定の障壁を克服するために設計された調整された戦術を提供する。
論文 参考訳(メタデータ) (2024-10-17T21:35:07Z) - An Active Inference Strategy for Prompting Reliable Responses from Large Language Models in Medical Practice [0.0]
大規模言語モデル(LLM)は非決定論的であり、誤ったあるいは有害な応答を与え、品質管理を保証するために規制できない。
提案フレームワークは, 評価された医療情報を含むドメイン固有のデータセットに対して, 一次知識ベースを限定することにより, LLM応答を改良する。
不眠症治療士に対する専門的認知行動療法をブラインド形式で評価した。
論文 参考訳(メタデータ) (2024-07-23T05:00:18Z) - Automated Fidelity Assessment for Strategy Training in Inpatient
Rehabilitation using Natural Language Processing [53.096237570992294]
戦略トレーニング (Strategy Training) とは、脳卒中後の認知障害患者に障害を減らすためのスキルを教える、リハビリテーションのアプローチである。
標準化された忠実度評価は治療原則の遵守度を測定するために用いられる。
本研究では,ルールベースNLPアルゴリズム,長短項メモリ(LSTM)モデル,および変換器(BERT)モデルからの双方向エンコーダ表現を開発した。
論文 参考訳(メタデータ) (2022-09-14T15:33:30Z) - MIA-Prognosis: A Deep Learning Framework to Predict Therapy Response [58.0291320452122]
本稿では,患者の予後と治療反応を予測するための統合型深層学習手法を提案する。
我々は,マルチモーダル非同期時系列分類タスクとして,確率モデリングを定式化する。
我々の予測モデルは、長期生存の観点から、低リスク、高リスクの患者をさらに階層化する可能性がある。
論文 参考訳(メタデータ) (2020-10-08T15:30:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。