論文の概要: Script-Based Dialog Policy Planning for LLM-Powered Conversational Agents: A Basic Architecture for an "AI Therapist"
- arxiv url: http://arxiv.org/abs/2412.15242v1
- Date: Fri, 13 Dec 2024 12:12:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-29 08:00:15.246894
- Title: Script-Based Dialog Policy Planning for LLM-Powered Conversational Agents: A Basic Architecture for an "AI Therapist"
- Title(参考訳): LLMを用いた対話エージェントのためのスクリプトベースの対話ポリシープランニング:「AIセラピスト」のための基礎的アーキテクチャ
- Authors: Robert Wasenmüller, Kevin Hilbert, Christoph Benzmüller,
- Abstract要約: 大規模言語モデル(LLM)による会話エージェントは,行動医療の大規模サポートをユーザに提供する可能性を秘めている。
対話型エージェントにおける対話型ポリシー計画のための新しいパラダイムを導入し、専門家が書いた「スクリプト」に従って行動できるようにする。
我々は,異なるプロンプト技術を用いてスクリプトベースの対話ポリシー計画法を2種類実装し,LLM患者との合計100の会話を合成する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Large Language Model (LLM)-Powered Conversational Agents have the potential to provide users with scaled behavioral healthcare support, and potentially even deliver full-scale "AI therapy'" in the future. While such agents can already conduct fluent and proactive emotional support conversations, they inherently lack the ability to (a) consistently and reliably act by predefined rules to align their conversation with an overarching therapeutic concept and (b) make their decision paths inspectable for risk management and clinical evaluation -- both essential requirements for an "AI Therapist". In this work, we introduce a novel paradigm for dialog policy planning in conversational agents enabling them to (a) act according to an expert-written "script" that outlines the therapeutic approach and (b) explicitly transition through a finite set of states over the course of the conversation. The script acts as a deterministic component, constraining the LLM's behavior in desirable ways and establishing a basic architecture for an AI Therapist. We implement two variants of Script-Based Dialog Policy Planning using different prompting techniques and synthesize a total of 100 conversations with LLM-simulated patients. The results demonstrate the feasibility of this new technology and provide insights into the efficiency and effectiveness of different implementation variants.
- Abstract(参考訳): 大規模言語モデル(LLM)による会話エージェントは,行動医療の大規模サポートや,将来的には本格的な「AIセラピー」も提供できる可能性がある。
そうしたエージェントは、既に流動的で積極的な感情的支援の会話を行うことができるが、それらは本質的には、能力の欠如である。
a) 包括的治療概念と会話を整合させる事前定義された規則により一貫して確実に行動する
b)「AIセラピスト」に必須の要件であるリスク管理と臨床評価のための意思決定パスを検査できるようにする。
本研究では,対話型エージェントにおける対話型ポリシー計画のための新しいパラダイムを提案する。
(a)治療のアプローチを概説する専門家による書面による行為
b) 会話の途中で有限状態の集合を明示的に遷移する。
スクリプトは決定論的コンポーネントとして機能し、LLMの振る舞いを望ましい方法で制限し、AIセラピストのための基本的なアーキテクチャを確立する。
我々は,異なるプロンプト技術を用いてスクリプトベースの対話ポリシー計画法を2種類実装し,LLM患者との合計100の会話を合成する。
その結果、この新しい技術の実現可能性を示し、異なる実装のバリエーションの効率性と有効性についての洞察を提供する。
関連論文リスト
- Structured Dialogue System for Mental Health: An LLM Chatbot Leveraging the PM+ Guidelines [23.230484270460877]
SuDoSysは、心理学的カウンセリングを提供するために設計された、ステージ対応マルチターン対話システムである。
このシステムはカウンセリングプロセスを通じて重要な情報を格納し、コヒーレントで指示された会話を確実にする。
客観的評価と主観評価の両方を用いて評価すると、SuDoSysは論理的に一貫性のある応答を生成する効果を示す。
論文 参考訳(メタデータ) (2024-11-16T03:12:17Z) - Script-Strategy Aligned Generation: Aligning LLMs with Expert-Crafted Dialogue Scripts and Therapeutic Strategies for Psychotherapy [17.07905574770501]
現在のシステムは厳格で規則に基づく設計に依存しており、治療的会話を導くために専門家が作成したスクリプトに大きく依存している。
大規模言語モデル(LLM)の最近の進歩は、より柔軟な相互作用の可能性を提供するが、制御性と透明性は欠如している。
完全にスクリプト化されたコンテンツへの依存を減らすフレキシブルなアライメントアプローチである Script-Strategy Aligned Generation (SSAG)' を提案する。
論文 参考訳(メタデータ) (2024-11-11T05:14:14Z) - Interactive Dialogue Agents via Reinforcement Learning on Hindsight Regenerations [58.65755268815283]
多くの実際の対話は対話的であり、つまりエージェントの発話が会話の相手に影響を与えるか、情報を引き出すか、意見を変えるかである。
この事実を利用して、既存の最適データを書き直し、拡張し、オフライン強化学習(RL)を介してトレーニングする。
実際の人間によるユーザ調査の結果、我々のアプローチは既存の最先端の対話エージェントを大きく上回っていることがわかった。
論文 参考訳(メタデータ) (2024-11-07T21:37:51Z) - Conversational Topic Recommendation in Counseling and Psychotherapy with Decision Transformer and Large Language Models [17.236038165057817]
我々は、会話のカウンセリングにおいてトピックレコメンデーションに決定トランスフォーマーアーキテクチャを利用する。
アーキテクチャはオフラインの強化学習に利用される。
本稿では,大言語モデルを微調整するための合成ラベルとして,我々のモデル出力を利用する新しいシステムを提案する。
論文 参考訳(メタデータ) (2024-05-08T13:55:25Z) - Chain-of-Interaction: Enhancing Large Language Models for Psychiatric Behavior Understanding by Dyadic Contexts [4.403408362362806]
本稿では,対話型対話による精神科的意思決定支援のための大規模言語モデルを文脈化するための,対話型連鎖促進手法を提案する。
このアプローチにより、大規模言語モデルでは、患者の行動コーディングのためのコーディングスキーム、患者の状態、およびドメイン知識を活用することができる。
論文 参考訳(メタデータ) (2024-03-20T17:47:49Z) - Zero-Shot Goal-Directed Dialogue via RL on Imagined Conversations [70.7884839812069]
大規模言語モデル(LLM)は、多くの自然言語タスクに対する強力で一般的な解決策として登場した。
しかしながら、言語生成の最も重要なアプリケーションの多くは対話的であり、エージェントは望ましい結果に達するために相手と話し合わなければならない。
本研究では,そのような目標指向対話に対して,RLでLLMを適応させる新しい手法について検討する。
論文 参考訳(メタデータ) (2023-11-09T18:45:16Z) - Plug-and-Play Policy Planner for Large Language Model Powered Dialogue
Agents [121.46051697742608]
そこで本稿では,PDPPという言語モデルプラグインを用いて対話問題を整理するための新たな対話ポリシー計画パラダイムを提案する。
具体的には、利用可能な人間の注釈付きデータに対する教師付き微調整を容易にするための新しいトレーニングフレームワークを開発する。
PPDPPは3つの異なるプロアクティブな対話アプリケーションにおいて、既存のアプローチを一貫して、実質的に上回っている。
論文 参考訳(メタデータ) (2023-11-01T03:20:16Z) - JoTR: A Joint Transformer and Reinforcement Learning Framework for
Dialog Policy Learning [53.83063435640911]
対話政策学習(DPL)は対話モデリングの重要な構成要素である。
フレキシブルな対話行動を生成するための新しいフレームワークであるJoTRを導入する。
従来の方法とは異なり、JoTRはよりダイナミックで適応可能な対話アクション生成を可能にするワードレベルのポリシーを定式化している。
論文 参考訳(メタデータ) (2023-09-01T03:19:53Z) - Building Emotional Support Chatbots in the Era of LLMs [64.06811786616471]
我々は,Large Language Models (LLMs) の計算能力で人間の洞察を合成する革新的な方法論を導入する。
また,ChatGPTの文脈内学習の可能性を利用して,ExTESと呼ばれる感情支援対話データセットを生成する。
次に、LLaMAモデルに高度なチューニング手法を展開し、多様なトレーニング戦略の影響を検証し、最終的に感情的支援の相互作用に細心の注意を払ってLLMを出力する。
論文 参考訳(メタデータ) (2023-08-17T10:49:18Z) - Prompting and Evaluating Large Language Models for Proactive Dialogues:
Clarification, Target-guided, and Non-collaboration [72.04629217161656]
本研究は, 明瞭化, 目標誘導, 非協調対話の3つの側面に焦点をあてる。
LLMの能動性を高めるために,プロアクティブ・チェーン・オブ・ソート・プロンプト方式を提案する。
論文 参考訳(メタデータ) (2023-05-23T02:49:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。