論文の概要: PAIR-SAFE: A Paired-Agent Approach for Runtime Auditing and Refining AI-Mediated Mental Health Support
- arxiv url: http://arxiv.org/abs/2601.12754v1
- Date: Mon, 19 Jan 2026 06:20:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:22.77749
- Title: PAIR-SAFE: A Paired-Agent Approach for Runtime Auditing and Refining AI-Mediated Mental Health Support
- Title(参考訳): PAIR-SAFE:AIを用いたメンタルヘルスサポートの実施と改善のためのペアエージェントアプローチ
- Authors: Jiwon Kim, Violeta J. Rodriguez, Dong Whi Yoo, Eshwar Chandrasekharan, Koustuv Saha,
- Abstract要約: 大規模言語モデル(LLM)は、メンタルヘルスのサポートにますます利用されている。
LLMは、過度に指示的、一貫性のない、または臨床的に不一致な応答を生成することができる。
PAIR-SAFEはAIによるメンタルヘルスサポートの監査と改善のためのペアエージェントフレームワークである。
- 参考スコア(独自算出の注目度): 18.251267901872886
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models (LLMs) are increasingly used for mental health support, yet they can produce responses that are overly directive, inconsistent, or clinically misaligned, particularly in sensitive or high-risk contexts. Existing approaches to mitigating these risks largely rely on implicit alignment through training or prompting, offering limited transparency and runtime accountability. We introduce PAIR-SAFE, a paired-agent framework for auditing and refining AI-generated mental health support that integrates a Responder agent with a supervisory Judge agent grounded in the clinically validated Motivational Interviewing Treatment Integrity (MITI-4) framework. The Judgeaudits each response and provides structuredALLOW or REVISE decisions that guide runtime response refinement. We simulate counseling interactions using a support-seeker simulator derived from human-annotated motivational interviewing data. We find that Judge-supervised interactions show significant improvements in key MITI dimensions, including Partnership, Seek Collaboration, and overall Relational quality. Our quantitative findings are supported by qualitative expert evaluation, which further highlights the nuances of runtime supervision. Together, our results reveal that such pairedagent approach can provide clinically grounded auditing and refinement for AI-assisted conversational mental health support.
- Abstract(参考訳): 大規模言語モデル(LLM)は、精神的な健康支援にますます使われるが、過度に指示的、一貫性のない、または臨床的に不一致な反応を、特にセンシティブな状況や高リスクな状況において生み出すことができる。
これらのリスクを軽減する既存のアプローチは、トレーニングやプロンプトを通じて暗黙のアライメントに依存しており、透明性と実行時の説明責任が制限されている。
PAIR-SAFEはAIが生成するメンタルヘルスサポートを監査・精査するためのペアエージェントフレームワークであり,臨床に検証されたモチベーション・インタビュー処理統合(MITI-4)フレームワークを基盤としたResponderエージェントと管理者エージェントを統合している。
judgeaudは各レスポンスを指定し、ランタイム応答の洗練を導く構造化ALLOWまたはREVISE決定を提供する。
我々は,人手によるモチベーションインタビューデータから得られたサポート-シーカーシミュレータを用いてカウンセリングインタラクションをシミュレートする。
審査員が監督するインタラクションは、パートナシップ、Seek Collaboration、および全体的な関係品質など、主要なMITI次元において顕著に改善されている。
定量的な知見は質的な専門家による評価によって裏付けられ、実行時の監督のニュアンスをさらに強調する。
以上の結果から,AIを用いた会話型メンタルヘルス支援のための臨床評価と改善を両立できる可能性が示唆された。
関連論文リスト
- Toward an AI Reasoning-Enabled System for Patient-Clinical Trial Matching [0.0]
本稿では,AI(Artificial Intelligence, 人工知能)による患者と臨床のマッチングのためのセキュアでスケーラブルな概念実証システムを提案する。
このシステムは、人間のループ内レビューを支援する解釈可能な推論チェーンを用いて、構造化された適性評価を生成する。
このシステムは、コーディネータの負担を軽減し、各患者が考慮する治験のセットをインテリジェントに拡大し、すべてのAI出力の総合的な監査性を保証することを目的としている。
論文 参考訳(メタデータ) (2025-12-08T20:35:51Z) - Learning to Summarize by Learning to Quiz: Adversarial Agentic Collaboration for Long Document Summarization [86.98098988779809]
SummQは長期文書要約のための新しい逆多重エージェントフレームワークである。
提案手法では,包括的な要約を作成し,評価するために協調作業を行う要約ジェネレータとレビュアーを用いる。
広範に使用されている3つの文書要約ベンチマーク上でSummQを評価する。
論文 参考訳(メタデータ) (2025-09-25T08:36:19Z) - AgentMental: An Interactive Multi-Agent Framework for Explainable and Adaptive Mental Health Assessment [31.920800599579906]
メンタルヘルスアセスメントは早期介入と効果的な治療に不可欠であるが、伝統的な臨床医ベースのアプローチは資格のある専門家の不足によって制限される。
人工知能の最近の進歩は、自動心理学的評価への関心が高まりつつあるが、既存のほとんどのアプローチは静的テキスト分析に依存しているため制約されている。
臨床医と患者との対話をシミュレートした精神保健評価のためのマルチエージェントフレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-15T16:20:45Z) - EmoStage: A Framework for Accurate Empathetic Response Generation via Perspective-Taking and Phase Recognition [1.4436965372953483]
EmoStageは共感的応答生成を強化するフレームワークである。
当社のフレームワークでは,クライアントの心理的状態とサポートニーズを推定する視点的取組みを導入している。
相認識はカウンセリングプロセスとの整合性を確保するために組み込まれている。
論文 参考訳(メタデータ) (2025-06-24T03:18:37Z) - "Is This Really a Human Peer Supporter?": Misalignments Between Peer Supporters and Experts in LLM-Supported Interactions [5.481575506447599]
メンタルヘルスは世界的な懸念が高まり、AIによる精神社会的支援へのアクセス拡大への関心を喚起している。
LLMは、特にリアルタイム、テキストベースのインタラクションにおいて、ピアサポートインタラクションを強化する新たな機会を提供する。
我々は、LLMシミュレーションされた苦難クライアント、文脈に敏感なLLM生成提案、リアルタイム感情可視化を備えたAI支援システムを提案し、評価する。
論文 参考訳(メタデータ) (2025-06-11T03:06:41Z) - Silence is Not Consensus: Disrupting Agreement Bias in Multi-Agent LLMs via Catfish Agent for Clinical Decision Making [80.94208848596215]
提案する概念は「Catfish Agent」である。これは、構造的不満を注入し、無声な合意に反するように設計された役割特化LDMである。
組織心理学において「ナマズ・エフェクト」にインスパイアされたカマズ・エージェントは、より深い推論を促進するために、新たなコンセンサスに挑戦するように設計されている。
論文 参考訳(メタデータ) (2025-05-27T17:59:50Z) - Ψ-Arena: Interactive Assessment and Optimization of LLM-based Psychological Counselors with Tripartite Feedback [51.26493826461026]
大規模言語モデル(LLM)の総合的評価と最適化のための対話型フレームワークであるPsi-Arenaを提案する。
アリーナは、心理学的にプロファイルされたNPCクライアントとの多段階対話を通じて現実世界のカウンセリングをシミュレートする現実的なアリーナ相互作用を特徴としている。
8つの最先端のLLM実験は、異なる実世界のシナリオと評価の観点で大きなパフォーマンス変化を示す。
論文 参考訳(メタデータ) (2025-05-06T08:22:51Z) - MAGI: Multi-Agent Guided Interview for Psychiatric Assessment [50.6150986786028]
我々は,ゴールドスタンダードのMini International Neuropsychiatric Interview(MINI)を自動計算ナビゲーションに変換する最初のフレームワークであるMAGIを紹介する。
臨床検査法, 会話適応性, 説明可能な推論を併用することにより, MAGI は LLM 支援型メンタルヘルスアセスメントを推し進めることを示す。
論文 参考訳(メタデータ) (2025-04-25T11:08:27Z) - CAMI: A Counselor Agent Supporting Motivational Interviewing through State Inference and Topic Exploration [41.03565985067749]
本稿では、モチベーション・インタビュー(MI)に基づく新しいカウンセラーエージェントCAMIを紹介する。
我々はCAMIの性能を自動評価と手動評価の両方で評価する。
その結果、CAMIは最先端の手法に勝るだけでなく、より現実的なカウンセラー的な行動を示すことがわかった。
論文 参考訳(メタデータ) (2025-02-05T01:09:09Z) - AgentBoard: An Analytical Evaluation Board of Multi-turn LLM Agents [74.16170899755281]
本稿では,LLMエージェントの分析的評価に適したオープンソース評価フレームワークであるAgentBoardを紹介する。
AgentBoardは、インクリメンタルな進歩と包括的な評価ツールキットをキャプチャする、きめ細かい進捗率のメトリクスを提供する。
これはLLMエージェントの能力と限界に光を当てるだけでなく、その性能の解釈可能性も最前線に広める。
論文 参考訳(メタデータ) (2024-01-24T01:51:00Z) - Online Decision Mediation [72.80902932543474]
意思決定支援アシスタントを学習し、(好奇心)専門家の行動と(不完全)人間の行動の仲介役として機能することを検討する。
臨床診断では、完全に自律的な機械行動は倫理的余裕を超えることが多い。
論文 参考訳(メタデータ) (2023-10-28T05:59:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。