論文の概要: CPEMH: An Agentic Framework for Prompt-Driven Behavior Evaluation and Assurance in Foundation-Model Systems for Mental Health Screening
- arxiv url: http://arxiv.org/abs/2605.11341v1
- Date: Mon, 11 May 2026 23:52:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.483533
- Title: CPEMH: An Agentic Framework for Prompt-Driven Behavior Evaluation and Assurance in Foundation-Model Systems for Mental Health Screening
- Title(参考訳): CPEMH:メンタルヘルススクリーニングのための基礎モデルシステムにおけるプロンプト駆動行動評価と保証のためのエージェントフレームワーク
- Authors: Giuliano Lorenzoni, Ivens Portugal, Paulo Alencar, Donald Cowan,
- Abstract要約: CPEMHは、大規模言語システムにおける行動保証のエンジニアリング方法論として機能する。
オーケストレータ、推論、評価エージェントを組み合わせたモジュラーエージェント設計により、トレーサビリティ、ロバスト性、ロバスト性はライフサイクルを通して保証される。
- 参考スコア(独自算出の注目度): 0.326654570054705
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents CPEMH, an agentic framework designed to evaluate prompt-driven behavior in foundation-model systems operating on transcript-based datasets for mental-health screening. CPEMH serves as an engineering methodology for behavioral assurance in large-scale language systems, introducing an orchestrated architecture that autonomously performs the design, evaluation, and selection of prompt strategies, enabling systematic control of behavioral variability across contexts. Its modular agentic design, combining orchestrator, inference, and evaluation agents, ensures traceability, reproducibility, and robustness throughout the prompting lifecycle. A case study on automated depression screening from interview transcripts demonstrates the framework's capacity to stabilize and audit foundation-model behavior in conversational and clinically sensitive domains. Lessons learned emphasize the role of modular orchestration in behavioral assurance, the prioritization of stability over architectural complexity, and the integration of F1, bias, and robustness as core acceptance criteria.
- Abstract(参考訳): 本稿では,心身検診のための転写ベースデータセットをベースとした基礎モデルシステムにおいて,迅速な行動評価を目的としたエージェントフレームワークCPEMHを提案する。
CPEMHは、大規模言語システムにおける行動保証のためのエンジニアリング方法論として機能し、設計、評価、迅速な戦略の選択を自律的に行うオーケストレーションアーキテクチャを導入し、コンテキスト間での行動変数の体系的な制御を可能にする。
オーケストレータ、推論、評価エージェントを組み合わせたモジュール型のエージェント設計により、トレーサビリティ、再現性、ロバスト性はライフサイクルを通じて保証される。
面接書からの自動うつ病スクリーニングのケーススタディは、会話や臨床的に敏感な領域における基礎モデル行動の安定化と監査能力を示す。
学んだ教訓は、振る舞い保証におけるモジュラーオーケストレーションの役割、アーキテクチャの複雑さよりも安定性を優先すること、コア受け入れ基準としてのF1、バイアス、ロバストネスの統合を強調した。
関連論文リスト
- From Black-Box Confidence to Measurable Trust in Clinical AI: A Framework for Evidence, Supervision, and Staged Autonomy [0.0]
臨床人工知能(AI)の信頼度は、精度、生成の頻度、全体的な肯定的なユーザ印象のモデル化に還元できない。
本稿では、エビデンス、監督、ステージド自律性という3つの原則に基づいて構築された、信頼できる臨床AIのためのフレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-29T13:40:14Z) - A Safety-Aware Role-Orchestrated Multi-Agent LLM Framework for Behavioral Health Communication Simulation [0.0]
単一エージェント大規模言語モデル(LLM)システムは、多様な会話機能をサポートし、行動保健コミュニケーションにおける安全性を維持するのに苦労する。
本稿では, 協調型, 役割分化型エージェントによる支援行動保健対話をシミュレートするための, 安全に配慮したマルチエージェントLLMフレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-31T21:21:31Z) - Toward Clinically Ready Foundation Models in Medical Image Analysis: Adaptation Mechanisms and Deployment Trade-offs [4.332241609032423]
医療画像分析(MIA)におけるFM適応のための戦略中心のフレームワークについて紹介する。
我々は、適応を事前訓練後の介入として概念化し、既存のアプローチを5つのメカニズムにまとめる。
各メカニズムについて、適応深さ、ラベル効率、ドメインの堅牢性、計算コスト、監査可能性、規制負担のトレードオフを分析する。
論文 参考訳(メタデータ) (2026-03-15T08:04:58Z) - SoK: Agentic Retrieval-Augmented Generation (RAG): Taxonomy, Architectures, Evaluation, and Research Directions [0.0]
本稿では、これらの自律システムを理解するための最初の統一されたフレームワークを提供する。
エージェント検索生成ループを有限水平部分観測可能なマルコフ決定過程として定式化する。
本研究は,幻覚伝播の複合化,メモリ中毒,検索ミスアライメント,カスケードツール実行脆弱性など,自律ループに固有の重篤なシステムリスクを同定する。
論文 参考訳(メタデータ) (2026-03-07T23:38:57Z) - QCAgent: An agentic framework for quality-controllable pathology report generation from whole slide image [44.81983055985989]
QCAgentは、全スライディング画像(WSI)から品質制御可能な病態レポートを生成するためのエージェントフレームワークである
必要な診断の詳細と制約を指定するユーザ定義のチェックリストによってガイドされる、カスタマイズされた批評メカニズムが組み込まれている。
批判的フィードバックとテキストパッチによるセマンティック検索に基づいて、WSI内の情報領域を再同定する。
論文 参考訳(メタデータ) (2026-03-02T09:27:31Z) - TRACE: Temporal Reasoning via Agentic Context Evolution for Streaming Electronic Health Records (EHRs) [7.2159153945746795]
LLM(Large Language Models)は、広範囲にわたる医学的知識を符号化するが、縦断的患者の軌跡に確実に適用することは困難である。
凍結LDMによる時間的臨床推論を可能にするフレームワークであるTRACEを紹介する。
MIMIC-IVによる縦断的臨床イベントストリームの評価
論文 参考訳(メタデータ) (2026-02-13T11:39:19Z) - Technical Report: Facilitating the Adoption of Causal Inference Methods Through LLM-Empowered Co-Pilot [44.336297829718795]
CATE-Bは,大規模言語モデル(LLM)をエージェントフレームワーク内で使用して,治療効果推定を通じてユーザを誘導する,オープンソースのコパイロットシステムである。
CATE-B は (i) 因果発見と LLM に基づくエッジオリエンテーションによる構造因果モデルの構築、 (ii) 因果構造とデータセット特性に適合した適切な回帰方法を選択することによるロバストな調整セットの同定を支援する。
論文 参考訳(メタデータ) (2025-08-14T12:20:51Z) - A Comprehensive Survey of Self-Evolving AI Agents: A New Paradigm Bridging Foundation Models and Lifelong Agentic Systems [53.37728204835912]
既存のAIシステムは、デプロイ後も静的な手作業による構成に依存している。
近年,インタラクションデータと環境フィードバックに基づいてエージェントシステムを自動拡張するエージェント進化手法が研究されている。
この調査は、自己進化型AIエージェントの体系的な理解を研究者や実践者に提供することを目的としている。
論文 参考訳(メタデータ) (2025-08-10T16:07:32Z) - A Survey on Autonomy-Induced Security Risks in Large Model-Based Agents [45.53643260046778]
大規模言語モデル(LLM)の最近の進歩は、自律型AIエージェントの台頭を触媒している。
これらの大きなモデルエージェントは、静的推論システムからインタラクティブなメモリ拡張エンティティへのパラダイムシフトを示す。
論文 参考訳(メタデータ) (2025-06-30T13:34:34Z) - Quantifying Robustness: A Benchmarking Framework for Deep Learning Forecasting in Cyber-Physical Systems [44.61435605872856]
我々は,産業用CPSに合わせて,分散ロバスト性に基づく実用的ロバスト性定義を導入する。
本フレームワークは,センサドリフト,ノイズ,不規則サンプリングなどの現実的な乱れをシミュレートし,予測モデルの徹底的なロバスト性解析を可能にする。
論文 参考訳(メタデータ) (2025-04-04T14:50:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。