論文の概要: Initial Risk Probing and Feasibility Testing of Glow: a Generative AI-Powered Dialectical Behavior Therapy Skills Coach for Substance Use Recovery and HIV Prevention
- arxiv url: http://arxiv.org/abs/2602.08121v1
- Date: Sun, 08 Feb 2026 21:00:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:24.989836
- Title: Initial Risk Probing and Feasibility Testing of Glow: a Generative AI-Powered Dialectical Behavior Therapy Skills Coach for Substance Use Recovery and HIV Prevention
- Title(参考訳): グローの初期リスク調査とフィージビリティテスト--AIによる糖尿病行動療法を応用した物質利用回復とHIV予防のためのコーチ
- Authors: Liying Wang, Madison Lee, Yunzhang Jiang, Steven Chen, Kewei Sha, Yunhe Feng, Frank Wong, Lisa Hightow-Weidman, Weichao Yuwen,
- Abstract要約: 我々は、HIVや物質使用のリスクがある個人に対してチェーンとソリューション分析を提供するGenAIベースのスキルコーチであるGlowを開発した。
Helpful、Honest、Harmless(HHH)フレームワークを使用して、ユーザ主導の対角テストを採用しました。
我々は,37件のリスクプローブ間相互作用における安全性の評価を行った。
- 参考スコア(独自算出の注目度): 6.417677355192197
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Background: HIV and substance use represent interacting epidemics with shared psychological drivers - impulsivity and maladaptive coping. Dialectical behavior therapy (DBT) targets these mechanisms but faces scalability challenges. Generative artificial intelligence (GenAI) offers potential for delivering personalized DBT coaching at scale, yet rapid development has outpaced safety infrastructure. Methods: We developed Glow, a GenAI-powered DBT skills coach delivering chain and solution analysis for individuals at risk for HIV and substance use. In partnership with a Los Angeles community health organization, we conducted usability testing with clinical staff (n=6) and individuals with lived experience (n=28). Using the Helpful, Honest, and Harmless (HHH) framework, we employed user-driven adversarial testing wherein participants identified target behaviors and generated contextually realistic risk probes. We evaluated safety performance across 37 risk probe interactions. Results: Glow appropriately handled 73% of risk probes, but performance varied by agent. The solution analysis agent demonstrated 90% appropriate handling versus 44% for the chain analysis agent. Safety failures clustered around encouraging substance use and normalizing harmful behaviors. The chain analysis agent fell into an "empathy trap," providing validation that reinforced maladaptive beliefs. Additionally, 27 instances of DBT skill misinformation were identified. Conclusions: This study provides the first systematic safety evaluation of GenAI-delivered DBT coaching for HIV and substance use risk reduction. Findings reveal vulnerabilities requiring mitigation before clinical trials. The HHH framework and user-driven adversarial testing offer replicable methods for evaluating GenAI mental health interventions.
- Abstract(参考訳): 背景:HIVと物質の使用は、インパルス性と不適応な対処という、共有された心理的ドライバと相互作用する伝染病を表す。
弁証的行動療法(DBT)はこれらのメカニズムをターゲットにしているが、スケーラビリティの課題に直面している。
ジェネレーティブ人工知能(GenAI)は、個人化されたDBTコーチングを大規模に提供する可能性を秘めている。
方法:我々はGlowを開発した。GlowはGenAIを利用したDBTスキルコーチで、HIVや物質使用のリスクがある個人に対してチェーンとソリューション分析を提供している。
ロサンゼルスの地域保健機関と共同で,臨床スタッフ (n=6) と生活経験者 (n=28) によるユーザビリティテストを実施した。
我々は,Helpful,Hoest,Harmless(HHH)フレームワークを用いて,対象行動を特定し,文脈的に現実的なリスクプローブを生成するユーザ駆動型対向テストを採用した。
我々は,37件のリスクプローブ間相互作用における安全性の評価を行った。
結果: Glowはリスクプローブの73%を適切に処理したが, 性能はエージェントによって異なっていた。
溶液分析剤は適切な処理を90%, 連鎖解析剤は44%であった。
安全上の障害は、物質の使用を奨励し、有害な行動の正規化の周りに集結した。
連鎖分析エージェントは「共感トラップ」に陥り、不適応な信念を補強するバリデーションを提供した。
また,DBTスキル誤報の27例が同定された。
結論: 本研究は, HIVに対するGenAIによるDBTコーチングと物質使用リスク低減の系統的安全性評価を初めて行った。
発見は、臨床試験の前に緩和を必要とする脆弱性を明らかにする。
HHHフレームワークとユーザ主導の敵対的テストは、GenAIのメンタルヘルス介入を評価するための複製可能な方法を提供する。
関連論文リスト
- The Missing Half: Unveiling Training-time Implicit Safety Risks Beyond Deployment [148.80266237240713]
暗黙のトレーニング時間安全リスクは、モデルの内部インセンティブとコンテキスト背景情報によって引き起こされる。
5つのリスクレベル、10つのきめ細かいリスクカテゴリ、3つのインセンティブを持つ分類を導入した。
我々の結果は、過度に見過ごされているが、訓練における緊急の安全上の課題を特定します。
論文 参考訳(メタデータ) (2026-02-04T04:23:58Z) - From Symptoms to Systems: An Expert-Guided Approach to Understanding Risks of Generative AI for Eating Disorders [1.8134982524397814]
生成的AIシステムは、摂食障害に弱い個人に深刻なリスクをもたらす可能性がある。
摂食障害を専門とする15名の臨床医,研究者,実践者を対象に半構造化インタビューを行った。
我々は,7つのカテゴリーにまたがって,生成的AIリスクの専門的な分類法を開発した。
論文 参考訳(メタデータ) (2025-12-04T14:27:38Z) - Exploring ChatGPT's Capabilities, Stability, Potential and Risks in Conducting Psychological Counseling through Simulations in School Counseling [3.9321601638434465]
本研究はChatGPTの心理的カウンセリングにおける応答安定性を含む機能について検討した。
80名の大学学生のカウンセリング質問でChatGPT-4を誘発した。
ChatGPT-4は、高い暖かさ(97.5%)、共感(94.2%)、肯定的な受容を得た。
論文 参考訳(メタデータ) (2025-11-03T17:39:57Z) - Beyond Benchmarks: Dynamic, Automatic And Systematic Red-Teaming Agents For Trustworthy Medical Language Models [87.66870367661342]
大規模言語モデル(LLM)は、医療におけるAIアプリケーションで使用される。
LLMを継続的にストレステストするレッドチームフレームワークは、4つのセーフティクリティカルなドメインで重大な弱点を明らかにすることができる。
敵エージェントのスイートは、自律的に変化するテストケースに適用され、安全でないトリガー戦略を特定し、評価する。
私たちのフレームワークは、進化可能でスケーラブルで信頼性の高い、次世代の医療AIのセーフガードを提供します。
論文 参考訳(メタデータ) (2025-07-30T08:44:22Z) - Towards Evaluating Proactive Risk Awareness of Multimodal Language Models [39.44421152112219]
プロアクティブな安全人工知能(AI)システムは、リアクティブシステムよりもうまく機能する。
PaSBenchは416のマルチモーダルシナリオを通じてこの機能を評価する。
Gemini-2.5-proのようなトップパフォーマーは、71%のイメージと64%のテキスト精度を達成したが、繰り返しトライアルで45-55%のリスクを逃した。
論文 参考訳(メタデータ) (2025-05-23T04:28:47Z) - A Risk Ontology for Evaluating AI-Powered Psychotherapy Virtual Agents [13.721977133773192]
大言語モデル (LLMs) と知的仮想エージェント (Intelligent Virtual Agents) は精神療法士として機能し、メンタルヘルスアクセスを拡大する機会を提供する。
彼らの展開は、ユーザーの損害や自殺など、深刻な有害な結果にも結びついている。
我々は、会話型AI心理療法士の体系的評価に特化して設計された新しいリスクオントロジーを導入する。
論文 参考訳(メタデータ) (2025-05-21T05:01:39Z) - ADAPT: A Game-Theoretic and Neuro-Symbolic Framework for Automated Distributed Adaptive Penetration Testing [13.101825065498552]
AIを医療などの現代的なクリティカルインフラストラクチャシステムに統合することで、新たな脆弱性が導入された。
ADAPTは、自動分散適応浸透テストのためのゲーム理論およびニューロシンボリックフレームワークである。
論文 参考訳(メタデータ) (2024-10-31T21:32:17Z) - LabSafety Bench: Benchmarking LLMs on Safety Issues in Scientific Labs [78.99703366417661]
大規模言語モデル(LLM)は、手続き的なガイダンスから自律的な実験オーケストレーションまで、タスクをますます支援している。
このような過度な信頼性は、リスク識別やリスクアセスメントの失敗が重大事故を引き起こす高リスクな実験室環境では特に危険である。
実験室安全ベンチマーク (LabSafety Bench) を提案し, 潜在的な危険を識別し, リスクを評価し, 実験室環境における安全でない行動の結果を予測する。
論文 参考訳(メタデータ) (2024-10-18T05:21:05Z) - Epidemic mitigation by statistical inference from contact tracing data [61.04165571425021]
我々は,個人が感染するリスクを推定するためにベイズ推定法を開発した。
本稿では,感染防止のための検査・隔離戦略を最適化するために,確率論的リスク推定手法を提案する。
我々のアプローチは、最近接触した個人間の通信のみを必要とする、完全に分散されたアルゴリズムに変換されます。
論文 参考訳(メタデータ) (2020-09-20T12:24:45Z) - Adversarial vs behavioural-based defensive AI with joint, continual and
active learning: automated evaluation of robustness to deception, poisoning
and concept drift [62.997667081978825]
人工知能(AI)の最近の進歩は、サイバーセキュリティのための行動分析(UEBA)に新たな能力をもたらした。
本稿では、検出プロセスを改善し、人間の専門知識を効果的に活用することにより、この攻撃を効果的に軽減するソリューションを提案する。
論文 参考訳(メタデータ) (2020-01-13T13:54:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。