論文の概要: Learning When to Ask: Simulation-Trained Humanoids for Mental-Health Diagnosis
- arxiv url: http://arxiv.org/abs/2512.08952v1
- Date: Fri, 28 Nov 2025 01:09:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-15 04:16:52.565486
- Title: Learning When to Ask: Simulation-Trained Humanoids for Mental-Health Diagnosis
- Title(参考訳): メンタルヘルス診断のためのシミュレーション学習型ヒューマノイド
- Authors: Filippo Cenacchi, Deborah Richards, Longbing Cao,
- Abstract要約: ユーザとのヒューマノイドロボットのテストは遅く、摩耗、限界、多様性の原因となっている。
テストエージェントは、会話のタイミング、韻律、バックチャネル、そして抑うつとPTSDのための顔とスピーチに何を出席すべきかをマスターする必要があります。
我々はヒューマノイドをハードウェアの負担なしに訓練するための会話エージェントとして仮想化する。
- 参考スコア(独自算出の注目度): 26.208414155165432
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Testing humanoid robots with users is slow, causes wear, and limits iteration and diversity. Yet screening agents must master conversational timing, prosody, backchannels, and what to attend to in faces and speech for Depression and PTSD. Most simulators omit policy learning with nonverbal dynamics; many controllers chase task accuracy while underweighting trust, pacing, and rapport. We virtualise the humanoid as a conversational agent to train without hardware burden. Our agent-centred, simulation-first pipeline turns interview data into 276 Unreal Engine MetaHuman patients with synchronised speech, gaze/face, and head-torso poses, plus PHQ-8 and PCL-C flows. A perception-fusion-policy loop decides what and when to speak, when to backchannel, and how to avoid interruptions, under a safety shield. Training uses counterfactual replay (bounded nonverbal perturbations) and an uncertainty-aware turn manager that probes to reduce diagnostic ambiguity. Results are simulation-only; the humanoid is the transfer target. In comparing three controllers, a custom TD3 (Twin Delayed DDPG) outperformed PPO and CEM, achieving near-ceiling coverage with steadier pace at comparable rewards. Decision-quality analyses show negligible turn overlap, aligned cut timing, fewer clarification prompts, and shorter waits. Performance stays stable under modality dropout and a renderer swap, and rankings hold on a held-out patient split. Contributions: (1) an agent-centred simulator that turns interviews into 276 interactive patients with bounded nonverbal counterfactuals; (2) a safe learning loop that treats timing and rapport as first-class control variables; (3) a comparative study (TD3 vs PPO/CEM) with clear gains in completeness and social timing; and (4) ablations and robustness analyses explaining the gains and enabling clinician-supervised humanoid pilots.
- Abstract(参考訳): ユーザとのヒューマノイドロボットのテストは遅く、摩耗を引き起こし、イテレーションと多様性を制限する。
しかし、スクリーニングエージェントは、会話のタイミング、韻律、バックチャネル、そして抑うつとPTSDのための顔とスピーチに何を出席すべきかをマスターする必要があります。
ほとんどのシミュレータは、非言語力学によるポリシー学習を省略し、多くのコントローラは、信頼、ペーシング、ラポートを過小評価しながらタスクの精度を追求する。
我々はヒューマノイドをハードウェアの負担なしに訓練するための会話エージェントとして仮想化する。
私たちのエージェント中心のシミュレーションファーストパイプラインは、インタビューデータを276人のUnreal Engine MetaHuman患者に変換します。
知覚融合政治ループは、いつ、いつ、いつ、いつ、いつ、割り込みを避けるか、安全シールドの下で決定する。
トレーニングには、反事実的リプレイ(バウンドな非言語的摂動)と、診断の曖昧さを軽減するために調査を行う不確実性を認識したターンマネージャを使用する。
結果はシミュレーションのみであり、ヒューマノイドは転送対象である。
3つのコントローラを比較すると、カスタムのTD3(Twin Delayed DDPG)はPPOとCEMより優れており、同等の報酬でより安定したペースでほぼシーリングのカバレッジを達成した。
決定品質分析では、無視可能なターンオーバーラップ、整列タイミング、明確化プロンプトの削減、待ち時間の短縮が示されている。
パフォーマンスは、モダリティのドロップアウトとレンダラースワップの下で安定し、ランキングは保留の患者分割で保持される。
コントリビューション:(1)対話型276名の非言語障害患者にインタビューを変換するエージェント中心シミュレータ、(2)タイミングとラプポートを第一級制御変数として扱う安全な学習ループ、(3)完全性と社会的タイミングの明確な利得を有する比較研究(TD3対PPO/CEM)、(4)利得を説明し、臨床医が指導するヒューマノイドパイロットを実現するための説明と堅牢性。
関連論文リスト
- Consistently Simulating Human Personas with Multi-Turn Reinforcement Learning [52.07170679746533]
大規模言語モデル(LLM)は、セラピー、教育、社会的役割プレイといったインタラクティブな環境において、人間のユーザをシミュレートするためにますます使われています。
LLM生成対話におけるペルソナの一貫性の評価と改善のための統一的なフレームワークを提案する。
我々は3つの自動メトリクス、即行一貫性、行間一貫性、Q&A一貫性を定義し、異なるタイプのペルソナドリフトをキャプチャし、それぞれが人間のアノテーションに対して検証する。
論文 参考訳(メタデータ) (2025-10-31T19:40:41Z) - Impatient Users Confuse AI Agents: High-fidelity Simulations of Human Traits for Testing Agents [58.00130492861884]
TraitBasisは、AIエージェントを体系的にストレステストするための軽量でモデルに依存しない方法である。
TraitBasisは、ステアブルなユーザ特性に対応するアクティベーション空間で方向を学習する。
We observed on average a 2%-30% performance degradation on $tau$-Trait across frontier model。
論文 参考訳(メタデータ) (2025-10-06T05:03:57Z) - Explainable AI for Collaborative Assessment of 2D/3D Registration Quality [50.65650507103078]
本稿では,2D/3D登録品質検証に特化して訓練された最初の人工知能フレームワークを提案する。
我々の説明可能なAI(XAI)アプローチは、人間のオペレーターに対する情報意思決定を強化することを目的としている。
論文 参考訳(メタデータ) (2025-07-23T15:28:57Z) - Combating Spatial Disorientation in a Dynamic Self-Stabilization Task Using AI Assistants [5.42300240053097]
空間的不整合は、致命的な航空機事故の主要な原因である。
本稿では、パイロットがバランスを維持し、回収不能な制御損失を防止できるAIエージェントの可能性について検討する。
論文 参考訳(メタデータ) (2024-09-09T21:06:22Z) - Social-Transmotion: Promptable Human Trajectory Prediction [65.80068316170613]
Social-Transmotionは、多種多様な視覚的手がかりを利用して人間の行動を予測する、汎用トランスフォーマーベースのモデルである。
提案手法は,JTA,JRDB,歩行者,道路交通のサイクリスト,ETH-UCYなど,複数のデータセットで検証されている。
論文 参考訳(メタデータ) (2023-12-26T18:56:49Z) - Estimating Motor Symptom Presence and Severity in Parkinson's Disease from Wrist Accelerometer Time Series using ROCKET and InceptionTime [4.1125736844411644]
InceptionTimeとRandOm Convolutional KErnel TransformをParkinsonの症状モニタリングに有効であるとして検討した。
InceptionTimeの高学習能力は複雑なムーブメントパターンのモデリングに適しており、ROCKETは小さなデータセットに適している。
以上の結果から, 震度とブラジキネジアの有無を適度に評価できるが, ジスキネジア検出の課題に遭遇する可能性が示唆された。
論文 参考訳(メタデータ) (2023-04-21T22:38:44Z) - Personalized One-Shot Lipreading for an ALS Patient [34.59007152584927]
単発例のみを用いてALS患者をリップレッドするパーソナライズされたネットワークを提案する。
変分に基づくドメイン適応手法は、実合成ドメインギャップを橋渡しするために用いられる。
本手法は, 患者に対する62.6%の方法と比較して, 83.2%の精度で高いトップ5の精度を実現している。
論文 参考訳(メタデータ) (2021-11-02T17:03:29Z) - Prediction of clinical tremor severity using Rank Consistent Ordinal
Regression [6.229890236114427]
36名の本態性震動患者から276本の臨床ビデオを用いて、ランク一貫性のある経口回帰を伴うディープニューラルネットワーク(DNN)を訓練します。
モデル予測は臨床評価ともよく一致している。
その結果、トレーニングしたモデルが震えの深刻度を評価し追跡する手段として使用できることがわかった。
論文 参考訳(メタデータ) (2021-05-03T19:22:05Z) - AutoHR: A Strong End-to-end Baseline for Remote Heart Rate Measurement
with Neural Searching [76.4844593082362]
既存のエンド・ツー・エンドのネットワークが難易度が低い理由を考察し,アーキテクチャ・サーチ(NAS)を用いたリモートHR計測のための強力なベースラインを確立する。
総合的な実験は、時間内テストとクロスデータセットテストの両方で3つのベンチマークデータセットで実施される。
論文 参考訳(メタデータ) (2020-04-26T05:43:21Z) - On the interaction between supervision and self-play in emergent
communication [82.290338507106]
本研究は,2つのカテゴリの学習信号と,サンプル効率の向上を目標とする学習信号の関係について検討する。
人間のデータに基づく教師付き学習による初等訓練エージェントが,自己演奏が会話に優れていることが判明した。
論文 参考訳(メタデータ) (2020-02-04T02:35:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。