Fugu-MT 論文翻訳(概要): Learning-Based Strategy Design for Robot-Assisted Reminiscence Therapy Based on a Developed Model for People with Dementia

論文の概要: Learning-Based Strategy Design for Robot-Assisted Reminiscence Therapy Based on a Developed Model for People with Dementia

arxiv url: http://arxiv.org/abs/2109.02194v1
Date: Mon, 6 Sep 2021 00:45:31 GMT
ステータス: 翻訳完了
システム内更新日: 2021-09-07 16:26:07.502989
Title: Learning-Based Strategy Design for Robot-Assisted Reminiscence Therapy Based on a Developed Model for People with Dementia
Title（参考訳）: 認知症者のための発達モデルに基づくロボット支援想起療法の学習に基づく戦略設計
Authors: Fengpei Yuan, Ran Zhang, Dania Bilal and Xiaopeng Zhao
Abstract要約: 認知症(PwDs)に対する精神社会的介入として、ロボット支援型反省療法(RT)が研究されている。我々は,PwDを刺激する学習を通じて,ロボットの会話戦略を目指す。
参考スコア（独自算出の注目度）: 2.453923815224908
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In this paper, the robot-assisted Reminiscence Therapy (RT) is studied as a psychosocial intervention to persons with dementia (PwDs). We aim at a conversation strategy for the robot by reinforcement learning to stimulate the PwD to talk. Specifically, to characterize the stochastic reactions of a PwD to the robot's actions, a simulation model of a PwD is developed which features the transition probabilities among different PwD states consisting of the response relevance, emotion levels and confusion conditions. A Q-learning (QL) algorithm is then designed to achieve the best conversation strategy for the robot. The objective is to stimulate the PwD to talk as much as possible while keeping the PwD's states as positive as possible. In certain conditions, the achieved strategy gives the PwD choices to continue or change the topic, or stop the conversation, so that the PwD has a sense of control to mitigate the conversation stress. To achieve this, the standard QL algorithm is revised to deliberately integrate the impact of PwD's choices into the Q-value updates. Finally, the simulation results demonstrate the learning convergence and validate the efficacy of the achieved strategy. Tests show that the strategy is capable to duly adjust the difficulty level of prompt according to the PwD's states, take actions (e.g., repeat or explain the prompt, or comfort) to help the PwD out of bad states, and allow the PwD to control the conversation tendency when bad states continue.
Abstract（参考訳）: 本稿では,認知症(PwDs)患者に対する心理社会的介入として,ロボット支援型反省療法(RT)について検討する。本研究では,PwDを刺激する強化学習によるロボットの会話戦略を提案する。具体的には、ロボットの動作に対するPwDの確率的反応を特徴付けるために、応答関係、感情レベル、混乱状態からなる異なるPwD状態間の遷移確率を特徴付けるPwDのシミュレーションモデルを開発した。そして、ロボットの最適な会話戦略を達成するためにq-learning(ql)アルゴリズムが設計される。目的は、PwDの状態をできるだけ肯定的に保ちながら、PwDができるだけ話すように刺激することである。ある条件下では、達成された戦略は、PwDがトピックを継続または変更するか、あるいは会話を止めるかの選択を与えるので、PwDは会話のストレスを軽減するための制御の感覚を持つ。これを実現するため、標準のQLアルゴリズムが改訂され、PwDの選択の影響をQ値更新に意図的に統合する。最後に,シミュレーションにより,学習の収束を実証し,達成した戦略の有効性を検証する。テストの結果、PwDの状態に応じてプロンプトの難易度を的確に調整し、悪い状態からPwDを助けるためのアクション(例えば、プロンプトの繰り返しや説明、快適さ)を採り、悪い状態が続くときにPwDが会話の傾向を制御できるようにする。

関連論文リスト

Learning Affordances at Inference-Time for Vision-Language-Action Models [50.93181349331096]
ロボット工学において、VLA(Vision-Language-Action Model)は複雑な制御タスクを解くための有望な道を提供する。本稿では,VLAの低レベルポリシーを過去の経験を条件とした高レベルVLMに接続するLITEN(Learning from Inference-Time Execution)を紹介する。提案手法は,低レベルVLAの計画の生成と実行を行う推論フェーズと,その結果を反映した評価フェーズとを反復する。
論文参考訳（メタデータ） (2025-10-22T16:43:29Z)
Mitigating Harmful Erraticism in LLMs Through Dialectical Behavior Therapy Based De-Escalation Strategies [0.0]
本稿では、人間の心理的原理、特に治療的モダリティに根ざした枠組みが、より堅牢で持続可能なソリューションを提供することができると仮定する。人間の脳を模倣するAIのシミュレーションニューラルネットワークに類似して、弁証行動療法(DBT)の原則を適用することを提案する。
論文参考訳（メタデータ） (2025-09-06T11:20:15Z)
SAGE: Steering and Refining Dialog Generation with State-Action Augmentation [9.95917154889491]
本稿では,潜時変数を用いた対話生成における長時間水平動作を制御するSAGEという新しい手法を提案する。我々の手法の中核は、標準言語モデルの微調整を強化したState-Action Chain (SAC) である。このアプローチでトレーニングされたモデルでは、感情的インテリジェンスメトリクスのパフォーマンスが向上していることを示す。
論文参考訳（メタデータ） (2025-03-04T22:45:24Z)
ChatWise: A Strategy-Guided Chatbot for Enhancing Cognitive Support in Older Adults [38.064067293831066]
戦略誘導型AIチャットボットChatWiseを提案する。マクロレベルの戦略計画とマイクロレベルの発話生成を統合し、高齢者向けに調整された多ターン対話を可能にする。
論文参考訳（メタデータ） (2025-02-19T21:32:09Z)
Interactive Dialogue Agents via Reinforcement Learning on Hindsight Regenerations [58.65755268815283]
多くの実際の対話は対話的であり、つまりエージェントの発話が会話の相手に影響を与えるか、情報を引き出すか、意見を変えるかである。この事実を利用して、既存の最適データを書き直し、拡張し、オフライン強化学習(RL)を介してトレーニングする。実際の人間によるユーザ調査の結果、我々のアプローチは既存の最先端の対話エージェントを大きく上回っていることがわかった。
論文参考訳（メタデータ） (2024-11-07T21:37:51Z)
Prompt Engineering a Schizophrenia Chatbot: Utilizing a Multi-Agent Approach for Enhanced Compliance with Prompt Instructions [0.0699049312989311]
統合失調症の患者は、しばしば認知障害を伴い、自分の状態について学ぶ能力を妨げることがある。大規模言語モデル(LLM)は、トピックのメンタルヘルス情報をよりアクセシビリティとエンゲージメントを高める可能性を秘めているが、それらのブラックボックスの性質は倫理と安全に関する懸念を喚起する。
論文参考訳（メタデータ） (2024-10-10T09:49:24Z)
Dialogue Action Tokens: Steering Language Models in Goal-Directed Dialogue with a Multi-Turn Planner [51.77263363285369]
本稿では,対話行動トークンと呼ばれる言語モデルエージェントを用いて,目標指向の対話を計画する手法を提案する。中心となる考え方は、各発話をアクションとして扱うことで、強化学習のような既存のアプローチを適用することができるゲームに対話を変換することである。
論文参考訳（メタデータ） (2024-06-17T18:01:32Z)
Social Motion Prediction with Cognitive Hierarchies [19.71780279070757]
我々は新しいベンチマーク、新しい定式化、認知に触発されたフレームワークを紹介する。 We present Wusi, a 3D multi-person motion data under the context of team sports。戦略的社会的相互作用を予測するための認知階層構造を構築した。
論文参考訳（メタデータ） (2023-11-08T14:51:17Z)
Harnessing Large Language Models' Empathetic Response Generation Capabilities for Online Mental Health Counselling Support [1.9336815376402723]
大規模言語モデル(LLM)は、様々な情報検索や推論タスクで顕著なパフォーマンスを示している。本研究は,メンタルヘルスカウンセリング環境下での会話において,共感反応を誘発するLLMの能力について検討した。我々は、ジェネレーティブ・プレトレーニング(GPT)のバージョン3.5とバージョン4、Vicuna FastChat-T5、Pathways Language Model(PaLM)バージョン2、Falcon-7B-Instructの5つのLCMを選択した。
論文参考訳（メタデータ） (2023-10-12T03:33:06Z)
Reflective Linguistic Programming (RLP): A Stepping Stone in Socially-Aware AGI (SocialAGI) [0.0]
本稿では,自己認識と戦略的計画を重視した,会話型AIの独特なアプローチであるリフレクティブ言語プログラミング(RLP)を提案する。 RLPは、モデルに対して、事前に定義された性格特性、入ってくるメッセージに対する感情的な反応、計画された戦略をイントロスペクションすることを奨励し、コンテキスト的に豊かで、一貫性があり、活発な相互作用を可能にする。
論文参考訳（メタデータ） (2023-05-22T02:43:15Z)
Controllable Mixed-Initiative Dialogue Generation through Prompting [50.03458333265885]
混合開始対話タスクには、情報の繰り返し交換と会話制御が含まれる。エージェントは、ポリシープランナーが定める特定の対話意図や戦略に従う応答を生成することにより、コントロールを得る。標準的なアプローチは、これらの意図に基づいて生成条件を実行するために、訓練済みの言語モデルを微調整している。代わりに、条件生成の微調整に代えて、大きな言語モデルをドロップインで置き換えるように促します。
論文参考訳（メタデータ） (2023-05-06T23:11:25Z)
Achieving mouse-level strategic evasion performance using real-time computational planning [59.60094442546867]
計画とは、脳が想像し、予測可能な未来を成立させる特別な能力である。我々は,動物の生態が空間計画の価値をどのように支配するかという研究に基づいて,より効率的な生物学的に着想を得た計画アルゴリズムであるTLPPOを開発した。 TLPPOを用いたリアルタイムエージェントの性能とライブマウスの性能を比較し,ロボット捕食者を避けることを課題とする。
論文参考訳（メタデータ） (2022-11-04T18:34:36Z)
A Simulated Experiment to Explore Robotic Dialogue Strategies for People with Dementia [2.5412519393131974]
繰り返し質問の文脈におけるPwD-ロボット相互作用のための部分可観測マルコフ決定プロセス(POMDP)モデルを提案する。異なる認知能力と異なるエンゲージメントレベルを持つpwdに対する適応的会話戦略を学ぶためにq-learningを用いた。これは、PwDの繰り返し質問に対処するための会話型ソーシャルロボットの適用に向けた有用なステップかもしれません。
論文参考訳（メタデータ） (2021-04-18T19:35:19Z)
Evolutionary Stochastic Policy Distillation [139.54121001226451]
本稿では,GCRS課題を解決するための進化的政策蒸留法(ESPD)を提案する。 ESPDは、政策蒸留(PD)技術により、ターゲットポリシーを一連の変種から学習することを可能にする MuJoCo制御系に基づく実験により,提案手法の学習効率が向上した。
論文参考訳（メタデータ） (2020-04-27T16:19:25Z)
You Impress Me: Dialogue Generation via Mutual Persona Perception [62.89449096369027]
認知科学の研究は、理解が高品質なチャット会話に不可欠なシグナルであることを示唆している。そこで我々は,P2 Botを提案する。このP2 Botは,理解を明示的にモデル化することを目的とした送信機受信者ベースのフレームワークである。
論文参考訳（メタデータ） (2020-04-11T12:51:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。