論文の概要: Learning-Based Strategy Design for Robot-Assisted Reminiscence Therapy
Based on a Developed Model for People with Dementia
- arxiv url: http://arxiv.org/abs/2109.02194v1
- Date: Mon, 6 Sep 2021 00:45:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-07 16:26:07.502989
- Title: Learning-Based Strategy Design for Robot-Assisted Reminiscence Therapy
Based on a Developed Model for People with Dementia
- Title(参考訳): 認知症者のための発達モデルに基づくロボット支援想起療法の学習に基づく戦略設計
- Authors: Fengpei Yuan, Ran Zhang, Dania Bilal and Xiaopeng Zhao
- Abstract要約: 認知症(PwDs)に対する精神社会的介入として、ロボット支援型反省療法(RT)が研究されている。
我々は,PwDを刺激する学習を通じて,ロボットの会話戦略を目指す。
- 参考スコア(独自算出の注目度): 2.453923815224908
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, the robot-assisted Reminiscence Therapy (RT) is studied as a
psychosocial intervention to persons with dementia (PwDs). We aim at a
conversation strategy for the robot by reinforcement learning to stimulate the
PwD to talk. Specifically, to characterize the stochastic reactions of a PwD to
the robot's actions, a simulation model of a PwD is developed which features
the transition probabilities among different PwD states consisting of the
response relevance, emotion levels and confusion conditions. A Q-learning (QL)
algorithm is then designed to achieve the best conversation strategy for the
robot. The objective is to stimulate the PwD to talk as much as possible while
keeping the PwD's states as positive as possible. In certain conditions, the
achieved strategy gives the PwD choices to continue or change the topic, or
stop the conversation, so that the PwD has a sense of control to mitigate the
conversation stress. To achieve this, the standard QL algorithm is revised to
deliberately integrate the impact of PwD's choices into the Q-value updates.
Finally, the simulation results demonstrate the learning convergence and
validate the efficacy of the achieved strategy. Tests show that the strategy is
capable to duly adjust the difficulty level of prompt according to the PwD's
states, take actions (e.g., repeat or explain the prompt, or comfort) to help
the PwD out of bad states, and allow the PwD to control the conversation
tendency when bad states continue.
- Abstract(参考訳): 本稿では,認知症(PwDs)患者に対する心理社会的介入として,ロボット支援型反省療法(RT)について検討する。
本研究では,PwDを刺激する強化学習によるロボットの会話戦略を提案する。
具体的には、ロボットの動作に対するPwDの確率的反応を特徴付けるために、応答関係、感情レベル、混乱状態からなる異なるPwD状態間の遷移確率を特徴付けるPwDのシミュレーションモデルを開発した。
そして、ロボットの最適な会話戦略を達成するためにq-learning(ql)アルゴリズムが設計される。
目的は、PwDの状態をできるだけ肯定的に保ちながら、PwDができるだけ話すように刺激することである。
ある条件下では、達成された戦略は、PwDがトピックを継続または変更するか、あるいは会話を止めるかの選択を与えるので、PwDは会話のストレスを軽減するための制御の感覚を持つ。
これを実現するため、標準のQLアルゴリズムが改訂され、PwDの選択の影響をQ値更新に意図的に統合する。
最後に,シミュレーションにより,学習の収束を実証し,達成した戦略の有効性を検証する。
テストの結果、PwDの状態に応じてプロンプトの難易度を的確に調整し、悪い状態からPwDを助けるためのアクション(例えば、プロンプトの繰り返しや説明、快適さ)を採り、悪い状態が続くときにPwDが会話の傾向を制御できるようにする。
関連論文リスト
- Interactive Dialogue Agents via Reinforcement Learning on Hindsight Regenerations [58.65755268815283]
多くの実際の対話は対話的であり、つまりエージェントの発話が会話の相手に影響を与えるか、情報を引き出すか、意見を変えるかである。
この事実を利用して、既存の最適データを書き直し、拡張し、オフライン強化学習(RL)を介してトレーニングする。
実際の人間によるユーザ調査の結果、我々のアプローチは既存の最先端の対話エージェントを大きく上回っていることがわかった。
論文 参考訳(メタデータ) (2024-11-07T21:37:51Z) - Prompt Engineering a Schizophrenia Chatbot: Utilizing a Multi-Agent Approach for Enhanced Compliance with Prompt Instructions [0.0699049312989311]
統合失調症の患者は、しばしば認知障害を伴い、自分の状態について学ぶ能力を妨げることがある。
大規模言語モデル(LLM)は、トピックのメンタルヘルス情報をよりアクセシビリティとエンゲージメントを高める可能性を秘めているが、それらのブラックボックスの性質は倫理と安全に関する懸念を喚起する。
論文 参考訳(メタデータ) (2024-10-10T09:49:24Z) - Dialogue Action Tokens: Steering Language Models in Goal-Directed Dialogue with a Multi-Turn Planner [51.77263363285369]
本稿では,対話行動トークンと呼ばれる言語モデルエージェントを用いて,目標指向の対話を計画する手法を提案する。
中心となる考え方は、各発話をアクションとして扱うことで、強化学習のような既存のアプローチを適用することができるゲームに対話を変換することである。
論文 参考訳(メタデータ) (2024-06-17T18:01:32Z) - Social Motion Prediction with Cognitive Hierarchies [19.71780279070757]
我々は新しいベンチマーク、新しい定式化、認知に触発されたフレームワークを紹介する。
We present Wusi, a 3D multi-person motion data under the context of team sports。
戦略的社会的相互作用を予測するための認知階層構造を構築した。
論文 参考訳(メタデータ) (2023-11-08T14:51:17Z) - Harnessing Large Language Models' Empathetic Response Generation
Capabilities for Online Mental Health Counselling Support [1.9336815376402723]
大規模言語モデル(LLM)は、様々な情報検索や推論タスクで顕著なパフォーマンスを示している。
本研究は,メンタルヘルスカウンセリング環境下での会話において,共感反応を誘発するLLMの能力について検討した。
我々は、ジェネレーティブ・プレトレーニング(GPT)のバージョン3.5とバージョン4、Vicuna FastChat-T5、Pathways Language Model(PaLM)バージョン2、Falcon-7B-Instructの5つのLCMを選択した。
論文 参考訳(メタデータ) (2023-10-12T03:33:06Z) - Reflective Linguistic Programming (RLP): A Stepping Stone in
Socially-Aware AGI (SocialAGI) [0.0]
本稿では,自己認識と戦略的計画を重視した,会話型AIの独特なアプローチであるリフレクティブ言語プログラミング(RLP)を提案する。
RLPは、モデルに対して、事前に定義された性格特性、入ってくるメッセージに対する感情的な反応、計画された戦略をイントロスペクションすることを奨励し、コンテキスト的に豊かで、一貫性があり、活発な相互作用を可能にする。
論文 参考訳(メタデータ) (2023-05-22T02:43:15Z) - Controllable Mixed-Initiative Dialogue Generation through Prompting [50.03458333265885]
混合開始対話タスクには、情報の繰り返し交換と会話制御が含まれる。
エージェントは、ポリシープランナーが定める特定の対話意図や戦略に従う応答を生成することにより、コントロールを得る。
標準的なアプローチは、これらの意図に基づいて生成条件を実行するために、訓練済みの言語モデルを微調整している。
代わりに、条件生成の微調整に代えて、大きな言語モデルをドロップインで置き換えるように促します。
論文 参考訳(メタデータ) (2023-05-06T23:11:25Z) - Achieving mouse-level strategic evasion performance using real-time
computational planning [59.60094442546867]
計画とは、脳が想像し、予測可能な未来を成立させる特別な能力である。
我々は,動物の生態が空間計画の価値をどのように支配するかという研究に基づいて,より効率的な生物学的に着想を得た計画アルゴリズムであるTLPPOを開発した。
TLPPOを用いたリアルタイムエージェントの性能とライブマウスの性能を比較し,ロボット捕食者を避けることを課題とする。
論文 参考訳(メタデータ) (2022-11-04T18:34:36Z) - A Simulated Experiment to Explore Robotic Dialogue Strategies for People
with Dementia [2.5412519393131974]
繰り返し質問の文脈におけるPwD-ロボット相互作用のための部分可観測マルコフ決定プロセス(POMDP)モデルを提案する。
異なる認知能力と異なるエンゲージメントレベルを持つpwdに対する適応的会話戦略を学ぶためにq-learningを用いた。
これは、PwDの繰り返し質問に対処するための会話型ソーシャルロボットの適用に向けた有用なステップかもしれません。
論文 参考訳(メタデータ) (2021-04-18T19:35:19Z) - Evolutionary Stochastic Policy Distillation [139.54121001226451]
本稿では,GCRS課題を解決するための進化的政策蒸留法(ESPD)を提案する。
ESPDは、政策蒸留(PD)技術により、ターゲットポリシーを一連の変種から学習することを可能にする
MuJoCo制御系に基づく実験により,提案手法の学習効率が向上した。
論文 参考訳(メタデータ) (2020-04-27T16:19:25Z) - You Impress Me: Dialogue Generation via Mutual Persona Perception [62.89449096369027]
認知科学の研究は、理解が高品質なチャット会話に不可欠なシグナルであることを示唆している。
そこで我々は,P2 Botを提案する。このP2 Botは,理解を明示的にモデル化することを目的とした送信機受信者ベースのフレームワークである。
論文 参考訳(メタデータ) (2020-04-11T12:51:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。