論文の概要: Learning-Based Strategy Design for Robot-Assisted Reminiscence Therapy
Based on a Developed Model for People with Dementia
- arxiv url: http://arxiv.org/abs/2109.02194v1
- Date: Mon, 6 Sep 2021 00:45:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-07 16:26:07.502989
- Title: Learning-Based Strategy Design for Robot-Assisted Reminiscence Therapy
Based on a Developed Model for People with Dementia
- Title(参考訳): 認知症者のための発達モデルに基づくロボット支援想起療法の学習に基づく戦略設計
- Authors: Fengpei Yuan, Ran Zhang, Dania Bilal and Xiaopeng Zhao
- Abstract要約: 認知症(PwDs)に対する精神社会的介入として、ロボット支援型反省療法(RT)が研究されている。
我々は,PwDを刺激する学習を通じて,ロボットの会話戦略を目指す。
- 参考スコア(独自算出の注目度): 2.453923815224908
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, the robot-assisted Reminiscence Therapy (RT) is studied as a
psychosocial intervention to persons with dementia (PwDs). We aim at a
conversation strategy for the robot by reinforcement learning to stimulate the
PwD to talk. Specifically, to characterize the stochastic reactions of a PwD to
the robot's actions, a simulation model of a PwD is developed which features
the transition probabilities among different PwD states consisting of the
response relevance, emotion levels and confusion conditions. A Q-learning (QL)
algorithm is then designed to achieve the best conversation strategy for the
robot. The objective is to stimulate the PwD to talk as much as possible while
keeping the PwD's states as positive as possible. In certain conditions, the
achieved strategy gives the PwD choices to continue or change the topic, or
stop the conversation, so that the PwD has a sense of control to mitigate the
conversation stress. To achieve this, the standard QL algorithm is revised to
deliberately integrate the impact of PwD's choices into the Q-value updates.
Finally, the simulation results demonstrate the learning convergence and
validate the efficacy of the achieved strategy. Tests show that the strategy is
capable to duly adjust the difficulty level of prompt according to the PwD's
states, take actions (e.g., repeat or explain the prompt, or comfort) to help
the PwD out of bad states, and allow the PwD to control the conversation
tendency when bad states continue.
- Abstract(参考訳): 本稿では,認知症(PwDs)患者に対する心理社会的介入として,ロボット支援型反省療法(RT)について検討する。
本研究では,PwDを刺激する強化学習によるロボットの会話戦略を提案する。
具体的には、ロボットの動作に対するPwDの確率的反応を特徴付けるために、応答関係、感情レベル、混乱状態からなる異なるPwD状態間の遷移確率を特徴付けるPwDのシミュレーションモデルを開発した。
そして、ロボットの最適な会話戦略を達成するためにq-learning(ql)アルゴリズムが設計される。
目的は、PwDの状態をできるだけ肯定的に保ちながら、PwDができるだけ話すように刺激することである。
ある条件下では、達成された戦略は、PwDがトピックを継続または変更するか、あるいは会話を止めるかの選択を与えるので、PwDは会話のストレスを軽減するための制御の感覚を持つ。
これを実現するため、標準のQLアルゴリズムが改訂され、PwDの選択の影響をQ値更新に意図的に統合する。
最後に,シミュレーションにより,学習の収束を実証し,達成した戦略の有効性を検証する。
テストの結果、PwDの状態に応じてプロンプトの難易度を的確に調整し、悪い状態からPwDを助けるためのアクション(例えば、プロンプトの繰り返しや説明、快適さ)を採り、悪い状態が続くときにPwDが会話の傾向を制御できるようにする。
関連論文リスト
- Latent Plan Transformer: Planning as Latent Variable Inference [55.42812795441545]
本稿では,Transformerベースの軌道生成器と最終帰路を接続する潜在空間を利用した新しいモデルであるLatent Plan Transformerを紹介する。
テスト期間中、潜在変数はポリシー実行前の期待した戻り値から推論され、計画のアイデアを推論として実現します。
実験により, 最適軌道は, 微妙なクレジット代入, 軌道縫合, 環境問題への適応から, 改善された意思決定を発見できることを示した。
論文 参考訳(メタデータ) (2024-02-07T08:18:09Z) - Social Motion Prediction with Cognitive Hierarchies [19.71780279070757]
我々は新しいベンチマーク、新しい定式化、認知に触発されたフレームワークを紹介する。
We present Wusi, a 3D multi-person motion data under the context of team sports。
戦略的社会的相互作用を予測するための認知階層構造を構築した。
論文 参考訳(メタデータ) (2023-11-08T14:51:17Z) - From Heuristic to Analytic: Cognitively Motivated Strategies for
Coherent Physical Commonsense Reasoning [66.98861219674039]
ヒューリスティック分析推論(HAR)戦略は、モデル決定のための合理化のコヒーレンスを大幅に改善する。
以上の結果から, PLM推論の一貫性と信頼性を効果的に向上できる可能性が示唆された。
論文 参考訳(メタデータ) (2023-10-24T19:46:04Z) - Harnessing Large Language Models' Empathetic Response Generation
Capabilities for Online Mental Health Counselling Support [1.9336815376402723]
大規模言語モデル(LLM)は、様々な情報検索や推論タスクで顕著なパフォーマンスを示している。
本研究は,メンタルヘルスカウンセリング環境下での会話において,共感反応を誘発するLLMの能力について検討した。
我々は、ジェネレーティブ・プレトレーニング(GPT)のバージョン3.5とバージョン4、Vicuna FastChat-T5、Pathways Language Model(PaLM)バージョン2、Falcon-7B-Instructの5つのLCMを選択した。
論文 参考訳(メタデータ) (2023-10-12T03:33:06Z) - PromptAttack: Probing Dialogue State Trackers with Adversarial Prompts [25.467840115593784]
現代の会話システムの主要なコンポーネントは、対話状態追跡器(DST)である。
そこで本稿では,DSTモデルを探索する効果的な逆例を自動生成する,プロンプトベースの学習手法を提案する。
生成した相手のサンプルが、相手のトレーニングを通じてDSTをどの程度強化できるかを示す。
論文 参考訳(メタデータ) (2023-06-07T15:41:40Z) - Reflective Linguistic Programming (RLP): A Stepping Stone in
Socially-Aware AGI (SocialAGI) [0.0]
本稿では,自己認識と戦略的計画を重視した,会話型AIの独特なアプローチであるリフレクティブ言語プログラミング(RLP)を提案する。
RLPは、モデルに対して、事前に定義された性格特性、入ってくるメッセージに対する感情的な反応、計画された戦略をイントロスペクションすることを奨励し、コンテキスト的に豊かで、一貫性があり、活発な相互作用を可能にする。
論文 参考訳(メタデータ) (2023-05-22T02:43:15Z) - Controllable Mixed-Initiative Dialogue Generation through Prompting [50.03458333265885]
混合開始対話タスクには、情報の繰り返し交換と会話制御が含まれる。
エージェントは、ポリシープランナーが定める特定の対話意図や戦略に従う応答を生成することにより、コントロールを得る。
標準的なアプローチは、これらの意図に基づいて生成条件を実行するために、訓練済みの言語モデルを微調整している。
代わりに、条件生成の微調整に代えて、大きな言語モデルをドロップインで置き換えるように促します。
論文 参考訳(メタデータ) (2023-05-06T23:11:25Z) - Achieving mouse-level strategic evasion performance using real-time
computational planning [59.60094442546867]
計画とは、脳が想像し、予測可能な未来を成立させる特別な能力である。
我々は,動物の生態が空間計画の価値をどのように支配するかという研究に基づいて,より効率的な生物学的に着想を得た計画アルゴリズムであるTLPPOを開発した。
TLPPOを用いたリアルタイムエージェントの性能とライブマウスの性能を比較し,ロボット捕食者を避けることを課題とする。
論文 参考訳(メタデータ) (2022-11-04T18:34:36Z) - A Simulated Experiment to Explore Robotic Dialogue Strategies for People
with Dementia [2.5412519393131974]
繰り返し質問の文脈におけるPwD-ロボット相互作用のための部分可観測マルコフ決定プロセス(POMDP)モデルを提案する。
異なる認知能力と異なるエンゲージメントレベルを持つpwdに対する適応的会話戦略を学ぶためにq-learningを用いた。
これは、PwDの繰り返し質問に対処するための会話型ソーシャルロボットの適用に向けた有用なステップかもしれません。
論文 参考訳(メタデータ) (2021-04-18T19:35:19Z) - Evolutionary Stochastic Policy Distillation [139.54121001226451]
本稿では,GCRS課題を解決するための進化的政策蒸留法(ESPD)を提案する。
ESPDは、政策蒸留(PD)技術により、ターゲットポリシーを一連の変種から学習することを可能にする
MuJoCo制御系に基づく実験により,提案手法の学習効率が向上した。
論文 参考訳(メタデータ) (2020-04-27T16:19:25Z) - You Impress Me: Dialogue Generation via Mutual Persona Perception [62.89449096369027]
認知科学の研究は、理解が高品質なチャット会話に不可欠なシグナルであることを示唆している。
そこで我々は,P2 Botを提案する。このP2 Botは,理解を明示的にモデル化することを目的とした送信機受信者ベースのフレームワークである。
論文 参考訳(メタデータ) (2020-04-11T12:51:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。