論文の概要: Enhancing Robot Assistive Behaviour with Reinforcement Learning and Theory of Mind
- arxiv url: http://arxiv.org/abs/2411.07003v1
- Date: Mon, 11 Nov 2024 14:01:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-12 14:07:47.229707
- Title: Enhancing Robot Assistive Behaviour with Reinforcement Learning and Theory of Mind
- Title(参考訳): 強化学習と心の理論によるロボット支援行動の強化
- Authors: Antonio Andriella, Giovanni Falcone, Silvia Rossi,
- Abstract要約: 心の理論(ToM)能力を備えた社会ロボットが,ユーザのパフォーマンスや知覚に与える影響について検討する。
本研究では,ToM能力を有する適応型ロボットと対話する56名の被験者と,その能力に欠けるロボットを対象とする実世界でのユーザスタディを行った。
以上の結果から,ToM条件の参加者はロボットの補助をより多く受け取り,その意図を適応し,予測し,より高次に認識する能力があることが示唆された。
- 参考スコア(独自算出の注目度): 1.9594704501292781
- License:
- Abstract: The adaptation to users' preferences and the ability to infer and interpret humans' beliefs and intents, which is known as the Theory of Mind (ToM), are two crucial aspects for achieving effective human-robot collaboration. Despite its importance, very few studies have investigated the impact of adaptive robots with ToM abilities. In this work, we present an exploratory comparative study to investigate how social robots equipped with ToM abilities impact users' performance and perception. We design a two-layer architecture. The Q-learning agent on the first layer learns the robot's higher-level behaviour. On the second layer, a heuristic-based ToM infers the user's intended strategy and is responsible for implementing the robot's assistance, as well as providing the motivation behind its choice. We conducted a user study in a real-world setting, involving 56 participants who interacted with either an adaptive robot capable of ToM, or with a robot lacking such abilities. Our findings suggest that participants in the ToM condition performed better, accepted the robot's assistance more often, and perceived its ability to adapt, predict and recognise their intents to a higher degree. Our preliminary insights could inform future research and pave the way for designing more complex computation architectures for adaptive behaviour with ToM capabilities.
- Abstract(参考訳): ユーザの好みへの適応と人間の信念や意図を推論・解釈する能力は、人間とロボットの効果的なコラボレーションを実現する上で重要な2つの側面である。
その重要性にもかかわらず、適応ロボットのToM能力への影響についてはほとんど研究されていない。
本研究では,ToM機能を備えたソーシャルロボットがユーザのパフォーマンスと知覚に与える影響について,探索的比較研究を行った。
私たちは2層アーキテクチャを設計します。
第1層のQ学習エージェントは、ロボットのハイレベルな振る舞いを学習する。
第2のレイヤでは、ヒューリスティックベースのToMがユーザの意図した戦略を推測し、ロボットのアシストを実装し、その選択の背後にあるモチベーションを提供する。
本研究では,ToM能力を有する適応型ロボットと対話する56名の被験者と,その能力に欠けるロボットを対象とする実世界でのユーザスタディを行った。
以上の結果から,ToM条件の参加者はロボットの補助をより多く受け取り,その意図を適応し,予測し,より高次に認識する能力があることが示唆された。
我々の予備的な洞察は将来の研究に役立ち、ToM機能を備えた適応的な振る舞いのためのより複雑な計算アーキテクチャを設計するための道を開くことができる。
関連論文リスト
- Human-Robot Mutual Learning through Affective-Linguistic Interaction and Differential Outcomes Training [Pre-Print] [0.3811184252495269]
本研究では,感情言語コミュニケーションが人間ロボットの文脈における相互学習にどのように影響するかを検証する。
児童介護のダイナミックスからインスピレーションを得て、私たちの人間とロボットのインタラクションのセットアップは、内部的、ホメオスタティックに制御されたニーズのコミュニケーション方法を学ぶための(シミュレートされた)ロボットで構成されています。
論文 参考訳(メタデータ) (2024-07-01T13:35:08Z) - Human Reactions to Incorrect Answers from Robots [0.0]
この研究は、ロボットの故障に対する人間の反応によって、信頼力学とシステム設計がどう影響するかを体系的に研究した。
その結果、ロボット技術に対する参加者の信頼は、ロボットが誤りや限界を認識したときに著しく増大した。
この研究は人間とロボットの相互作用の科学を進歩させ、ロボット技術の普及を促進する。
論文 参考訳(メタデータ) (2024-03-21T11:00:11Z) - CasIL: Cognizing and Imitating Skills via a Dual Cognition-Action
Architecture [20.627616015484648]
既存のロボットの模倣学習アプローチは、複雑なタスクにおける準最適性能と相容れない。
ヒューリスティックには、通常のアクションの概念をデュアル認知(ハイレベル)-アクション(低レベル)アーキテクチャに拡張します。
認知行動に基づくスキル模倣学習(CasIL)と呼ばれる,人間とロボットのインタラクションによる新しいスキルILフレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-28T09:53:05Z) - Learning Human-to-Robot Handovers from Point Clouds [63.18127198174958]
視覚に基づく人間ロボットハンドオーバの制御ポリシーを学習する最初のフレームワークを提案する。
シミュレーションベンチマーク,sim-to-sim転送,sim-to-real転送において,ベースラインよりも大きな性能向上を示した。
論文 参考訳(メタデータ) (2023-03-30T17:58:36Z) - Self-Improving Robots: End-to-End Autonomous Visuomotor Reinforcement
Learning [54.636562516974884]
模倣と強化学習において、人間の監督コストは、ロボットが訓練できるデータの量を制限する。
本研究では,自己改善型ロボットシステムのための新しい設計手法であるMEDAL++を提案する。
ロボットは、タスクの実施と解除の両方を学ぶことで、自律的にタスクを練習し、同時にデモンストレーションから報酬関数を推論する。
論文 参考訳(メタデータ) (2023-03-02T18:51:38Z) - HERD: Continuous Human-to-Robot Evolution for Learning from Human
Demonstration [57.045140028275036]
本研究では,マイクロ進化的強化学習を用いて,操作スキルを人間からロボットに伝達可能であることを示す。
本稿では,ロボットの進化経路とポリシーを協調的に最適化する多次元進化経路探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-08T15:56:13Z) - Reasoning about Counterfactuals to Improve Human Inverse Reinforcement
Learning [5.072077366588174]
人間は自然に、観察可能な行動について推論することで、他のエージェントの信念や欲求を推測する。
我々は,ロボットの意思決定に対する学習者の現在の理解を,人間のIRLモデルに組み込むことを提案する。
また,人間が見えない環境下でのロボットの動作を予測しにくいことを推定するための新しい尺度を提案する。
論文 参考訳(メタデータ) (2022-03-03T17:06:37Z) - Cognitive architecture aided by working-memory for self-supervised
multi-modal humans recognition [54.749127627191655]
人間パートナーを認識する能力は、パーソナライズされた長期的な人間とロボットの相互作用を構築するための重要な社会的スキルです。
ディープラーニングネットワークは最先端の結果を達成し,そのような課題に対処するための適切なツールであることが実証された。
1つの解決策は、ロボットに自己スーパービジョンで直接の感覚データから学習させることである。
論文 参考訳(メタデータ) (2021-03-16T13:50:24Z) - Show Me What You Can Do: Capability Calibration on Reachable Workspace
for Human-Robot Collaboration [83.4081612443128]
本稿では,REMPを用いた短時間キャリブレーションにより,ロボットが到達できると考える非専門家と地道とのギャップを効果的に埋めることができることを示す。
この校正手順は,ユーザ認識の向上だけでなく,人間とロボットのコラボレーションの効率化にも寄与することを示す。
論文 参考訳(メタデータ) (2021-03-06T09:14:30Z) - SAPIEN: A SimulAted Part-based Interactive ENvironment [77.4739790629284]
SAPIENは現実的で物理に富んだシミュレートされた環境であり、音声オブジェクトのための大規模なセットをホストしている。
部品検出と動作特性認識のための最先端の視覚アルゴリズムの評価を行い,ロボットインタラクションタスクの実証を行った。
論文 参考訳(メタデータ) (2020-03-19T00:11:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。