論文の概要: Forming Human-Robot Cooperation for Tasks with General Goal using
Evolutionary Value Learning
- arxiv url: http://arxiv.org/abs/2012.10773v3
- Date: Tue, 30 Mar 2021 16:47:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-01 11:08:58.977265
- Title: Forming Human-Robot Cooperation for Tasks with General Goal using
Evolutionary Value Learning
- Title(参考訳): 進化的価値学習を用いた汎用ゴールタスクのためのヒューマンロボット協調の形成
- Authors: Lingfeng Tao, Michael Bowman, Jiucai Zhang, Xiaoli Zhang
- Abstract要約: 人間ロボット協力(HRC)では、ロボットは人間と協力してタスクを一緒に達成します。
既存のアプローチでは、人間が協力中に特定の目標を持っていると仮定し、ロボットはそれを推論し行動する。
HRCにおける目標仕様プロセスのダイナミクスをモデル化するEvolutionary Value Learning(EVL)アプローチを紹介します。
- 参考スコア(独自算出の注目度): 9.053709318841232
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In Human-Robot Cooperation (HRC), the robot cooperates with humans to
accomplish the task together. Existing approaches assume the human has a
specific goal during the cooperation, and the robot infers and acts toward it.
However, in real-world environments, a human usually only has a general goal
(e.g., general direction or area in motion planning) at the beginning of the
cooperation, which needs to be clarified to a specific goal (e.g., an exact
position) during cooperation. The specification process is interactive and
dynamic, which depends on the environment and the partners' behavior. The robot
that does not consider the goal specification process may cause frustration to
the human partner, elongate the time to come to an agreement, and compromise or
fail team performance. We present the Evolutionary Value Learning (EVL)
approach, which uses a State-based Multivariate Bayesian Inference method to
model the dynamics of the goal specification process in HRC. EVL can actively
enhance the process of goal specification and cooperation formation. This
enables the robot to simultaneously help the human specify the goal and learn a
cooperative policy in a Deep Reinforcement Learning (DRL) manner. In a dynamic
ball balancing task with real human subjects, the robot equipped with EVL
outperforms existing methods with faster goal specification processes and
better team performance.
- Abstract(参考訳): ヒューマン・ロボット・コラボレーティブ(hrc)では、ロボットは人間と協力してタスクを遂行する。
既存のアプローチでは、人間が協力中に特定の目標を持っていると仮定し、ロボットはそれを推論し行動する。
しかし、現実の環境では、人間は通常、協調の開始時に一般的な目標(例えば、運動計画における一般的な方向または領域)しか持たず、協調中に特定の目標(例えば、正確な位置)に明確化する必要がある。
仕様プロセスはインタラクティブで動的であり、環境やパートナーの行動に依存する。
目標特定プロセスを考慮しないロボットは、人間のパートナーにフラストレーションを引き起こし、合意に達する時間を延長し、チームのパフォーマンスを妥協または失敗させる可能性がある。
本稿では,多変量ベイズ推定法を用いてhrcにおける目標特定プロセスのダイナミクスをモデル化する進化的価値学習(evl)手法を提案する。
EVLは、目標仕様と協調形成のプロセスを積極的に強化することができる。
これにより、ロボットは人間が目標を特定するのを同時に支援し、深層強化学習(drl)方式で協調政策を学ぶことができる。
実際の人間との動的ボールバランスタスクでは、EVLを装備したロボットは、目標仕様プロセスの高速化とチームパフォーマンスの向上により、既存の手法よりも優れる。
関連論文リスト
- COHERENT: Collaboration of Heterogeneous Multi-Robot System with Large Language Models [49.24666980374751]
COHERENTは、異種マルチロボットシステムの協調のための新しいLCMベースのタスク計画フレームワークである。
提案-実行-フィードバック-調整機構は,個々のロボットに対して動作を分解・割り当てするように設計されている。
実験の結果,我々の研究は,成功率と実行効率の面で,従来の手法をはるかに上回っていることが明らかとなった。
論文 参考訳(メタデータ) (2024-09-23T15:53:41Z) - LIT: Large Language Model Driven Intention Tracking for Proactive Human-Robot Collaboration -- A Robot Sous-Chef Application [4.519544934630495]
大型言語モデル (LLM) と視覚言語モデル (VLM) は、ロボットが自然言語のプロンプトを制御アクションに接地できるようにする。
言語駆動型意図追跡(LIT)は,人間の長期動作をモデル化し,ロボットを積極的に協調するための次の人間の意図を予測する。
論文 参考訳(メタデータ) (2024-06-19T19:18:40Z) - Large Language Model-based Human-Agent Collaboration for Complex Task
Solving [94.3914058341565]
複雑なタスク解決のためのLarge Language Models(LLM)に基づくヒューマンエージェントコラボレーションの問題を紹介する。
Reinforcement Learning-based Human-Agent Collaboration method, ReHACを提案する。
このアプローチには、タスク解決プロセスにおける人間の介入の最も急進的な段階を決定するために設計されたポリシーモデルが含まれている。
論文 参考訳(メタデータ) (2024-02-20T11:03:36Z) - ThinkBot: Embodied Instruction Following with Thought Chain Reasoning [66.09880459084901]
EIF(Embodied Instruction following)は、複雑な環境下でオブジェクトを相互作用させることで、エージェントが人間の指示を完了させる。
我々は,人間の指導における思考連鎖を原因とした思考ボットを提案し,その不足した行動記述を復元する。
私たちのThinkBotは、成功率と実行効率の両面で、最先端のEIFメソッドよりも大きなマージンで優れています。
論文 参考訳(メタデータ) (2023-12-12T08:30:09Z) - Proactive Human-Robot Interaction using Visuo-Lingual Transformers [0.0]
人間は人間の相互作用を通して文脈を推測するために、潜伏したビスオ・言語的手がかりを抽出する能力を持っている。
本研究では,シーンからの視覚的手がかり,ユーザからの言語コマンド,事前オブジェクト間相互作用の知識を用いて,ユーザが達成しようとしている目標を積極的に予測する学習手法を提案する。
論文 参考訳(メタデータ) (2023-10-04T00:50:21Z) - Coordination with Humans via Strategy Matching [5.072077366588174]
協調作業を行う人間と人間のチームを観察することにより、利用可能なタスク補完戦略を自律的に認識するアルゴリズムを提案する。
隠れマルコフモデルを使って、チームアクションを低次元の表現に変換することで、事前の知識なしに戦略を識別できます。
ロボットポリシーは、未確認のパートナーのタスク戦略に適応するMixture-of-Expertsモデルを構築するための、識別された戦略のそれぞれに基づいて学習される。
論文 参考訳(メタデータ) (2022-10-27T01:00:50Z) - Co-GAIL: Learning Diverse Strategies for Human-Robot Collaboration [51.268988527778276]
本研究では,人間とロボットの協調実験から人間とロボットの協調政策を学習する手法を提案する。
本手法は対話型学習プロセスにおけるヒューマンポリシーとロボットポリシーを協調的に最適化する。
論文 参考訳(メタデータ) (2021-08-13T03:14:43Z) - Show Me What You Can Do: Capability Calibration on Reachable Workspace
for Human-Robot Collaboration [83.4081612443128]
本稿では,REMPを用いた短時間キャリブレーションにより,ロボットが到達できると考える非専門家と地道とのギャップを効果的に埋めることができることを示す。
この校正手順は,ユーザ認識の向上だけでなく,人間とロボットのコラボレーションの効率化にも寄与することを示す。
論文 参考訳(メタデータ) (2021-03-06T09:14:30Z) - Joint Mind Modeling for Explanation Generation in Complex Human-Robot
Collaborative Tasks [83.37025218216888]
本稿では,人間とロボットのコラボレーションにおいて,人間のようなコミュニケーションを実現するための新しい説明可能なAI(XAI)フレームワークを提案する。
ロボットは、人間のユーザの階層的なマインドモデルを構築し、コミュニケーションの一形態として自身のマインドの説明を生成する。
その結果,提案手法はロボットの協調動作性能とユーザ認識を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2020-07-24T23:35:03Z) - Deployment and Evaluation of a Flexible Human-Robot Collaboration Model
Based on AND/OR Graphs in a Manufacturing Environment [2.3848738964230023]
協調ロボットを製造業に効果的に展開する上での大きなボトルネックは、タスク計画アルゴリズムを開発することである。
本研究では,人間とロボットの協調を必要とするパレット化作業について検討した。
本研究は,職場における作業者の柔軟性と快適さを活かし,人間とロボットの協調モデルをいかに活用できるかを実証するものである。
論文 参考訳(メタデータ) (2020-07-13T22:05:34Z) - Learn Task First or Learn Human Partner First: A Hierarchical Task
Decomposition Method for Human-Robot Cooperation [11.387868752604986]
本研究は、ロボットが人間のパートナーの振る舞いを学習することとは別に、階層的動的制御タスクを学習できるようにする階層的報酬機構を備えた新しいタスク分解手法を提案する。
その結果、ロボットは、まずタスクを学習し、より高いチームパフォーマンスを達成し、次に人間を学習し、より高い学習効率を達成することが示唆された。
論文 参考訳(メタデータ) (2020-03-01T04:41:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。