論文の概要: Learning Proxemic Behavior Using Reinforcement Learning with Cognitive
Agents
- arxiv url: http://arxiv.org/abs/2108.03730v1
- Date: Sun, 8 Aug 2021 20:45:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-11 04:34:34.450270
- Title: Learning Proxemic Behavior Using Reinforcement Learning with Cognitive
Agents
- Title(参考訳): 認知エージェントを用いた強化学習を用いた確率的行動の学習
- Authors: Cristian Mill\'an-Arias, Bruno Fernandes, Francisco Cruz
- Abstract要約: プロキシミクス(英: Proxemics)は、人や動物の空間行動を研究する非言語コミュニケーションの一分野である。
本研究では, エージェントが環境中でどのように振る舞うかを, 確率的行動に基づいて検討する。
- 参考スコア(独自算出の注目度): 1.0635883951034306
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Proxemics is a branch of non-verbal communication concerned with studying the
spatial behavior of people and animals. This behavior is an essential part of
the communication process due to delimit the acceptable distance to interact
with another being. With increasing research on human-agent interaction, new
alternatives are needed that allow optimal communication, avoiding agents
feeling uncomfortable. Several works consider proxemic behavior with cognitive
agents, where human-robot interaction techniques and machine learning are
implemented. However, environments consider fixed personal space and that the
agent previously knows it. In this work, we aim to study how agents behave in
environments based on proxemic behavior, and propose a modified gridworld to
that aim. This environment considers an issuer with proxemic behavior that
provides a disagreement signal to the agent. Our results show that the learning
agent can identify the proxemic space when the issuer gives feedback about
agent performance.
- Abstract(参考訳): プロキソミクス(proxemics)は、人間や動物の空間的行動を研究する非言語コミュニケーションの一分野である。
この行動は、他の人間と対話するために許容される距離を逸脱するため、コミュニケーションプロセスの不可欠な部分である。
人間とエージェントの相互作用に関する研究が増えているため、最適なコミュニケーションを可能にし、不快感を回避できる新しい代替手段が求められている。
いくつかの研究は、人間とロボットの相互作用技術と機械学習が実装される認知エージェントとのプロキシマティックな行動について検討している。
しかし、環境は固定された個人的な空間を考慮し、エージェントは以前それを知っていた。
本研究では, エージェントが環境においてどのように振る舞うのかを, プロキソミックな振る舞いに基づいて検討し, その目的に改良されたグリッドワールドを提案する。
この環境は、エージェントに不一致信号を提供するプロキシな振る舞いを持つ発行者を考える。
その結果,学習エージェントは,エージェントのパフォーマンスに関するフィードバックを発行者が与えると,プロキシ空間を識別できることがわかった。
関連論文リスト
- Sim-to-Real Causal Transfer: A Metric Learning Approach to
Causally-Aware Interaction Representations [62.48505112245388]
エージェント相互作用の現代的表現の因果認識を詳細に検討する。
近年の表現は、非因果剤の摂動に対して部分的に耐性があることが示されている。
因果アノテーションを用いた潜在表現を正規化するための計量学習手法を提案する。
論文 参考訳(メタデータ) (2023-12-07T18:57:03Z) - AgentCF: Collaborative Learning with Autonomous Language Agents for
Recommender Systems [112.76941157194544]
本稿では,エージェントベースの協調フィルタリングにより,レコメンデータシステムにおけるユーザとイテムのインタラクションをシミュレートするエージェントCFを提案する。
我々は、ユーザだけでなく、アイテムをエージェントとして、創造的に考慮し、両方のエージェントを同時に最適化する協調学習アプローチを開発します。
全体として、最適化されたエージェントは、ユーザ・イテム、ユーザ・ユーザ・ユーザ、アイテム・イテム、集合的インタラクションなど、フレームワーク内での多様なインタラクションの振る舞いを示す。
論文 参考訳(メタデータ) (2023-10-13T16:37:14Z) - ProAgent: Building Proactive Cooperative Agents with Large Language
Models [89.53040828210945]
ProAgentは、大規模な言語モデルを利用してプロアクティブエージェントを生成する新しいフレームワークである。
ProAgentは現状を分析し、チームメイトの意図を観察から推測することができる。
ProAgentは高度なモジュール化と解釈可能性を示し、様々な調整シナリオに容易に統合できる。
論文 参考訳(メタデータ) (2023-08-22T10:36:56Z) - The Frost Hollow Experiments: Pavlovian Signalling as a Path to
Coordination and Communication Between Agents [7.980685978549764]
本稿では,パブロフ信号の多面的研究に貢献する。
固定的な信号処理パラダイムと完全適応型通信学習の自然な橋渡しとしてパブロヴィアン信号処理を確立した。
本研究は, 強化学習エージェント間の連続的なコミュニケーション学習に向けた実践的, 建設的経路を示唆するものである。
論文 参考訳(メタデータ) (2022-03-17T17:49:45Z) - Pavlovian Signalling with General Value Functions in Agent-Agent
Temporal Decision Making [6.704848594973921]
Pavlovian signalling - あるエージェントが別のエージェントに意思決定を知らせ、時間的に拡張された予測を学習するプロセス。
主な貢献として、固定信号のパラダイムと2つのエージェント間の完全適応通信学習の自然な橋渡しとしてパブロフ信号が確立される。
論文 参考訳(メタデータ) (2022-01-11T00:14:04Z) - Assessing Human Interaction in Virtual Reality With Continually Learning
Prediction Agents Based on Reinforcement Learning Algorithms: A Pilot Study [6.076137037890219]
本研究では,人間と学習の継続する予測エージェントの相互作用が,エージェントの能力の発達とともにどのように発達するかを検討する。
我々は、強化学習(RL)アルゴリズムから学習した予測が人間の予測を増大させる仮想現実環境と時間ベースの予測タスクを開発する。
以上の結果から,人的信頼はエージェントとの早期の相互作用に影響され,信頼が戦略的行動に影響を及ぼす可能性が示唆された。
論文 参考訳(メタデータ) (2021-12-14T22:46:44Z) - Interpretation of Emergent Communication in Heterogeneous Collaborative
Embodied Agents [83.52684405389445]
本稿では,コラボレーティブな多目的ナビゲーションタスクCoMONを紹介する。
この課題において、オラクルエージェントは、地図の形式で詳細な環境情報を有する。
視覚的に環境を知覚するナビゲーターエージェントと通信し、目標のシーケンスを見つけるのが任務である。
創発的コミュニケーションはエージェントの観察と3次元環境の空間構造に基礎を置くことができることを示す。
論文 参考訳(メタデータ) (2021-10-12T06:56:11Z) - Imitating Interactive Intelligence [24.95842455898523]
仮想環境の簡略化を用いて、人間と自然に相互作用できる人工エージェントの設計方法を検討する。
人間とロバストに相互作用できるエージェントを構築するには、人間と対話しながらトレーニングするのが理想的です。
我々は,人間とエージェントエージェントの対話行動の相違を低減するために,逆強化学習の考え方を用いる。
論文 参考訳(メタデータ) (2020-12-10T13:55:47Z) - Investigating Human Response, Behaviour, and Preference in Joint-Task
Interaction [3.774610219328564]
我々は、説明可能な計画(XAIP)エージェントと相互作用する人間の行動と反応を調べる実験を設計した。
また,シミュレーションユーザに対する2つのエージェントの挙動を実証分析により検討した。
論文 参考訳(メタデータ) (2020-11-27T22:16:59Z) - Learning Latent Representations to Influence Multi-Agent Interaction [65.44092264843538]
エージェントのポリシーの潜在表現を学習するための強化学習に基づくフレームワークを提案する。
提案手法は代替手段よりも優れており,他のエージェントに影響を与えることを学習している。
論文 参考訳(メタデータ) (2020-11-12T19:04:26Z) - SPA: Verbal Interactions between Agents and Avatars in Shared Virtual
Environments using Propositional Planning [61.335252950832256]
SPA(Sense-Plan-Ask)は、仮想的な仮想環境において、仮想的な人間のようなエージェントとユーザアバターの間の言語的対話を生成する。
提案アルゴリズムは実行時コストを小さくし,自然言語通信を利用せずにエージェントよりも効率的に目標を達成できることが判明した。
論文 参考訳(メタデータ) (2020-02-08T23:15:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。