論文の概要: Rediscovering Affordance: A Reinforcement Learning Perspective
- arxiv url: http://arxiv.org/abs/2112.12886v1
- Date: Fri, 24 Dec 2021 00:25:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-29 18:09:19.832108
- Title: Rediscovering Affordance: A Reinforcement Learning Perspective
- Title(参考訳): 報酬を再発見する:強化学習の視点
- Authors: Yi-Chi Liao, Kashyap Todi, Aditya Acharya, Antti Keurulainen, Andrew
Howes, Antti Oulasvirta
- Abstract要約: 本稿では,認知科学における強化学習理論に基づく情報量形成の総合的理論を提案する。
この理論を仮想ロボットモデルに実装し,対話型ウィジェットタスクにおける可利用性の人間ライクな適応を実証する。
- 参考スコア(独自算出の注目度): 30.61766085961884
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Affordance refers to the perception of possible actions allowed by an object.
Despite its relevance to human-computer interaction, no existing theory
explains the mechanisms that underpin affordance-formation; that is, how
affordances are discovered and adapted via interaction. We propose an
integrative theory of affordance-formation based on the theory of reinforcement
learning in cognitive sciences. The key assumption is that users learn to
associate promising motor actions to percepts via experience when reinforcement
signals (success/failure) are present. They also learn to categorize actions
(e.g., ``rotating'' a dial), giving them the ability to name and reason about
affordance. Upon encountering novel widgets, their ability to generalize these
actions determines their ability to perceive affordances. We implement this
theory in a virtual robot model, which demonstrates human-like adaptation of
affordance in interactive widgets tasks. While its predictions align with
trends in human data, humans are able to adapt affordances faster, suggesting
the existence of additional mechanisms.
- Abstract(参考訳): Affordanceは、オブジェクトによって許される可能性のあるアクションの認識を指す。
その人間とコンピュータの相互作用との関連性にもかかわらず、既存の理論では、余裕形成の基盤となるメカニズムは説明されていない。
本稿では,認知科学における強化学習理論に基づく補償形成の積分理論を提案する。
鍵となる前提は、ユーザーは、強化信号(成功/失敗)が存在する場合の経験を通して、期待できる運動行動を知覚に関連付けることを学ぶことである。
彼らはまた、行動(例えば「回転する」というダイヤル)を分類することを学び、価格について名前を付け、推論する能力を与える。
新たなウィジェットに遭遇すると、これらのアクションを一般化する能力は、余裕を知覚する能力を決定する。
この理論を仮想ロボットモデルに実装し,対話型ウィジェットタスクにおけるアフォーダンスの人間的適応を実証する。
その予測は、人間のデータの動向と一致しているが、人間はより早くアフォーマンスを適応できるため、追加のメカニズムの存在を示唆する。
関連論文リスト
- Learning mental states estimation through self-observation: a developmental synergy between intentions and beliefs representations in a deep-learning model of Theory of Mind [0.35154948148425685]
心の理論(りょうがく、英: Theory of Mind、ToM)とは、信念、意図、精神状態などを他人に関連付ける能力である。
我々は,低レベル精神状態を予測する学習と,高レベル精神状態に寄与する学習との間に発達的な相乗効果を示す。
我々は,人間の社会的認知発達の理解に,我々の計算的アプローチが役立つことを示唆する。
論文 参考訳(メタデータ) (2024-07-25T13:15:25Z) - On Computational Mechanisms for Shared Intentionality, and Speculation
on Rationality and Consciousness [0.0]
人類の特異な特質は、新しい行動、協調行動、チームワークを行う能力である。
これは、個人の頭脳間で目標、計画、アイデアを伝達し、共通の意図を生み出すことを要求する。
先行言語型計算エージェント間の共有意図性を実現するための基本的なメカニズムの必要な特性を導出する。
論文 参考訳(メタデータ) (2023-06-03T21:31:38Z) - Learning Goal-based Movement via Motivational-based Models in Cognitive
Mobile Robots [58.720142291102135]
人間は、強さと文脈に応じて行動を促進する必要がある。
また、各行動の知覚的快楽に関連する嗜好も作り出します。
これにより、意思決定がより複雑になり、コンテキストに応じてニーズと嗜好のバランスを取ることが求められます。
論文 参考訳(メタデータ) (2023-02-20T04:52:24Z) - Robot Learning Theory of Mind through Self-Observation: Exploiting the
Intentions-Beliefs Synergy [0.0]
心の理論(みんがく、英: Theory of Mind、TOM)は、他のエージェントの信念、意図、精神状態に起因する能力である。
我々は,意図や目標などの低レベル精神状態を予測する学習と,信念などの高レベル精神状態に寄与する学習の相乗効果を示す。
我々は,今後の適応型社会ロボットの設計に,我々のアーキテクチャ的アプローチが関係することを提案する。
論文 参考訳(メタデータ) (2022-10-17T21:12:39Z) - Learning Theory of Mind via Dynamic Traits Attribution [59.9781556714202]
本稿では,過去のトラジェクトリからアクターの潜在特性ベクトルを生成するニューラルToMアーキテクチャを提案する。
この特性ベクトルは、予測ニューラルネットワークの高速重み付けスキームを介して予測機構を乗法的に変調する。
実験により,高速重量はエージェントの特性をモデル化し,マインドリーディング能力を向上させるために優れた誘導バイアスを与えることが示された。
論文 参考訳(メタデータ) (2022-04-17T11:21:18Z) - The world seems different in a social context: a neural network analysis
of human experimental data [57.729312306803955]
本研究では,先行・知覚的信号の精度を変化させることで,個人・社会的タスク設定の両方で人間の行動データを再現可能であることを示す。
トレーニングされたネットワークの神経活性化トレースの分析は、情報が個人や社会的条件のネットワークにおいて、根本的に異なる方法でコード化されていることを示す。
論文 参考訳(メタデータ) (2022-03-03T17:19:12Z) - Contrastive Active Inference [12.361539023886161]
本稿では,エージェントの生成モデル学習における計算負担を低減し,今後の行動計画を行うための,アクティブ推論のための対照的な目的を提案する。
提案手法は,画像に基づくタスクにおいて,確率に基づく能動推論よりも特に優れているが,計算処理が安価で,訓練も容易である。
論文 参考訳(メタデータ) (2021-10-19T16:20:49Z) - AGENT: A Benchmark for Core Psychological Reasoning [60.35621718321559]
直観心理学は、観察可能な行動を駆動する隠された精神変数を推論する能力です。
他のエージェントを推論する機械エージェントに対する近年の関心にもかかわらず、そのようなエージェントが人間の推論を駆動するコア心理学の原則を学ぶか保持するかは明らかではない。
本稿では,プロシージャが生成する3dアニメーション,エージェントを4つのシナリオで構成したベンチマークを提案する。
論文 参考訳(メタデータ) (2021-02-24T14:58:23Z) - Hierarchical Affordance Discovery using Intrinsic Motivation [69.9674326582747]
本研究では,移動ロボットの価格学習を支援するために,本質的なモチベーションを用いたアルゴリズムを提案する。
このアルゴリズムは、事前にプログラムされたアクションなしで、相互に関連のある価格を自律的に発見し、学習し、適応することができる。
一度学習すると、これらの余裕はアルゴリズムによって様々な困難を伴うタスクを実行するために一連のアクションを計画するために使われる。
論文 参考訳(メタデータ) (2020-09-23T07:18:21Z) - Machine Common Sense [77.34726150561087]
機械の常識は、人工知能(AI)において広範で潜在的に無拘束な問題のままである
本稿では、対人インタラクションのようなドメインに焦点を当てたコモンセンス推論のモデル化の側面について論じる。
論文 参考訳(メタデータ) (2020-06-15T13:59:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。