論文の概要: Hierarchical Affordance Discovery using Intrinsic Motivation
- arxiv url: http://arxiv.org/abs/2009.10968v1
- Date: Wed, 23 Sep 2020 07:18:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-15 16:11:43.520806
- Title: Hierarchical Affordance Discovery using Intrinsic Motivation
- Title(参考訳): 固有モチベーションを用いた階層的アフォーダンス発見
- Authors: Alexandre Manoury (IMT Atlantique - INFO), Sao Mai Nguyen, C\'edric
Buche
- Abstract要約: 本研究では,移動ロボットの価格学習を支援するために,本質的なモチベーションを用いたアルゴリズムを提案する。
このアルゴリズムは、事前にプログラムされたアクションなしで、相互に関連のある価格を自律的に発見し、学習し、適応することができる。
一度学習すると、これらの余裕はアルゴリズムによって様々な困難を伴うタスクを実行するために一連のアクションを計画するために使われる。
- 参考スコア(独自算出の注目度): 69.9674326582747
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To be capable of lifelong learning in a real-life environment, robots have to
tackle multiple challenges. Being able to relate physical properties they may
observe in their environment to possible interactions they may have is one of
them. This skill, named affordance learning, is strongly related to embodiment
and is mastered through each person's development: each individual learns
affordances differently through their own interactions with their surroundings.
Current methods for affordance learning usually use either fixed actions to
learn these affordances or focus on static setups involving a robotic arm to be
operated. In this article, we propose an algorithm using intrinsic motivation
to guide the learning of affordances for a mobile robot. This algorithm is
capable to autonomously discover, learn and adapt interrelated affordances
without pre-programmed actions. Once learned, these affordances may be used by
the algorithm to plan sequences of actions in order to perform tasks of various
difficulties. We then present one experiment and analyse our system before
comparing it with other approaches from reinforcement learning and affordance
learning.
- Abstract(参考訳): 現実の環境で生涯学習できるためには、ロボットは複数の課題に取り組む必要がある。
彼らの環境で観察できる物理的特性と、それらが持つ可能性のある相互作用を関連付けることができる。
このスキルは「空き学習」と呼ばれ、実施と強く結びついており、各個人が周囲との相互作用を通じて異なる空きを学習する。
現在のアフォーアンス学習の方法は、通常、これらのアフォーアンスを学ぶために固定アクションを使用するか、ロボットアームを操作する静的セットアップにフォーカスする。
本稿では,移動ロボットの価格学習を支援するために,本質的な動機を用いたアルゴリズムを提案する。
このアルゴリズムは、事前にプログラムされたアクションなしで、相互に関連のある価格を自律的に発見、学習、適応することができる。
一度学習すると、これらの余裕はアルゴリズムによって様々な困難を伴うタスクを実行するために一連のアクションを計画するために使われる。
そこで我々は,強化学習と余剰学習の他のアプローチと比較する前に,実験を行い,システムを分析する。
関連論文リスト
- How Do Human Users Teach a Continual Learning Robot in Repeated
Interactions? [7.193217430660011]
我々は、人間が長期にわたって連続学習ロボットを教える方法を理解するために、連続学習に人間中心のアプローチをとる。
我々は,200のセッションで連続学習ロボットと対話する40名の参加者を対象に,対人調査を行った。
本研究で収集したデータの質的,定量的な分析により,個々の利用者の指導スタイルに有意な差異があることが示唆された。
論文 参考訳(メタデータ) (2023-06-30T20:29:48Z) - Evaluating Continual Learning on a Home Robot [30.620205237707342]
そこで本研究では,現実の低コストなホームロボットにおいて,連続学習手法をどのように適用することができるかを示す。
本稿では,スキルライブラリを継続的に学習するSANERと,それを支援するバックボーンとしてABIPを提案する。
論文 参考訳(メタデータ) (2023-06-04T17:14:49Z) - Incremental procedural and sensorimotor learning in cognitive humanoid
robots [52.77024349608834]
本研究は,手順を段階的に学習する認知エージェントを提案する。
各サブステージで必要とされる認知機能と, エージェントが未解決の課題に, 新たな機能の追加がどう対処するかを示す。
結果は、このアプローチが複雑なタスクを段階的に解くことができることを示している。
論文 参考訳(メタデータ) (2023-04-30T22:51:31Z) - Affordances from Human Videos as a Versatile Representation for Robotics [31.248842798600606]
我々は、人間がどこでどのように対話するかを推定する視覚的余裕モデルを訓練する。
これらの行動割当の構造は、ロボットが多くの複雑なタスクを直接実行できるようにする。
私たちは、VRBと呼ばれる4つの現実世界環境、10以上のタスクと2つのロボットプラットフォームにおいて、私たちのアプローチの有効性を示します。
論文 参考訳(メタデータ) (2023-04-17T17:59:34Z) - Learning Reward Functions for Robotic Manipulation by Observing Humans [92.30657414416527]
我々は、ロボット操作ポリシーのタスク非依存報酬関数を学習するために、幅広い操作タスクを解く人間のラベル付きビデオを使用する。
学習された報酬は、タイムコントラストの目的を用いて学習した埋め込み空間におけるゴールまでの距離に基づいている。
論文 参考訳(メタデータ) (2022-11-16T16:26:48Z) - Inducing Structure in Reward Learning by Learning Features [31.413656752926208]
本稿では,その特徴を学習するための新しいタイプの人間入力と,それを生の状態空間から複雑な特徴を学習するアルゴリズムを紹介する。
当社の手法は,すべての機能をスクラッチから学ばなければならないような設定や,いくつかの機能が知られている場所で実証しています。
論文 参考訳(メタデータ) (2022-01-18T16:02:29Z) - A Differentiable Recipe for Learning Visual Non-Prehensile Planar
Manipulation [63.1610540170754]
視覚的非包括的平面操作の問題に焦点をあてる。
本稿では,ビデオデコードニューラルモデルと接触力学の先行情報を組み合わせた新しいアーキテクチャを提案する。
モジュラーで完全に差別化可能なアーキテクチャは、目に見えないオブジェクトやモーションの学習専用手法よりも優れていることが分かりました。
論文 参考訳(メタデータ) (2021-11-09T18:39:45Z) - Dual-Arm Adversarial Robot Learning [0.6091702876917281]
ロボット学習のためのプラットフォームとしてデュアルアーム設定を提案する。
このセットアップの潜在的なメリットと、追求できる課題と研究の方向性について論じる。
論文 参考訳(メタデータ) (2021-10-15T12:51:57Z) - Lifelong Robotic Reinforcement Learning by Retaining Experiences [61.79346922421323]
多くのマルチタスク強化学習は、ロボットが常にすべてのタスクからデータを収集できると仮定している。
本研究では,物理ロボットシステムの実用的制約を動機として,現実的なマルチタスクRL問題について検討する。
我々は、ロボットのスキルセットを累積的に成長させるために、過去のタスクで学んだデータとポリシーを効果的に活用するアプローチを導出する。
論文 参考訳(メタデータ) (2021-09-19T18:00:51Z) - The Ingredients of Real-World Robotic Reinforcement Learning [71.92831985295163]
実世界で収集されたデータによって継続的に自律的に改善できるロボット学習システムに必要な要素について論じる。
本稿では,このようなシステムの特異なインスタンス化を事例として,デクスタラスな操作を事例として提案する。
我々は人間の介入なしに学習できることを実証し、現実世界の3本指の手で様々な視覚ベースのスキルを習得する。
論文 参考訳(メタデータ) (2020-04-27T03:36:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。