論文の概要: Prototyping three key properties of specific curiosity in computational
reinforcement learning
- arxiv url: http://arxiv.org/abs/2205.10407v1
- Date: Fri, 20 May 2022 18:58:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-05 23:14:00.154853
- Title: Prototyping three key properties of specific curiosity in computational
reinforcement learning
- Title(参考訳): 計算強化学習における特殊好奇性の3つの鍵特性の試作
- Authors: Nadia M. Ady, Roshan Shariff, Johannes G\"unther and Patrick M.
Pilarski (University of Alberta Department of Computing Science and Alberta
Machine Intelligence Institute)
- Abstract要約: 本稿では,これらの特性の最も即時的な3点を紹介し,概念強化学習エージェントでどのように実装されるかを示す。
希望するように、エージェントは、好奇心を誘発する状況を適応的に求めるために、長期的な嗜好を更新しながら、短期的な指示行動を示す。
この研究は、特定の好奇心がどのように機能し、将来は複雑な環境におけるゴール探索、意思決定エージェントの行動に統合されるかもしれない、という新しい見解を提示する。
- 参考スコア(独自算出の注目度): 3.1498833540989413
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Curiosity for machine agents has been a focus of intense research. The study
of human and animal curiosity, particularly specific curiosity, has unearthed
several properties that would offer important benefits for machine learners,
but that have not yet been well-explored in machine intelligence. In this work,
we introduce three of the most immediate of these properties -- directedness,
cessation when satisfied, and voluntary exposure -- and show how they may be
implemented together in a proof-of-concept reinforcement learning agent;
further, we demonstrate how the properties manifest in the behaviour of this
agent in a simple non-episodic grid-world environment that includes
curiosity-inducing locations and induced targets of curiosity. As we would
hope, the agent exhibits short-term directed behaviour while updating long-term
preferences to adaptively seek out curiosity-inducing situations. This work
therefore presents a novel view into how specific curiosity operates and in the
future might be integrated into the behaviour of goal-seeking, decision-making
agents in complex environments.
- Abstract(参考訳): 機械エージェントの好奇心は、激しい研究の焦点となっている。
人間と動物の好奇心、特に特定の好奇心の研究は、機械学習者にとって重要な利益をもたらすいくつかの特性を発掘してきたが、マシンインテリジェンスではまだよく研究されていない。
本研究は,これらの特性の最も直接的な3つの特性,すなわち,指示性,満足度,随意曝露性を導入し,概念強化学習エージェントで組み合わせて実施する方法を示し,また,好奇心誘導位置と好奇心誘導対象を含む単純な非エポゾディックグリッドワールド環境において,このエージェントの行動に現れる特性がどのように現れるかを示す。
希望するように、エージェントは、好奇心を誘発する状況を適応的に求めるために、長期的な嗜好を更新しながら、短期的な指示行動を示す。
この研究は、特定の好奇心がどのように機能し、将来は複雑な環境におけるゴール探索、意思決定エージェントの行動に統合されるかもしれない、という新しい見解を提示する。
関連論文リスト
- A Comprehensive Review of Few-shot Action Recognition [64.47305887411275]
アクション認識は、複雑で可変なビデオデータを手動でラベル付けすることのコストと非現実性に対処することを目的としている。
ビデオ中の人間のアクションを正確に分類するには、クラスごとにいくつかのラベル付き例だけを使用する必要がある。
論文 参考訳(メタデータ) (2024-07-20T03:53:32Z) - A Comprehensive Survey of Forgetting in Deep Learning Beyond Continual Learning [58.107474025048866]
蓄積とは、以前に獲得した知識の喪失または劣化を指す。
フォッテッティングは、深層学習における様々な研究領域でよく見られる現象である。
論文 参考訳(メタデータ) (2023-07-16T16:27:58Z) - Five Properties of Specific Curiosity You Didn't Know Curious Machines
Should Have [4.266866385061999]
我々は、動物と機械の好奇心の分野を包括的に多分野的に調査する。
我々は、特定の好奇心の最も重要な特性の5つのうちの1つと考えるものを紹介し、定義する。
概念強化学習エージェントにおいて,これらの特性をどのように組み合わせて実装するかを示す。
論文 参考訳(メタデータ) (2022-12-01T00:18:56Z) - From Psychological Curiosity to Artificial Curiosity: Curiosity-Driven
Learning in Artificial Intelligence Tasks [56.20123080771364]
心理学的好奇心は、探索と情報取得を通じて学習を強化するために、人間の知性において重要な役割を果たす。
人工知能(AI)コミュニティでは、人工好奇心は効率的な学習に自然な本質的な動機を与える。
CDLはますます人気を博し、エージェントは新たな知識を学習するために自己動機付けされている。
論文 参考訳(メタデータ) (2022-01-20T17:07:03Z) - Information is Power: Intrinsic Control via Information Capture [110.3143711650806]
我々は,潜時状態空間モデルを用いて推定したエージェントの状態訪問のエントロピーを最小化する,コンパクトで汎用的な学習目的を論じる。
この目的は、不確実性の低減に対応する環境情報収集と、将来の世界状態の予測不可能性の低減に対応する環境制御の両方をエージェントに誘導する。
論文 参考訳(メタデータ) (2021-12-07T18:50:42Z) - Is Curiosity All You Need? On the Utility of Emergent Behaviours from
Curious Exploration [20.38772636693469]
我々は、好奇心を高速な環境探索や、特定のタスクに対するボーナス報酬として使うだけでは、この手法の潜在能力を最大限に活用できないと論じている。
好奇心に基づく学習において出現する行動の維持に焦点を移すことを提案する。
論文 参考訳(メタデータ) (2021-09-17T15:28:25Z) - Ask & Explore: Grounded Question Answering for Curiosity-Driven
Exploration [17.28353205476766]
エージェントに対する外在的な報酬が極めて少ない現実のシナリオでは、好奇心は有用な概念として現れている。
本稿では,エージェントに環境に関する質問をするように促し,接地質問応答に基づく好奇心を定式化する。
自然言語に関する質問は,対象の物理的性質や他の対象との空間的関係など,その環境に関する特定の知識を明らかにすることを促す。
論文 参考訳(メタデータ) (2021-04-24T07:56:31Z) - Towards Open World Object Detection [68.79678648726416]
ORE: Open World Object Detectorは、対照的なクラスタリングとエネルギーベースの未知の識別に基づいている。
未知のインスタンスの識別と特徴付けは、インクリメンタルなオブジェクト検出設定における混乱を減らすのに役立ちます。
論文 参考訳(メタデータ) (2021-03-03T18:58:18Z) - The growth and form of knowledge networks by kinesthetic curiosity [0.39325957466009187]
ネットワーク科学、統計物理学、哲学が、特定の多様性と知覚的な好奇心の心理学的側面を統一し拡張するアプローチにどのように統合できるかを示す。
好奇心の審美的モデルは、モデルに基づく強化学習の熟考的予測と相容れない。
論文 参考訳(メタデータ) (2020-06-04T15:30:41Z) - Planning to Explore via Self-Supervised World Models [120.31359262226758]
Plan2Exploreは自己監督型強化学習エージェントである。
我々は、自己監督型探索と、新しいタスクへの迅速な適応に対する新しいアプローチを提案する。
Plan2Exploreは、訓練の監督やタスク固有の相互作用がなければ、自己監督型の探査方法よりも優れている。
論文 参考訳(メタデータ) (2020-05-12T17:59:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。