論文の概要: A Definition of Open-Ended Learning Problems for Goal-Conditioned Agents
- arxiv url: http://arxiv.org/abs/2311.00344v3
- Date: Mon, 12 Feb 2024 11:41:37 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-13 21:57:56.638408
- Title: A Definition of Open-Ended Learning Problems for Goal-Conditioned Agents
- Title(参考訳): ゴールコンディショニングエージェントのためのオープンエンド学習問題の定義
- Authors: Olivier Sigaud, Gianluca Baldassarre, Cedric Colas, Stephane Doncieux,
Richard Duro, Nicolas Perrin-Gilbert, Vieri Giuliano Santucci
- Abstract要約: オープンエンドラーニングは、一般的に、多様な性質の集合を含む複合概念として考えられている。
我々は、エージェントがゴール駆動スキルのレパートリーを増大させることが可能な、オープンエンドの目標条件強化学習問題のサブセットに焦点を当てる。
- 参考スコア(独自算出の注目度): 5.611852791887575
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A lot of recent machine learning research papers have ``open-ended learning''
in their title. But very few of them attempt to define what they mean when
using the term. Even worse, when looking more closely there seems to be no
consensus on what distinguishes open-ended learning from related concepts such
as continual learning, lifelong learning or autotelic learning. In this paper,
we contribute to fixing this situation. After illustrating the genealogy of the
concept and more recent perspectives about what it truly means, we outline that
open-ended learning is generally conceived as a composite notion encompassing a
set of diverse properties. In contrast with previous approaches, we propose to
isolate a key elementary property of open-ended processes, which is to produce
elements from time to time (e.g., observations, options, reward functions, and
goals), over an infinite horizon, that are considered novel from an observer's
perspective. From there, we build the notion of open-ended learning problems
and focus in particular on the subset of open-ended goal-conditioned
reinforcement learning problems in which agents can learn a growing repertoire
of goal-driven skills. Finally, we highlight the work that remains to be
performed to fill the gap between our elementary definition and the more
involved notions of open-ended learning that developmental AI researchers may
have in mind.
- Abstract(参考訳): 最近の機械学習の研究論文の多くは、タイトルに‘open-ended learning’がある。
しかし、その用語を使うことの意味を定義する試みはごくわずかである。
さらに悪いことに、より綿密に見ると、オープンエンド学習と継続的学習、生涯学習、オートテリック学習といった関連する概念の違いについてのコンセンサスはないようだ。
本稿では,この状況の解決に寄与する。
概念の系図と、それが本当に何を意味するのかのより最近の視点を図解した後、オープン・エンド・ラーニングは一般に多様な特性の集合を包含する複合概念として考えられていることを概説する。
従来のアプローチとは対照的に,我々は,観察者の視点から斬新と考えられる無限の地平線上に,時間から時間までの要素(観察,オプション,報酬関数,目標など)を生成できるオープンエンドプロセスの重要な基本特性を分離することを提案する。
そこから,オープンディビジョン学習問題の概念を構築し,特に,エージェントが目標駆動スキルのレパートリーを増大させることが可能なオープンディビジョン目標条件強化学習問題のサブセットに焦点をあてる。
最後に、私たちの基本的な定義と、発達型AI研究者が念頭に置いているであろうオープンエンドラーニングの概念とのギャップを埋めるために、まだ実行すべき作業を強調します。
関連論文リスト
- A Definition of Continual Reinforcement Learning [69.56273766737527]
強化学習問題の標準的な見方では、エージェントの目標は、長期的な報酬を最大化するポリシーを効率的に識別することである。
継続的強化学習とは、最高のエージェントが決して学習をやめない状態を指す。
エージェントの分析とカタログ化のための新しい数学的言語を通じて「学習をやめることはない」エージェントの概念を定式化する。
論文 参考訳(メタデータ) (2023-07-20T17:28:01Z) - Towards Open Vocabulary Learning: A Survey [146.90188069113213]
ディープニューラルネットワークは,セグメンテーションやトラッキング,検出といった,さまざまなコアタスクにおいて,目覚ましい進歩を遂げている。
近年、視覚言語事前学習の急速な進歩により、オープンな語彙設定が提案されている。
本稿では,その分野における最近の発展を要約し分析し,オープンな語彙学習の徹底的なレビューを行う。
論文 参考訳(メタデータ) (2023-06-28T02:33:06Z) - Deep Learning to See: Towards New Foundations of Computer Vision [88.69805848302266]
この本はコンピュータビジョンの分野における科学的進歩を批判している。
情報に基づく自然法則の枠組みにおける視覚の研究を提案する。
論文 参考訳(メタデータ) (2022-06-30T15:20:36Z) - A Novel Multimodal Approach for Studying the Dynamics of Curiosity in
Small Group Learning [2.55061802822074]
本稿では,仲間の観察可能な行動と根底にある好奇心状態とを結びつける,好奇心の統合社会認知的記述を提案する。
我々は、好奇心に寄与する個人機能と対人機能と、これらの機能を満たすマルチモーダル動作を区別する。
この研究は、社会的文脈における学習中にモーメント・バイ・モーメントの好奇心を認識して誘発できる学習技術を設計するためのステップである。
論文 参考訳(メタデータ) (2022-04-01T16:12:40Z) - Towards a theory of out-of-distribution learning [23.878004729029644]
本稿では,PAC学習フレームワークを用いて,異なる学習課題を定義するための時系列的アプローチを提案する。
まずは流通学習から始め、最近提案された生涯学習や継続学習へと進む。
この研究によって、さまざまなタイプの学習を定量化する、普遍的に合意されたアプローチがもたらされることを期待しています。
論文 参考訳(メタデータ) (2021-09-29T15:35:16Z) - Concept Learners for Few-Shot Learning [76.08585517480807]
本研究では,人間の解釈可能な概念次元に沿って学習することで,一般化能力を向上させるメタ学習手法であるCOMETを提案する。
我々は,細粒度画像分類,文書分類,セルタイプアノテーションなど,さまざまな領域からの少数ショットタスクによるモデルの評価を行った。
論文 参考訳(メタデータ) (2020-07-14T22:04:17Z) - Dark, Beyond Deep: A Paradigm Shift to Cognitive AI with Humanlike
Common Sense [142.53911271465344]
我々は、次世代のAIは、新しいタスクを解決するために、人間のような「暗黒」の常識を取り入れなければならないと論じている。
我々は、人間のような常識を持つ認知AIの5つの中核領域として、機能、物理学、意図、因果性、実用性(FPICU)を識別する。
論文 参考訳(メタデータ) (2020-04-20T04:07:28Z) - Explore, Discover and Learn: Unsupervised Discovery of State-Covering
Skills [155.11646755470582]
情報理論的スキル発見の代替手法として,'Explore, Discover and Learn'(EDL)がある。
本稿では,EDLがカバレッジ問題を克服し,学習スキルの初期状態への依存を減らし,ユーザが学習すべき行動について事前定義できるようにするなど,大きなメリットがあることを示す。
論文 参考訳(メタデータ) (2020-02-10T10:49:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。