論文の概要: Jelly Bean World: A Testbed for Never-Ending Learning
- arxiv url: http://arxiv.org/abs/2002.06306v1
- Date: Sat, 15 Feb 2020 02:43:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-31 22:44:47.914846
- Title: Jelly Bean World: A Testbed for Never-Ending Learning
- Title(参考訳): Jelly Bean World: 永遠の学習のためのテストベッド
- Authors: Emmanouil Antonios Platanios and Abulhair Saparov and Tom Mitchell
- Abstract要約: Never-ending Learningは、機械学習と人間の学習のギャップを埋めることを目的とした機械学習パラダイムである。
Jelly Bean Worldテストベッドは、アイテムとエージェントがナビゲートできる2次元グリッドワールド上での実験を可能にする。
非定常環境を生成し、マルチタスク、マルチエージェント、マルチモーダル、カリキュラム学習設定での実験を容易にする。
- 参考スコア(独自算出の注目度): 9.560980936110234
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning has shown growing success in recent years. However, current
machine learning systems are highly specialized, trained for particular
problems or domains, and typically on a single narrow dataset. Human learning,
on the other hand, is highly general and adaptable. Never-ending learning is a
machine learning paradigm that aims to bridge this gap, with the goal of
encouraging researchers to design machine learning systems that can learn to
perform a wider variety of inter-related tasks in more complex environments. To
date, there is no environment or testbed to facilitate the development and
evaluation of never-ending learning systems. To this end, we propose the Jelly
Bean World testbed. The Jelly Bean World allows experimentation over
two-dimensional grid worlds which are filled with items and in which agents can
navigate. This testbed provides environments that are sufficiently complex and
where more generally intelligent algorithms ought to perform better than
current state-of-the-art reinforcement learning approaches. It does so by
producing non-stationary environments and facilitating experimentation with
multi-task, multi-agent, multi-modal, and curriculum learning settings. We hope
that this new freely-available software will prompt new research and interest
in the development and evaluation of never-ending learning systems and more
broadly, general intelligence systems.
- Abstract(参考訳): 機械学習は近年、成功を収めている。
しかし、現在の機械学習システムは高度に専門化されており、特定の問題やドメインに対して訓練されている。
一方、人間の学習は非常に一般的で適応性が高い。
Never-ending Learningは、このギャップを埋めることを目的とした機械学習のパラダイムであり、研究者たちがより複雑な環境で、幅広い種類の関連するタスクを実行できる機械学習システムの設計を奨励することを目的としている。
これまでのところ、永遠の学習システムの開発と評価を容易にする環境やテストベッドはありません。
そこで我々はjelly bean world testbedを提案する。
Jelly Bean Worldは、アイテムで満たされ、エージェントがナビゲートできる2次元グリッドワールドに関する実験を可能にする。
このテストベッドは、十分に複雑で、より一般的にインテリジェントなアルゴリズムが現在の最先端の強化学習アプローチよりもうまく機能すべき環境を提供する。
非定常環境を生成し、マルチタスク、マルチエージェント、マルチモーダル、カリキュラム学習の設定による実験を容易にする。
この新しいフリーソフトウェアが、絶え間ない学習システムやより広範に汎用的な知能システムの開発と評価に新たな研究と関心を喚起することを期待している。
関連論文リスト
- Open-world Machine Learning: A Review and New Outlooks [83.6401132743407]
本稿では,新たなオープンワールド機械学習パラダイムを包括的に紹介することを目的としている。
研究者がそれぞれの分野でより強力なAIシステムを構築するのを支援し、人工知能の開発を促進することを目的としている。
論文 参考訳(メタデータ) (2024-03-04T06:25:26Z) - Unsupervised Learning in Complex Systems [0.0]
この論文は、自然および人工システムにおける学習と適応を研究するための複雑なシステムの使用を探求する。
目標は、監督なしで学習し、自分自身で開発し、時間が経つにつれてますます複雑化する自律システムを開発することである。
論文 参考訳(メタデータ) (2023-07-11T19:48:42Z) - General Intelligence Requires Rethinking Exploration [24.980249597326985]
我々は,教師付き学習を含むすべての学習システムにおいて,探索が不可欠であると主張している。
汎用的な探索は、オープンエンドの学習プロセスを維持するために必要な目的である。
論文 参考訳(メタデータ) (2022-11-15T00:46:15Z) - Open Environment Machine Learning [84.90891046882213]
従来の機械学習研究は、学習プロセスの重要な要素が不変であるような近世界のシナリオを想定している。
本稿では,新しいクラスを創出する技術,デクリメンタル/インクリメンタルな特徴,データ分散の変化,学習目標の変化,理論的諸問題について概説する。
論文 参考訳(メタデータ) (2022-06-01T11:57:56Z) - Flashlight: Enabling Innovation in Tools for Machine Learning [50.63188263773778]
私たちは、機械学習ツールやシステムの革新を促進するために構築されたオープンソースのライブラリであるFlashlightを紹介します。
Flashlightは、広く使われているライブラリを下流で活用し、機械学習とシステム研究者をより緊密に連携させる研究を可能にするツールだと考えています。
論文 参考訳(メタデータ) (2022-01-29T01:03:29Z) - Collective Intelligence for Deep Learning: A Survey of Recent
Developments [11.247894240593691]
我々は、複雑なシステムへのニューラルネットワーク研究の関与に関する歴史的文脈を提供する。
我々は,集合知の原理を取り入れた,現代のディープラーニング研究の活発な領域をいくつか取り上げる。
論文 参考訳(メタデータ) (2021-11-29T08:39:32Z) - Ten Quick Tips for Deep Learning in Biology [116.78436313026478]
機械学習は、データのパターンを認識し、予測モデリングに使用するアルゴリズムの開発と応用に関係している。
ディープラーニングは、独自の機械学習のサブフィールドになっている。
生物学的研究の文脈において、ディープラーニングは高次元の生物学的データから新しい洞察を導き出すためにますます使われてきた。
論文 参考訳(メタデータ) (2021-05-29T21:02:44Z) - Open-world Machine Learning: Applications, Challenges, and Opportunities [0.7734726150561086]
オープンワールド機械学習は、任意の入力(目に見えないクラスを持つデータ)を機械学習システムに処理する。
従来の機械学習は静的な学習であり、アクティブな環境には適さない。
本稿では,オープンワールド機械学習における様々な手法の体系的レビューを行う。
論文 参考訳(メタデータ) (2021-05-27T21:05:10Z) - MT-Opt: Continuous Multi-Task Robotic Reinforcement Learning at Scale [103.7609761511652]
大規模集団ロボット学習システムが,行動のレパートリーを同時に獲得できることを示す。
新しいタスクは、以前学んだタスクから継続的にインスタンス化できる。
我々は,7台のロボットから収集したデータを用いて,実世界のタスク12組でシステムを訓練し,評価する。
論文 参考訳(メタデータ) (2021-04-16T16:38:02Z) - The Ingredients of Real-World Robotic Reinforcement Learning [71.92831985295163]
実世界で収集されたデータによって継続的に自律的に改善できるロボット学習システムに必要な要素について論じる。
本稿では,このようなシステムの特異なインスタンス化を事例として,デクスタラスな操作を事例として提案する。
我々は人間の介入なしに学習できることを実証し、現実世界の3本指の手で様々な視覚ベースのスキルを習得する。
論文 参考訳(メタデータ) (2020-04-27T03:36:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。