論文の概要: General Intelligence Requires Rethinking Exploration
- arxiv url: http://arxiv.org/abs/2211.07819v1
- Date: Tue, 15 Nov 2022 00:46:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-16 13:33:14.067510
- Title: General Intelligence Requires Rethinking Exploration
- Title(参考訳): 一般的な知性は探索を再考する必要がある
- Authors: Minqi Jiang, Tim Rockt\"aschel, Edward Grefenstette
- Abstract要約: 我々は,教師付き学習を含むすべての学習システムにおいて,探索が不可欠であると主張している。
汎用的な探索は、オープンエンドの学習プロセスを維持するために必要な目的である。
- 参考スコア(独自算出の注目度): 24.980249597326985
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We are at the cusp of a transition from "learning from data" to "learning
what data to learn from" as a central focus of artificial intelligence (AI)
research. While the first-order learning problem is not completely solved,
large models under unified architectures, such as transformers, have shifted
the learning bottleneck from how to effectively train our models to how to
effectively acquire and use task-relevant data. This problem, which we frame as
exploration, is a universal aspect of learning in open-ended domains, such as
the real world. Although the study of exploration in AI is largely limited to
the field of reinforcement learning, we argue that exploration is essential to
all learning systems, including supervised learning. We propose the problem of
generalized exploration to conceptually unify exploration-driven learning
between supervised learning and reinforcement learning, allowing us to
highlight key similarities across learning settings and open research
challenges. Importantly, generalized exploration serves as a necessary
objective for maintaining open-ended learning processes, which in continually
learning to discover and solve new problems, provides a promising path to more
general intelligence.
- Abstract(参考訳): 我々は、人工知能(AI)研究の中心的な焦点として、「データから学ぶこと」から「学ぶべきデータを学ぶこと」へ移行しようとしている。
一階学習問題は完全には解決されていないが、トランスフォーマーのような統一アーキテクチャの下での大規模モデルでは、学習ボトルネックが、モデルを効果的にトレーニングする方法から、タスク関連データを効果的に取得し、使用する方法にシフトしている。
この問題は、私たちが探索と呼ぶもので、現実世界のようなオープンエンドの領域で学ぶ普遍的な側面です。
aiによる探索の研究は強化学習の分野に限られているが、教師付き学習を含むすべての学習システムにとって探索は不可欠であると主張する。
本研究では,教師付き学習と強化学習の間の探索駆動学習を概念的に統一するための一般化探索の問題を提案し,学習環境とオープン研究課題の共通点を強調する。
重要なことに、一般化された探索は、新しい問題の発見と解決を継続的に学習するオープンエンドの学習プロセスを維持するために必要な目的であり、より一般的な知性への有望な道を提供する。
関連論文リスト
- O1 Replication Journey: A Strategic Progress Report -- Part 1 [52.062216849476776]
本稿では,O1 Replication Journeyに具体化された人工知能研究の先駆的アプローチを紹介する。
我々の方法論は、長期化したチームベースのプロジェクトの不規則性を含む、現代のAI研究における重要な課題に対処する。
本稿では,モデルにショートカットだけでなく,完全な探索プロセスの学習を促す旅行学習パラダイムを提案する。
論文 参考訳(メタデータ) (2024-10-08T15:13:01Z) - Causal Reinforcement Learning: A Survey [57.368108154871]
強化学習は、不確実性の下でのシーケンシャルな決定問題の解決に不可欠なパラダイムである。
主な障害の1つは、強化学習エージェントが世界に対する根本的な理解を欠いていることである。
因果性は、体系的な方法で知識を形式化できるという点で顕著な利点がある。
論文 参考訳(メタデータ) (2023-07-04T03:00:43Z) - A Comprehensive Survey of Continual Learning: Theory, Method and
Application [64.23253420555989]
本稿では,基礎的設定,理論的基礎,代表的方法,実践的応用を橋渡しする継続的学習に関する包括的調査を行う。
連続学習の一般的な目的は、資源効率の文脈において、適切な安定性と塑性のトレードオフと適切なタスク内/タスク内一般化性を保証することであると要約する。
論文 参考訳(メタデータ) (2023-01-31T11:34:56Z) - Learning and Retrieval from Prior Data for Skill-based Imitation
Learning [47.59794569496233]
従来のデータから時間的に拡張された感触者スキルを抽出する,スキルベースの模倣学習フレームワークを開発した。
新規タスクの性能を著しく向上させる重要な設計選択をいくつか挙げる。
論文 参考訳(メタデータ) (2022-10-20T17:34:59Z) - From Psychological Curiosity to Artificial Curiosity: Curiosity-Driven
Learning in Artificial Intelligence Tasks [56.20123080771364]
心理学的好奇心は、探索と情報取得を通じて学習を強化するために、人間の知性において重要な役割を果たす。
人工知能(AI)コミュニティでは、人工好奇心は効率的な学習に自然な本質的な動機を与える。
CDLはますます人気を博し、エージェントは新たな知識を学習するために自己動機付けされている。
論文 参考訳(メタデータ) (2022-01-20T17:07:03Z) - Transferability in Deep Learning: A Survey [80.67296873915176]
知識を習得し再利用する能力は、ディープラーニングにおける伝達可能性として知られている。
本研究は,深層学習における異なる孤立領域と伝達可能性との関係を関連付けるための調査である。
我々はベンチマークとオープンソースライブラリを実装し、転送可能性の観点からディープラーニング手法の公平な評価を可能にする。
論文 参考訳(メタデータ) (2022-01-15T15:03:17Z) - Sharing to learn and learning to share; Fitting together Meta-Learning, Multi-Task Learning, and Transfer Learning: A meta review [4.462334751640166]
本稿では、これらの学習アルゴリズムを2つ組み合わせた研究についてレビューする。
文献から蓄積した知識に基づいて、汎用的なタスクに依存しないモデルに依存しない学習ネットワークを仮定する。
論文 参考訳(メタデータ) (2021-11-23T20:41:06Z) - A Survey of Exploration Methods in Reinforcement Learning [64.01676570654234]
強化学習エージェントは、学習プロセスのための情報データを得るために、探索に極めて依存する。
本稿では,(逐次的)強化学習における近代的な探究手法の調査と,探索手法の分類について述べる。
論文 参考訳(メタデータ) (2021-09-01T02:36:14Z) - Open-world Machine Learning: Applications, Challenges, and Opportunities [0.7734726150561086]
オープンワールド機械学習は、任意の入力(目に見えないクラスを持つデータ)を機械学習システムに処理する。
従来の機械学習は静的な学習であり、アクティブな環境には適さない。
本稿では,オープンワールド機械学習における様々な手法の体系的レビューを行う。
論文 参考訳(メタデータ) (2021-05-27T21:05:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。