論文の概要: Active Predictive Coding: A Unified Neural Framework for Learning
Hierarchical World Models for Perception and Planning
- arxiv url: http://arxiv.org/abs/2210.13461v1
- Date: Sun, 23 Oct 2022 05:44:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-26 12:54:02.064909
- Title: Active Predictive Coding: A Unified Neural Framework for Learning
Hierarchical World Models for Perception and Planning
- Title(参考訳): active prediction coding: 認知と計画のための階層的世界モデル学習のための統合ニューラルフレームワーク
- Authors: Rajesh P. N. Rao, Dimitrios C. Gklezakos, Vishwas Sathish
- Abstract要約: 能動予測符号化と呼ばれる予測符号化のための新しいフレームワークを提案する。
階層的な世界モデルを学び、AIの2つの根本的に異なるオープン問題を解くことができる。
- 参考スコア(独自算出の注目度): 1.3535770763481902
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Predictive coding has emerged as a prominent model of how the brain learns
through predictions, anticipating the importance accorded to predictive
learning in recent AI architectures such as transformers. Here we propose a new
framework for predictive coding called active predictive coding which can learn
hierarchical world models and solve two radically different open problems in
AI: (1) how do we learn compositional representations, e.g., part-whole
hierarchies, for equivariant vision? and (2) how do we solve large-scale
planning problems, which are hard for traditional reinforcement learning, by
composing complex action sequences from primitive policies? Our approach
exploits hypernetworks, self-supervised learning and reinforcement learning to
learn hierarchical world models that combine task-invariant state transition
networks and task-dependent policy networks at multiple abstraction levels. We
demonstrate the viability of our approach on a variety of vision datasets
(MNIST, FashionMNIST, Omniglot) as well as on a scalable hierarchical planning
problem. Our results represent, to our knowledge, the first demonstration of a
unified solution to the part-whole learning problem posed by Hinton, the nested
reference frames problem posed by Hawkins, and the integrated state-action
hierarchy learning problem in reinforcement learning.
- Abstract(参考訳): 予測コーディングは、脳が予測を通じてどのように学習するかの顕著なモデルとして登場し、トランスフォーマーのような最近のaiアーキテクチャにおける予測学習の重要性を予測している。
ここでは,階層的世界モデルを学習し,AIにおける2つの根本的に異なるオープンな問題を解くことのできる,アクティブな予測符号化という,予測的コーディングのための新しいフレームワークを提案する。
2)プリミティブポリシから複雑なアクションシーケンスを構成することによって,従来の強化学習では難しい大規模計画問題をどのように解決するか?
提案手法はハイパーネット,自己教師型学習,強化学習を利用して,タスク不変状態遷移ネットワークとタスク依存ポリシーネットワークを複数の抽象化レベルで組み合わせた階層的世界モデルを学ぶ。
我々は,様々なビジョンデータセット (mnist, fashionmnist, omniglot) とスケーラブルな階層的計画問題に対するアプローチの有効性を実証する。
本研究は,私達の知識に対して, hinton による部分学習問題,hawkins によるネスト参照フレーム問題,強化学習における状態行動階層学習問題に対する統合解の最初の実演である。
関連論文リスト
- Coding for Intelligence from the Perspective of Category [66.14012258680992]
符号化の対象はデータの圧縮と再構成、インテリジェンスである。
最近の傾向は、これらの2つの分野の潜在的均一性を示している。
本稿では,カテゴリ理論の観点から,インテリジェンスのためのコーディングの新たな問題を提案する。
論文 参考訳(メタデータ) (2024-07-01T07:05:44Z) - Reasoning Algorithmically in Graph Neural Networks [1.8130068086063336]
ニューラルネットワークの適応学習能力にアルゴリズムの構造的および規則に基づく推論を統合することを目的としている。
この論文は、この領域の研究に理論的および実践的な貢献を提供する。
論文 参考訳(メタデータ) (2024-02-21T12:16:51Z) - Hierarchically Structured Task-Agnostic Continual Learning [0.0]
本研究では,連続学習のタスク非依存的な視点を取り入れ,階層的情報理論の最適性原理を考案する。
我々は,情報処理経路の集合を作成することで,忘れを緩和する,Mixture-of-Variational-Experts層と呼ばれるニューラルネットワーク層を提案する。
既存の連続学習アルゴリズムのようにタスク固有の知識を必要としない。
論文 参考訳(メタデータ) (2022-11-14T19:53:15Z) - The Neural Race Reduction: Dynamics of Abstraction in Gated Networks [12.130628846129973]
本稿では,情報フローの経路が学習力学に与える影響をスキーマ化するGated Deep Linear Networkフレームワークを紹介する。
正確な還元と、特定の場合において、学習のダイナミクスに対する正確な解が導出されます。
我々の研究は、ニューラルネットワークと学習に関する一般的な仮説を生み出し、より複雑なアーキテクチャの設計を理解するための数学的アプローチを提供する。
論文 参考訳(メタデータ) (2022-07-21T12:01:03Z) - Heuristic Search Planning with Deep Neural Networks using Imitation,
Attention and Curriculum Learning [1.0323063834827413]
本稿では、最適計画模倣により、状態空間の遠い部分に関連する能力を学ぶためのネットワークモデルを提案する。
難易度の増加に伴う問題の創出における手法の限界に対処するために,新たに解決した問題インスタンスをトレーニングセットに追加するカリキュラム学習の利用を実演する。
論文 参考訳(メタデータ) (2021-12-03T14:01:16Z) - Investigating Bi-Level Optimization for Learning and Vision from a
Unified Perspective: A Survey and Beyond [114.39616146985001]
機械学習やコンピュータビジョンの分野では、モチベーションやメカニズムが異なるにもかかわらず、複雑な問題の多くは、一連の密接に関連するサブプロトコルを含んでいる。
本稿では,BLO(Bi-Level Optimization)の観点から,これらの複雑な学習と視覚問題を一様に表現する。
次に、値関数に基づく単一レベル再構成を構築し、主流勾配に基づくBLO手法を理解し、定式化するための統一的なアルゴリズムフレームワークを確立する。
論文 参考訳(メタデータ) (2021-01-27T16:20:23Z) - Behavior Priors for Efficient Reinforcement Learning [97.81587970962232]
本稿では,情報とアーキテクチャの制約を,確率論的モデリング文献のアイデアと組み合わせて行動の事前学習を行う方法について考察する。
このような潜伏変数の定式化が階層的強化学習(HRL)と相互情報と好奇心に基づく目的との関係について論じる。
シミュレーションされた連続制御領域に適用することで,フレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2020-10-27T13:17:18Z) - Learning Compositional Neural Programs for Continuous Control [62.80551956557359]
スパース逆連続制御問題に対する新しい解法を提案する。
我々のソリューションはAlphaNPI-Xと呼ばれ、学習の3つの段階を含む。
我々はAlphaNPI-Xがスパース操作の課題に効果的に取り組むことを実証的に示す。
論文 参考訳(メタデータ) (2020-07-27T08:27:14Z) - Concept Learners for Few-Shot Learning [76.08585517480807]
本研究では,人間の解釈可能な概念次元に沿って学習することで,一般化能力を向上させるメタ学習手法であるCOMETを提案する。
我々は,細粒度画像分類,文書分類,セルタイプアノテーションなど,さまざまな領域からの少数ショットタスクによるモデルの評価を行った。
論文 参考訳(メタデータ) (2020-07-14T22:04:17Z) - Self-organizing Democratized Learning: Towards Large-scale Distributed
Learning Systems [71.14339738190202]
民主化された学習(Dem-AI)は、大規模な分散および民主化された機械学習システムを構築するための基本原則を備えた全体主義的哲学を定めている。
本稿では,Dem-AI哲学にヒントを得た分散学習手法を提案する。
提案アルゴリズムは,従来のFLアルゴリズムと比較して,エージェントにおける学習モデルの一般化性能が向上することを示す。
論文 参考訳(メタデータ) (2020-07-07T08:34:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。