論文の概要: Uncertainty-based Modulation for Lifelong Learning
- arxiv url: http://arxiv.org/abs/2001.09822v1
- Date: Mon, 27 Jan 2020 14:34:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-06 07:40:29.163491
- Title: Uncertainty-based Modulation for Lifelong Learning
- Title(参考訳): 不確実性に基づく生涯学習の変調
- Authors: Andrew Brna, Ryan Brown, Patrick Connolly, Stephen Simons, Renee
Shimizu, Mario Aguilar-Simon
- Abstract要約: 本稿では、Stephen Grossberg氏のAdaptive Resonance Theory(Adaptive Resonance Theory)提案に基づき、ヒト脳の神経調節機構にインスパイアされたアルゴリズムを提案する。
具体的には、不確実性の概念に基づいて構築され、継続的な学習を可能にするために一連の神経調節機構を使用している。
我々は,環境やエージェントの行動が学習過程を制約し,指導する閉ループ方式でこれらのシステムを開発する上で重要な役割を実証する。
- 参考スコア(独自算出の注目度): 1.3334365645271111
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The creation of machine learning algorithms for intelligent agents capable of
continuous, lifelong learning is a critical objective for algorithms being
deployed on real-life systems in dynamic environments. Here we present an
algorithm inspired by neuromodulatory mechanisms in the human brain that
integrates and expands upon Stephen Grossberg\'s ground-breaking Adaptive
Resonance Theory proposals. Specifically, it builds on the concept of
uncertainty, and employs a series of neuromodulatory mechanisms to enable
continuous learning, including self-supervised and one-shot learning. Algorithm
components were evaluated in a series of benchmark experiments that demonstrate
stable learning without catastrophic forgetting. We also demonstrate the
critical role of developing these systems in a closed-loop manner where the
environment and the agent\'s behaviors constrain and guide the learning
process. To this end, we integrated the algorithm into an embodied simulated
drone agent. The experiments show that the algorithm is capable of continuous
learning of new tasks and under changed conditions with high classification
accuracy (greater than 94 percent) in a virtual environment, without
catastrophic forgetting. The algorithm accepts high dimensional inputs from any
state-of-the-art detection and feature extraction algorithms, making it a
flexible addition to existing systems. We also describe future development
efforts focused on imbuing the algorithm with mechanisms to seek out new
knowledge as well as employ a broader range of neuromodulatory processes.
- Abstract(参考訳): 連続的な生涯学習が可能な知的エージェントのための機械学習アルゴリズムの作成は、動的環境における実生活システム上にデプロイされるアルゴリズムの重要な目的である。
本稿では,stephen grossberg\ による適応共鳴理論の提案を統合し,拡張するヒト脳の神経調節機構に触発されたアルゴリズムを提案する。
具体的には、不確実性の概念に基づいており、自律学習やワンショット学習など、継続的な学習を可能にする一連の神経調節機構を採用している。
アルゴリズムコンポーネントは、破滅的な忘れずに安定した学習を示す一連のベンチマーク実験で評価された。
また,環境やエージェントの行動に制約を課し,学習プロセスを導くクローズドループ方式でこれらのシステムを開発する上で重要な役割を示す。
この目的のために、我々はアルゴリズムを擬似ドローンエージェントに統合した。
実験の結果、このアルゴリズムは新しいタスクの連続学習が可能であり、破滅的な忘れをすることなく、仮想環境において高い分類精度(94%以上)で変化した条件下での学習が可能であった。
このアルゴリズムは、最先端検出および特徴抽出アルゴリズムから高次元入力を受け取り、既存のシステムに柔軟な追加を可能にする。
また、新しい知識を求めるメカニズムをアルゴリズムに付与し、より幅広い神経調節過程を採用することに焦点を当てた今後の開発努力についても述べる。
関連論文リスト
- Ornstein-Uhlenbeck Adaptation as a Mechanism for Learning in Brains and Machines [2.1168858935852013]
システムのパラメータと大域的強化信号のノイズを利用する新しい手法を提案する。
連続的に動作し、学習の一般的なメカニズムとしてオルシュタイン・ウレンベック適応(OUA)が提案されている。
OUAは、ニューロモルフィックコンピューティングに潜在的に応用可能な、従来の勾配に基づく手法に代わる実行可能な代替手段を提供する。
論文 参考訳(メタデータ) (2024-10-17T14:00:18Z) - A Unified Framework for Neural Computation and Learning Over Time [56.44910327178975]
Hamiltonian Learningはニューラルネットワークを"時間とともに"学習するための新しい統合フレームワーク
i)外部ソフトウェアソルバを必要とせずに統合できる、(ii)フィードフォワードおよびリカレントネットワークにおける勾配に基づく学習の概念を一般化する、(iii)新しい視点で開放する、という微分方程式に基づいている。
論文 参考訳(メタデータ) (2024-09-18T14:57:13Z) - Towards Biologically Plausible Computing: A Comprehensive Comparison [24.299920289520013]
バックプロパゲーションは、教師あり学習のためのニューラルネットワークのトレーニングの基盤となるアルゴリズムである。
バックプロパゲーションの生物学的妥当性は、重量対称性、大域的誤差計算、二重位相学習の要求により疑問視される。
本研究では,望ましい学習アルゴリズムが満たすべき生物学的妥当性の基準を確立する。
論文 参考訳(メタデータ) (2024-06-23T09:51:20Z) - Stochastic Online Optimization for Cyber-Physical and Robotic Systems [9.392372266209103]
本稿では,サイバー物理・ロボットシステムの文脈におけるプログラミング問題の解決のための新しいオンラインフレームワークを提案する。
我々の問題定式化制約は、一般に連続状態とアクション空間が非線形であるサイバー物理システムの進化をモデル化する。
我々は, 力学の粗い推定でも, アルゴリズムの収束性を大幅に向上させることができることを示した。
論文 参考訳(メタデータ) (2024-04-08T09:08:59Z) - Brain-Inspired Machine Intelligence: A Survey of
Neurobiologically-Plausible Credit Assignment [65.268245109828]
本稿では,神経生物学にインスパイアされた,あるいは動機付けられた人工ニューラルネットワークにおける信用割当を行うアルゴリズムについて検討する。
我々は、脳にインスパイアされた学習スキームを6つの一般的なファミリーにまとめ、これらを誤りのバックプロパゲーションの文脈で検討する。
本研究の成果は,神経ミメティックシステムとその構成的学習プロセスの今後の発展を促進することを目的としている。
論文 参考訳(メタデータ) (2023-12-01T05:20:57Z) - The Clock and the Pizza: Two Stories in Mechanistic Explanation of
Neural Networks [59.26515696183751]
ニューラルネットワークにおけるアルゴリズム発見は、時としてより複雑であることを示す。
単純な学習問題でさえ、驚くほど多様なソリューションを許容できることが示されています。
論文 参考訳(メタデータ) (2023-06-30T17:59:13Z) - Learning low-dimensional dynamics from whole-brain data improves task
capture [2.82277518679026]
逐次変分オートエンコーダ(SVAE)を用いたニューラルダイナミクスの低次元近似学習手法を提案する。
本手法は,従来の手法よりも精度の高い認知過程を予測できるスムーズなダイナミクスを見出す。
我々は、モータ、ワーキングメモリ、リレーショナル処理タスクを含む様々なタスクfMRIデータセットに対するアプローチを評価した。
論文 参考訳(メタデータ) (2023-05-18T18:43:13Z) - Incremental procedural and sensorimotor learning in cognitive humanoid
robots [52.77024349608834]
本研究は,手順を段階的に学習する認知エージェントを提案する。
各サブステージで必要とされる認知機能と, エージェントが未解決の課題に, 新たな機能の追加がどう対処するかを示す。
結果は、このアプローチが複雑なタスクを段階的に解くことができることを示している。
論文 参考訳(メタデータ) (2023-04-30T22:51:31Z) - Backprop-Free Reinforcement Learning with Active Neural Generative
Coding [84.11376568625353]
動的環境におけるエラー(バックプロップ)のバックプロパゲーションを伴わない行動駆動型生成モデルの学習のための計算フレームワークを提案する。
我々は、まばらな報酬でも機能するインテリジェントエージェントを開発し、推論として計画の認知理論からインスピレーションを得ている。
我々のエージェントの堅牢な性能は、神経推論と学習のためのバックプロップフリーアプローチがゴール指向の行動を促進するという有望な証拠を提供する。
論文 参考訳(メタデータ) (2021-07-10T19:02:27Z) - AutoML-Zero: Evolving Machine Learning Algorithms From Scratch [76.83052807776276]
基本数学的操作をビルディングブロックとして使うだけで,完全な機械学習アルゴリズムを自動的に発見できることが示される。
汎用的な検索空間を通じて人間のバイアスを大幅に低減する新しいフレームワークを導入することでこれを実証する。
機械学習アルゴリズムをゼロから発見する上で、これらの予備的な成功は、この分野における有望な新しい方向性を示していると信じている。
論文 参考訳(メタデータ) (2020-03-06T19:00:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。