論文の概要: From Eye-blinks to State Construction: Diagnostic Benchmarks for Online
Representation Learning
- arxiv url: http://arxiv.org/abs/2011.04590v3
- Date: Thu, 18 Feb 2021 01:52:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 01:07:56.217941
- Title: From Eye-blinks to State Construction: Diagnostic Benchmarks for Online
Representation Learning
- Title(参考訳): eye-blinksからstate constructionへ:オンライン表現学習のための診断ベンチマーク
- Authors: Banafsheh Rafiee, Zaheer Abbas, Sina Ghiassian, Raksha Kumaraswamy,
Richard Sutton, Elliot Ludvig, Adam White
- Abstract要約: 古典的条件付け実験から着想を得た3つの新しい診断予測問題を提案する。
提案した課題は、動物が容易に提示できる学習能力を検証し、現在の反復学習方法の限界を強調することである。
- 参考スコア(独自算出の注目度): 7.1876449103312625
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Experiments in classical conditioning show that animals such as rabbits,
pigeons, and dogs can make long temporal associations that enable multi-step
prediction. To replicate this remarkable ability, an agent must construct an
internal state representation that summarizes its interaction history.
Recurrent neural networks can automatically construct state and learn temporal
associations. But the current training methods are prohibitively expensive for
online prediction -- continual learning on every time step -- which is the
focus of this paper. To facilitate research in online prediction, we present
three new diagnostic prediction problems inspired by classical-conditioning
experiments. The proposed problems test the learning capabilities that animals
readily exhibit and highlight the current recurrent learning methods'
limitations. While the proposed problems are nontrivial, they are still
amenable to extensive testing and analysis in the small-compute regime, thereby
enabling researchers to study issues in isolation carefully, ultimately
accelerating progress towards scalable online representation learning methods.
- Abstract(参考訳): 古典的なコンディショニングの実験では、ウサギ、ハト、犬などの動物は、複数段階の予測を可能にする長い時間的関連を作ることができる。
この顕著な能力を再現するには、エージェントはその相互作用履歴を要約する内部状態表現を構築する必要がある。
リカレントニューラルネットワークは状態を自動的に構築し、時間的関連を学習する。
しかし、現在のトレーニング手法は、オンライン予測 -- 時間ステップ毎に継続的に学習する -- において、極めて高価である。
オンライン予測の研究を容易にするために,古典的コンディショニング実験に触発された3つの新しい診断予測問題を提案する。
提案する課題は,動物が容易に提示できる学習能力をテストし,現在の学習方法の限界を強調するものである。
提案された問題は自明ではないが、小規模計算システムにおける広範なテストと分析に適しており、研究者は問題を分離して慎重に研究することができ、最終的にはスケーラブルなオンライン表現学習手法への進歩を加速することができる。
関連論文リスト
- Deep Learning Through A Telescoping Lens: A Simple Model Provides Empirical Insights On Grokking, Gradient Boosting & Beyond [61.18736646013446]
その驚くべき振る舞いをより深く理解するために、トレーニングされたニューラルネットワークの単純かつ正確なモデルの有用性について検討する。
3つのケーススタディで、様々な顕著な現象に関する新しい経験的洞察を導き出すためにどのように適用できるかを説明します。
論文 参考訳(メタデータ) (2024-10-31T22:54:34Z) - Life, uh, Finds a Way: Systematic Neural Search [2.163881720692685]
エージェントの動作に迅速に適応して、設定における継続的な問題を解決するという課題に取り組みます。
深層強化学習に焦点をあてる代わりに,探索手順の物理的表現としての視聴行動を提案する。
本稿では,行動実行とグラフの突然変異の間の厳密なフィードバックループを調節することにより,行動の暗黙的な列挙を行うアルゴリズムについて述べる。
論文 参考訳(メタデータ) (2024-10-02T09:06:54Z) - Stimulus-to-Stimulus Learning in RNNs with Cortical Inductive Biases [0.0]
大脳皮質に広まる2種類の誘導バイアスを用いた刺激置換の繰り返しニューラルネットワークモデルを提案する。
本研究では,モデルが幅広い条件づけ現象を発生させ,学習量と多数の関連性を学習可能であることを示す。
我々の枠組みは、大脳皮質におけるマルチコンパートメントニューロン処理の重要性を強調し、大脳皮質動物を進化の端とみなす方法を示している。
論文 参考訳(メタデータ) (2024-09-20T13:01:29Z) - Critical Learning Periods for Multisensory Integration in Deep Networks [112.40005682521638]
ニューラルネットワークが様々な情報源からの情報を統合する能力は、トレーニングの初期段階において、適切な相関した信号に晒されることに批判的になることを示す。
臨界周期は、訓練されたシステムとその学習された表現の最終性能を決定づける、複雑で不安定な初期過渡的ダイナミクスから生じることを示す。
論文 参考訳(メタデータ) (2022-10-06T23:50:38Z) - Autonomous Reinforcement Learning: Formalism and Benchmarking [106.25788536376007]
人間や動物が行うような現実世界の具体的学習は、連続的で非エポゾディックな世界にある。
RLの一般的なベンチマークタスクはエピソジックであり、試行錯誤によってエージェントに複数の試行を行う環境がリセットされる。
この相違は、擬似環境向けに開発されたRLアルゴリズムを現実世界のプラットフォーム上で実行しようとする場合、大きな課題となる。
論文 参考訳(メタデータ) (2021-12-17T16:28:06Z) - Reducing Catastrophic Forgetting in Self Organizing Maps with
Internally-Induced Generative Replay [67.50637511633212]
生涯学習エージェントは、パターン知覚データの無限のストリームから継続的に学習することができる。
適応するエージェントを構築する上での歴史的難しさの1つは、ニューラルネットワークが新しいサンプルから学ぶ際に、以前取得した知識を維持するのに苦労していることである。
この問題は破滅的な忘れ(干渉)と呼ばれ、今日の機械学習の領域では未解決の問題のままである。
論文 参考訳(メタデータ) (2021-12-09T07:11:14Z) - Overcoming the Domain Gap in Contrastive Learning of Neural Action
Representations [60.47807856873544]
神経科学の基本的な目標は、神経活動と行動の関係を理解することである。
我々は,ハエが自然に生み出す行動からなる新しいマルチモーダルデータセットを作成した。
このデータセットと新しい拡張セットは、神経科学における自己教師あり学習手法の適用を加速することを約束します。
論文 参考訳(メタデータ) (2021-11-29T15:27:51Z) - Neuronal Learning Analysis using Cycle-Consistent Adversarial Networks [4.874780144224057]
我々は、-CycleGANと呼ばれる深層生成モデルを用いて、前学習と後学習の神経活動の間の未知のマッピングを学習する。
我々は,カルシウム蛍光信号を前処理し,訓練し,評価するためのエンドツーエンドパイプラインを開発し,その結果の深層学習モデルを解釈する手法を開発した。
論文 参考訳(メタデータ) (2021-11-25T13:24:19Z) - Online Continual Learning with Natural Distribution Shifts: An Empirical
Study with Visual Data [101.6195176510611]
オンライン」連続学習は、情報保持とオンライン学習の有効性の両方を評価することができる。
オンライン連続学習では、入力される各小さなデータをまずテストに使用し、次にトレーニングセットに追加し、真にオンラインにします。
本稿では,大規模かつ自然な分布変化を示すオンライン連続視覚学習のための新しいベンチマークを提案する。
論文 参考訳(メタデータ) (2021-08-20T06:17:20Z) - Learning to Learn with Feedback and Local Plasticity [9.51828574518325]
我々はメタラーニングを用いて、フィードバック接続と局所的、生物学的にインスパイアされた学習ルールを用いて学習するネットワークを発見する。
実験の結果, メタトレーニングネットワークは, 多層アーキテクチャにおけるオンラインクレジット割り当てにフィードバック接続を効果的に利用していることがわかった。
論文 参考訳(メタデータ) (2020-06-16T22:49:07Z) - Shortcut Learning in Deep Neural Networks [29.088631285225237]
深層学習の問題のどれ程が、同じ根底にある問題であるショートカット学習の異なる症状と見なすことができるのかを精査することを模索する。
ショートカットは標準的なベンチマークでうまく機能するが、現実のシナリオのようなより困難なテスト条件に移行できない決定ルールである。
我々は、モデル解釈とベンチマークのためのレコメンデーションを開発し、実験室から現実のアプリケーションへの堅牢性と伝達性を改善するために、機械学習の最近の進歩を強調した。
論文 参考訳(メタデータ) (2020-04-16T17:18:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。