論文の概要: From Eye-blinks to State Construction: Diagnostic Benchmarks for Online
Representation Learning
- arxiv url: http://arxiv.org/abs/2011.04590v3
- Date: Thu, 18 Feb 2021 01:52:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 01:07:56.217941
- Title: From Eye-blinks to State Construction: Diagnostic Benchmarks for Online
Representation Learning
- Title(参考訳): eye-blinksからstate constructionへ:オンライン表現学習のための診断ベンチマーク
- Authors: Banafsheh Rafiee, Zaheer Abbas, Sina Ghiassian, Raksha Kumaraswamy,
Richard Sutton, Elliot Ludvig, Adam White
- Abstract要約: 古典的条件付け実験から着想を得た3つの新しい診断予測問題を提案する。
提案した課題は、動物が容易に提示できる学習能力を検証し、現在の反復学習方法の限界を強調することである。
- 参考スコア(独自算出の注目度): 7.1876449103312625
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Experiments in classical conditioning show that animals such as rabbits,
pigeons, and dogs can make long temporal associations that enable multi-step
prediction. To replicate this remarkable ability, an agent must construct an
internal state representation that summarizes its interaction history.
Recurrent neural networks can automatically construct state and learn temporal
associations. But the current training methods are prohibitively expensive for
online prediction -- continual learning on every time step -- which is the
focus of this paper. To facilitate research in online prediction, we present
three new diagnostic prediction problems inspired by classical-conditioning
experiments. The proposed problems test the learning capabilities that animals
readily exhibit and highlight the current recurrent learning methods'
limitations. While the proposed problems are nontrivial, they are still
amenable to extensive testing and analysis in the small-compute regime, thereby
enabling researchers to study issues in isolation carefully, ultimately
accelerating progress towards scalable online representation learning methods.
- Abstract(参考訳): 古典的なコンディショニングの実験では、ウサギ、ハト、犬などの動物は、複数段階の予測を可能にする長い時間的関連を作ることができる。
この顕著な能力を再現するには、エージェントはその相互作用履歴を要約する内部状態表現を構築する必要がある。
リカレントニューラルネットワークは状態を自動的に構築し、時間的関連を学習する。
しかし、現在のトレーニング手法は、オンライン予測 -- 時間ステップ毎に継続的に学習する -- において、極めて高価である。
オンライン予測の研究を容易にするために,古典的コンディショニング実験に触発された3つの新しい診断予測問題を提案する。
提案する課題は,動物が容易に提示できる学習能力をテストし,現在の学習方法の限界を強調するものである。
提案された問題は自明ではないが、小規模計算システムにおける広範なテストと分析に適しており、研究者は問題を分離して慎重に研究することができ、最終的にはスケーラブルなオンライン表現学習手法への進歩を加速することができる。
関連論文リスト
- Avoiding Catastrophic Forgetting in Visual Classification Using Human
Concept Formation [0.8159711103888622]
我々は,人間に似た学習システムであるCobweb上に構築された新しい視覚分類手法であるCobweb4Vを提案する。
本研究では,視覚概念の学習におけるCobweb4Vの有効性を示す総合的な評価を行う。
これらの特徴は、人間の認知における学習戦略と一致し、Cobweb4Vをニューラルネットワークアプローチの有望な代替品として位置づけている。
論文 参考訳(メタデータ) (2024-02-26T17:20:16Z) - Predicting long-term collective animal behavior with deep learning [67.06717327342473]
本研究は,魚種Hemigrammus rhodostomusにおける社会的相互作用の深層学習モデルを導入する。
実験結果と最先端解析モデルの結果を比較した。
我々は,ソーシャルインタラクションの機械学習モデルが,その分析モデルと直接競合できることを実証した。
論文 参考訳(メタデータ) (2023-02-14T05:25:03Z) - Critical Learning Periods for Multisensory Integration in Deep Networks [112.40005682521638]
ニューラルネットワークが様々な情報源からの情報を統合する能力は、トレーニングの初期段階において、適切な相関した信号に晒されることに批判的になることを示す。
臨界周期は、訓練されたシステムとその学習された表現の最終性能を決定づける、複雑で不安定な初期過渡的ダイナミクスから生じることを示す。
論文 参考訳(メタデータ) (2022-10-06T23:50:38Z) - Towards continual task learning in artificial neural networks: current
approaches and insights from neuroscience [0.0]
人間や他の動物が、多様で、しばしば干渉し、知識の範囲を学習する能力は、自然知性の目印である。
人工知能がさまざまなタスクやドメインをまたいで学習できることは、人工知能の明確な目標である。
論文 参考訳(メタデータ) (2021-12-28T13:50:51Z) - Autonomous Reinforcement Learning: Formalism and Benchmarking [106.25788536376007]
人間や動物が行うような現実世界の具体的学習は、連続的で非エポゾディックな世界にある。
RLの一般的なベンチマークタスクはエピソジックであり、試行錯誤によってエージェントに複数の試行を行う環境がリセットされる。
この相違は、擬似環境向けに開発されたRLアルゴリズムを現実世界のプラットフォーム上で実行しようとする場合、大きな課題となる。
論文 参考訳(メタデータ) (2021-12-17T16:28:06Z) - Reducing Catastrophic Forgetting in Self Organizing Maps with
Internally-Induced Generative Replay [67.50637511633212]
生涯学習エージェントは、パターン知覚データの無限のストリームから継続的に学習することができる。
適応するエージェントを構築する上での歴史的難しさの1つは、ニューラルネットワークが新しいサンプルから学ぶ際に、以前取得した知識を維持するのに苦労していることである。
この問題は破滅的な忘れ(干渉)と呼ばれ、今日の機械学習の領域では未解決の問題のままである。
論文 参考訳(メタデータ) (2021-12-09T07:11:14Z) - Overcoming the Domain Gap in Contrastive Learning of Neural Action
Representations [60.47807856873544]
神経科学の基本的な目標は、神経活動と行動の関係を理解することである。
我々は,ハエが自然に生み出す行動からなる新しいマルチモーダルデータセットを作成した。
このデータセットと新しい拡張セットは、神経科学における自己教師あり学習手法の適用を加速することを約束します。
論文 参考訳(メタデータ) (2021-11-29T15:27:51Z) - Neuronal Learning Analysis using Cycle-Consistent Adversarial Networks [4.874780144224057]
我々は、-CycleGANと呼ばれる深層生成モデルを用いて、前学習と後学習の神経活動の間の未知のマッピングを学習する。
我々は,カルシウム蛍光信号を前処理し,訓練し,評価するためのエンドツーエンドパイプラインを開発し,その結果の深層学習モデルを解釈する手法を開発した。
論文 参考訳(メタデータ) (2021-11-25T13:24:19Z) - Online Continual Learning with Natural Distribution Shifts: An Empirical
Study with Visual Data [101.6195176510611]
オンライン」連続学習は、情報保持とオンライン学習の有効性の両方を評価することができる。
オンライン連続学習では、入力される各小さなデータをまずテストに使用し、次にトレーニングセットに追加し、真にオンラインにします。
本稿では,大規模かつ自然な分布変化を示すオンライン連続視覚学習のための新しいベンチマークを提案する。
論文 参考訳(メタデータ) (2021-08-20T06:17:20Z) - Learning to Learn with Feedback and Local Plasticity [9.51828574518325]
我々はメタラーニングを用いて、フィードバック接続と局所的、生物学的にインスパイアされた学習ルールを用いて学習するネットワークを発見する。
実験の結果, メタトレーニングネットワークは, 多層アーキテクチャにおけるオンラインクレジット割り当てにフィードバック接続を効果的に利用していることがわかった。
論文 参考訳(メタデータ) (2020-06-16T22:49:07Z) - Shortcut Learning in Deep Neural Networks [29.088631285225237]
深層学習の問題のどれ程が、同じ根底にある問題であるショートカット学習の異なる症状と見なすことができるのかを精査することを模索する。
ショートカットは標準的なベンチマークでうまく機能するが、現実のシナリオのようなより困難なテスト条件に移行できない決定ルールである。
我々は、モデル解釈とベンチマークのためのレコメンデーションを開発し、実験室から現実のアプリケーションへの堅牢性と伝達性を改善するために、機械学習の最近の進歩を強調した。
論文 参考訳(メタデータ) (2020-04-16T17:18:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。