Fugu-MT 論文翻訳(概要): From Eye-blinks to State Construction: Diagnostic Benchmarks for Online Representation Learning

論文の概要: From Eye-blinks to State Construction: Diagnostic Benchmarks for Online Representation Learning

arxiv url: http://arxiv.org/abs/2011.04590v3
Date: Thu, 18 Feb 2021 01:52:57 GMT
ステータス: 翻訳完了
システム内更新日: 2022-09-28 01:07:56.217941
Title: From Eye-blinks to State Construction: Diagnostic Benchmarks for Online Representation Learning
Title（参考訳）: eye-blinksからstate constructionへ:オンライン表現学習のための診断ベンチマーク
Authors: Banafsheh Rafiee, Zaheer Abbas, Sina Ghiassian, Raksha Kumaraswamy, Richard Sutton, Elliot Ludvig, Adam White
Abstract要約: 古典的条件付け実験から着想を得た3つの新しい診断予測問題を提案する。提案した課題は、動物が容易に提示できる学習能力を検証し、現在の反復学習方法の限界を強調することである。
参考スコア（独自算出の注目度）: 7.1876449103312625
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Experiments in classical conditioning show that animals such as rabbits, pigeons, and dogs can make long temporal associations that enable multi-step prediction. To replicate this remarkable ability, an agent must construct an internal state representation that summarizes its interaction history. Recurrent neural networks can automatically construct state and learn temporal associations. But the current training methods are prohibitively expensive for online prediction -- continual learning on every time step -- which is the focus of this paper. To facilitate research in online prediction, we present three new diagnostic prediction problems inspired by classical-conditioning experiments. The proposed problems test the learning capabilities that animals readily exhibit and highlight the current recurrent learning methods' limitations. While the proposed problems are nontrivial, they are still amenable to extensive testing and analysis in the small-compute regime, thereby enabling researchers to study issues in isolation carefully, ultimately accelerating progress towards scalable online representation learning methods.
Abstract（参考訳）: 古典的なコンディショニングの実験では、ウサギ、ハト、犬などの動物は、複数段階の予測を可能にする長い時間的関連を作ることができる。この顕著な能力を再現するには、エージェントはその相互作用履歴を要約する内部状態表現を構築する必要がある。リカレントニューラルネットワークは状態を自動的に構築し、時間的関連を学習する。しかし、現在のトレーニング手法は、オンライン予測 -- 時間ステップ毎に継続的に学習する -- において、極めて高価である。オンライン予測の研究を容易にするために,古典的コンディショニング実験に触発された3つの新しい診断予測問題を提案する。提案する課題は,動物が容易に提示できる学習能力をテストし,現在の学習方法の限界を強調するものである。提案された問題は自明ではないが、小規模計算システムにおける広範なテストと分析に適しており、研究者は問題を分離して慎重に研究することができ、最終的にはスケーラブルなオンライン表現学習手法への進歩を加速することができる。

関連論文リスト

Behavioral Exploration: Learning to Explore via In-Context Adaptation [53.92981562916783]
我々は、過去の観察の文脈で条件付けられた専門家の行動を予測し、専門家の行動がこの文脈とどのように関係しているかを測定するために、長期コンテキスト生成モデルを訓練する。これにより、モデルが専門家の振る舞いを模倣するだけでなく、過去の相互作用の歴史を文脈に反映することで、これまで選択されたものと異なる専門家の振る舞いを選択することができる。本手法は実環境におけるロボット操作作業だけでなく,シミュレーションロコモーションと操作設定の両方において有効であることを示す。
論文参考訳（メタデータ） (2025-07-11T21:36:19Z)
An Investigation into Maintenance Support for Neural Networks [5.69361786082969]
ニューラルネットワークの維持における研究と実践の現状について検討する。以上の結果から,既存のツールは主にモデルの構築とトレーニングに重点を置いていることが示唆された。我々の研究は、現在のプラクティスが不足している部分について開発者中心の視点を提供することを目的としており、ニューラルネットワークのメンテナンスサポートを改善する機会を強調している。
論文参考訳（メタデータ） (2025-07-07T17:53:15Z)
Meta-Representational Predictive Coding: Biomimetic Self-Supervised Learning [51.22185316175418]
メタ表現予測符号化(MPC)と呼ばれる新しい予測符号化方式を提案する。 MPCは、並列ストリームにまたがる感覚入力の表現を予測することを学ぶことによって、感覚入力の生成モデルを学ぶ必要性を助長する。
論文参考訳（メタデータ） (2025-03-22T22:13:14Z)
Deep Learning Through A Telescoping Lens: A Simple Model Provides Empirical Insights On Grokking, Gradient Boosting & Beyond [61.18736646013446]
その驚くべき振る舞いをより深く理解するために、トレーニングされたニューラルネットワークの単純かつ正確なモデルの有用性について検討する。 3つのケーススタディで、様々な顕著な現象に関する新しい経験的洞察を導き出すためにどのように適用できるかを説明します。
論文参考訳（メタデータ） (2024-10-31T22:54:34Z)
Life, uh, Finds a Way: Systematic Neural Search [2.163881720692685]
エージェントの動作に迅速に適応して、設定における継続的な問題を解決するという課題に取り組みます。深層強化学習に焦点をあてる代わりに,探索手順の物理的表現としての視聴行動を提案する。本稿では,行動実行とグラフの突然変異の間の厳密なフィードバックループを調節することにより,行動の暗黙的な列挙を行うアルゴリズムについて述べる。
論文参考訳（メタデータ） (2024-10-02T09:06:54Z)
Stimulus-to-Stimulus Learning in RNNs with Cortical Inductive Biases [0.0]
大脳皮質に広まる2種類の誘導バイアスを用いた刺激置換の繰り返しニューラルネットワークモデルを提案する。本研究では,モデルが幅広い条件づけ現象を発生させ,学習量と多数の関連性を学習可能であることを示す。我々の枠組みは、大脳皮質におけるマルチコンパートメントニューロン処理の重要性を強調し、大脳皮質動物を進化の端とみなす方法を示している。
論文参考訳（メタデータ） (2024-09-20T13:01:29Z)
Critical Learning Periods for Multisensory Integration in Deep Networks [112.40005682521638]
ニューラルネットワークが様々な情報源からの情報を統合する能力は、トレーニングの初期段階において、適切な相関した信号に晒されることに批判的になることを示す。臨界周期は、訓練されたシステムとその学習された表現の最終性能を決定づける、複雑で不安定な初期過渡的ダイナミクスから生じることを示す。
論文参考訳（メタデータ） (2022-10-06T23:50:38Z)
Autonomous Reinforcement Learning: Formalism and Benchmarking [106.25788536376007]
人間や動物が行うような現実世界の具体的学習は、連続的で非エポゾディックな世界にある。 RLの一般的なベンチマークタスクはエピソジックであり、試行錯誤によってエージェントに複数の試行を行う環境がリセットされる。この相違は、擬似環境向けに開発されたRLアルゴリズムを現実世界のプラットフォーム上で実行しようとする場合、大きな課題となる。
論文参考訳（メタデータ） (2021-12-17T16:28:06Z)
Reducing Catastrophic Forgetting in Self Organizing Maps with Internally-Induced Generative Replay [67.50637511633212]
生涯学習エージェントは、パターン知覚データの無限のストリームから継続的に学習することができる。適応するエージェントを構築する上での歴史的難しさの1つは、ニューラルネットワークが新しいサンプルから学ぶ際に、以前取得した知識を維持するのに苦労していることである。この問題は破滅的な忘れ(干渉)と呼ばれ、今日の機械学習の領域では未解決の問題のままである。
論文参考訳（メタデータ） (2021-12-09T07:11:14Z)
Overcoming the Domain Gap in Contrastive Learning of Neural Action Representations [60.47807856873544]
神経科学の基本的な目標は、神経活動と行動の関係を理解することである。我々は,ハエが自然に生み出す行動からなる新しいマルチモーダルデータセットを作成した。このデータセットと新しい拡張セットは、神経科学における自己教師あり学習手法の適用を加速することを約束します。
論文参考訳（メタデータ） (2021-11-29T15:27:51Z)
Neuronal Learning Analysis using Cycle-Consistent Adversarial Networks [4.874780144224057]
我々は、-CycleGANと呼ばれる深層生成モデルを用いて、前学習と後学習の神経活動の間の未知のマッピングを学習する。我々は,カルシウム蛍光信号を前処理し,訓練し,評価するためのエンドツーエンドパイプラインを開発し,その結果の深層学習モデルを解釈する手法を開発した。
論文参考訳（メタデータ） (2021-11-25T13:24:19Z)
Online Continual Learning with Natural Distribution Shifts: An Empirical Study with Visual Data [101.6195176510611]
オンライン」連続学習は、情報保持とオンライン学習の有効性の両方を評価することができる。オンライン連続学習では、入力される各小さなデータをまずテストに使用し、次にトレーニングセットに追加し、真にオンラインにします。本稿では,大規模かつ自然な分布変化を示すオンライン連続視覚学習のための新しいベンチマークを提案する。
論文参考訳（メタデータ） (2021-08-20T06:17:20Z)
Learning to Learn with Feedback and Local Plasticity [9.51828574518325]
我々はメタラーニングを用いて、フィードバック接続と局所的、生物学的にインスパイアされた学習ルールを用いて学習するネットワークを発見する。実験の結果, メタトレーニングネットワークは, 多層アーキテクチャにおけるオンラインクレジット割り当てにフィードバック接続を効果的に利用していることがわかった。
論文参考訳（メタデータ） (2020-06-16T22:49:07Z)
Shortcut Learning in Deep Neural Networks [29.088631285225237]
深層学習の問題のどれ程が、同じ根底にある問題であるショートカット学習の異なる症状と見なすことができるのかを精査することを模索する。ショートカットは標準的なベンチマークでうまく機能するが、現実のシナリオのようなより困難なテスト条件に移行できない決定ルールである。我々は、モデル解釈とベンチマークのためのレコメンデーションを開発し、実験室から現実のアプリケーションへの堅牢性と伝達性を改善するために、機械学習の最近の進歩を強調した。
論文参考訳（メタデータ） (2020-04-16T17:18:49Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。