論文の概要: Executive Function: A Contrastive Value Policy for Resampling and
Relabeling Perceptions via Hindsight Summarization?
- arxiv url: http://arxiv.org/abs/2204.12639v1
- Date: Wed, 27 Apr 2022 00:07:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-29 00:13:42.791219
- Title: Executive Function: A Contrastive Value Policy for Resampling and
Relabeling Perceptions via Hindsight Summarization?
- Title(参考訳): エグゼクティブ機能:後見要約による知覚の再サンプリングとリラベル化のための対比的価値ポリシー?
- Authors: Chris Lengerich, Ben Lengerich
- Abstract要約: 第一原理から数発の継続的学習タスクを開発し、経営機能に対する進化的モチベーションと行動のメカニズムを仮説化する。
本稿では,このモデルを用いて意識の流れとして仮説テストを実施し,人間の数発の学習と神経解剖学の観察を解説する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We develop the few-shot continual learning task from first principles and
hypothesize an evolutionary motivation and mechanism of action for executive
function as a contrastive value policy which resamples and relabels perception
data via hindsight summarization to minimize attended prediction error, similar
to an online prompt engineering problem. This is made feasible by the use of a
memory policy and a pretrained network with inductive biases for a grammar of
learning and is trained to maximize evolutionary survival. We show how this
model of executive function can be used to implement hypothesis testing as a
stream of consciousness and may explain observations of human few-shot learning
and neuroanatomy.
- Abstract(参考訳): 我々は,初原理から数発の連続学習タスクを開発し,オンラインのプロンプトエンジニアリング問題のように,後続の要約による認識データの再サンプリングと再ラベルを行うコントラッシブバリューポリシとして,実行機能に対する進化的モチベーションと行動のメカニズムを仮説化した。
これは、学習文法の帰納バイアスを持つメモリポリシーと事前学習ネットワークを使用することで実現可能となり、進化的生存を最大化するために訓練される。
本稿では,このモデルを用いて意識の流れとして仮説テストを実施し,人間の数発の学習と神経解剖学の観察を説明する。
関連論文リスト
- Do Mice Grok? Glimpses of Hidden Progress During Overtraining in Sensory Cortex [32.79706360108185]
マウスにおけるこのような学習の証拠は, 動作がほぼ順調に保たれた後, タスクの継続訓練後に見つかる(オーバートレーニング)。
オーバートレーニングの開始時に誤って分類された例は,その間は行動が変化しなかったものの,後から即座に分類できることが実証された。
このモデルが,動物学習における逆転を過剰に学習する経験的パズルについて,どのように説明するかを示す。
論文 参考訳(メタデータ) (2024-11-05T22:42:49Z) - Repetition In Repetition Out: Towards Understanding Neural Text
Degeneration from the Data Perspective [91.14291142262262]
この研究は、データの観点から、単純で基本的な説明を提示する。
予備調査では, 退化問題とトレーニングデータにおける反復の有無との間には強い相関関係がみられた。
実験の結果,訓練データにおける繰り返しのペナルティ化は,より大きなモデルサイズや命令のチューニングを考慮しても重要な課題であることがわかった。
論文 参考訳(メタデータ) (2023-10-16T09:35:42Z) - Learning Theory of Mind via Dynamic Traits Attribution [59.9781556714202]
本稿では,過去のトラジェクトリからアクターの潜在特性ベクトルを生成するニューラルToMアーキテクチャを提案する。
この特性ベクトルは、予測ニューラルネットワークの高速重み付けスキームを介して予測機構を乗法的に変調する。
実験により,高速重量はエージェントの特性をモデル化し,マインドリーディング能力を向上させるために優れた誘導バイアスを与えることが示された。
論文 参考訳(メタデータ) (2022-04-17T11:21:18Z) - Neuronal Learning Analysis using Cycle-Consistent Adversarial Networks [4.874780144224057]
我々は、-CycleGANと呼ばれる深層生成モデルを用いて、前学習と後学習の神経活動の間の未知のマッピングを学習する。
我々は,カルシウム蛍光信号を前処理し,訓練し,評価するためのエンドツーエンドパイプラインを開発し,その結果の深層学習モデルを解釈する手法を開発した。
論文 参考訳(メタデータ) (2021-11-25T13:24:19Z) - Reducing Representation Drift in Online Continual Learning [87.71558506591937]
私たちは、エージェントが制限されたメモリと計算で変化する分布から学ぶ必要があるオンライン連続学習パラダイムを研究します。
この作業では、入ってくるデータストリームに未観測のクラスサンプルが導入されることにより、事前に観測されたデータの表現の変化に焦点を合わせます。
論文 参考訳(メタデータ) (2021-04-11T15:19:30Z) - Self-supervised driven consistency training for annotation efficient
histopathology image analysis [13.005873872821066]
大きなラベル付きデータセットでニューラルネットワークをトレーニングすることは、計算病理学において依然として支配的なパラダイムである。
本研究では,非教師付き表現学習のための強力な監視信号を学ぶために,ヒストロジ全体スライディング画像の背景となる多段階的文脈的手がかりを利用する自己教師付きプレテキストタスクを提案する。
また,タスク固有の未ラベルデータとの予測整合性に基づいて,事前学習した表現を下流タスクに効果的に転送することを学ぶ教師による半教師付き一貫性パラダイムを提案する。
論文 参考訳(メタデータ) (2021-02-07T19:46:21Z) - Parrot: Data-Driven Behavioral Priors for Reinforcement Learning [79.32403825036792]
そこで本研究では,実験で得られた複雑なインプット・アウトプット関係を事前に学習する手法を提案する。
RLエージェントが新規な動作を試す能力を阻害することなく、この学習が新しいタスクを迅速に学習するのにどのように役立つかを示す。
論文 参考訳(メタデータ) (2020-11-19T18:47:40Z) - Relaxing the Constraints on Predictive Coding Models [62.997667081978825]
予測符号化(英: Predictive coding)は、脳が行う主計算が予測誤差の最小化であるとする皮質機能の影響力のある理論である。
アルゴリズムの標準的な実装は、同じ前方と後方の重み、後方の非線形微分、1-1エラーユニット接続といった、潜在的に神経的に予測できない特徴を含んでいる。
本稿では,これらの特徴はアルゴリズムに不可欠なものではなく,Hebbianの更新ルールを用いてパラメータセットを直接あるいは学習することで,学習性能に悪影響を及ぼすことなく除去可能であることを示す。
論文 参考訳(メタデータ) (2020-10-02T15:21:37Z) - Value-driven Hindsight Modelling [68.658900923595]
値推定は強化学習(RL)パラダイムの重要な構成要素である。
モデル学習は、観測系列に存在する豊富な遷移構造を利用することができるが、このアプローチは通常、報酬関数に敏感ではない。
この2つの極点の間に位置するRLにおける表現学習のアプローチを開発する。
これにより、タスクに直接関連し、値関数の学習を加速できる、抽出可能な予測ターゲットが提供される。
論文 参考訳(メタデータ) (2020-02-19T18:10:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。