論文の概要: Exploration With a Finite Brain
- arxiv url: http://arxiv.org/abs/2201.11817v1
- Date: Thu, 27 Jan 2022 21:49:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-01 10:24:41.995041
- Title: Exploration With a Finite Brain
- Title(参考訳): 有限の脳による探索
- Authors: Marcel Binz, Eric Schulz
- Abstract要約: 人間は探検と搾取のトレードオフを懸命に管理しているようだ。
本稿では,メタラーニング強化学習アルゴリズムを用いて,短い記述長で性能を犠牲にする仮説について検討する。
さらに、記述長の変化が意図した効果をもたらすことを実証する。記述長の減少は、脳卒中患者の振る舞いを捉えながら、青年期の認知発達を反映する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Equipping artificial agents with useful exploration mechanisms remains a
challenge to this day. Humans, on the other hand, seem to manage the trade-off
between exploration and exploitation effortlessly. In the present article, we
put forward the hypothesis that they accomplish this by making optimal use of
limited computational resources. We study this hypothesis by meta-learning
reinforcement learning algorithms that sacrifice performance for a shorter
description length. The emerging class of models captures human exploration
behavior better than previously considered approaches, such as Boltzmann
exploration, upper confidence bound algorithms, and Thompson sampling. We
additionally demonstrate that changes in description length produce the
intended effects: reducing description length captures the behavior of
brain-lesioned patients while increasing it echoes cognitive development during
adolescence.
- Abstract(参考訳): 有用な探索メカニズムを備えた人工エージェントの装備は、今日でも課題となっている。
一方、人間は探索と搾取の間のトレードオフを無益に管理しているように見える。
本稿では,限られた計算資源を最適に利用することでこれを達成できるという仮説を提起する。
この仮説をメタラーニング強化学習アルゴリズムを用いて検討し,短い記述期間で性能を犠牲にする。
新たなタイプのモデルでは、ボルツマン探索、高信頼境界アルゴリズム、トンプソンサンプリングなど、以前に検討されたアプローチよりも人間の探索行動をキャプチャする。
さらに、記述長の変化が意図した効果をもたらすことを実証する。記述長の減少は、脳卒中患者の振る舞いを捉えながら、青年期の認知発達を反映する。
関連論文リスト
- Neural Population Geometry and Optimal Coding of Tasks with Shared
Latent Structure [4.490493754303233]
我々は,多タスク学習問題において,神経集団の活動のメソスコピック統計と一般化性能を関連付ける理論を開発した。
実験により得られた因子化(あるいは非絡み合い)表現が最適解として自然に現れることを示す。
続いて、データが不足している場合、最適なコードは情報に富んだ潜伏変数を圧縮せず、データが豊富であれば、最適なコードは状態空間にこの情報を拡大することを示す。
論文 参考訳(メタデータ) (2024-02-26T17:39:23Z) - A Goal-Driven Approach to Systems Neuroscience [2.6451153531057985]
人間と動物は、動的環境において様々な興味深い行動を示す。
私たちの脳が、こうした行動を可能にするために、どのようにしてこの密集した感覚情報を積極的に再構築するかは不明です。
我々は、ニューラルサーキットの統一構造モデルと機能モデルを生み出すことを約束する新しい解釈可能性の定義を提供する。
論文 参考訳(メタデータ) (2023-11-05T16:37:53Z) - Neural Amortized Inference for Nested Multi-agent Reasoning [54.39127942041582]
本研究では,人間のような推論能力と計算限界のギャップを埋める新しい手法を提案する。
提案手法を2つの挑戦的マルチエージェント相互作用領域で評価する。
論文 参考訳(メタデータ) (2023-08-21T22:40:36Z) - NeuroExplainer: Fine-Grained Attention Decoding to Uncover Cortical
Development Patterns of Preterm Infants [73.85768093666582]
我々はNeuroExplainerと呼ばれる説明可能な幾何学的深層ネットワークを提案する。
NeuroExplainerは、早産に伴う幼児の皮質発達パターンの解明に使用される。
論文 参考訳(メタデータ) (2023-01-01T12:48:12Z) - A Neural Active Inference Model of Perceptual-Motor Learning [62.39667564455059]
アクティブ推論フレームワーク(英: active inference framework、AIF)は、現代の神経科学を基盤とした、有望な新しい計算フレームワークである。
本研究では,ヒトの視覚行動指導において,AIFが期待する役割を捉える能力をテストする。
本稿では,多次元世界状態から自由エネルギーの一次元分布にマッピングする先行関数の新たな定式化について述べる。
論文 参考訳(メタデータ) (2022-11-16T20:00:38Z) - Guarantees for Epsilon-Greedy Reinforcement Learning with Function
Approximation [69.1524391595912]
エプシロングレーディ、ソフトマックス、ガウシアンノイズといった神秘的な探索政策は、いくつかの強化学習タスクにおいて効率的に探索することができない。
本稿では,このような政策を理論的に分析し,筋電図探索による強化学習のための最初の後悔とサンプル複雑度境界を提供する。
論文 参考訳(メタデータ) (2022-06-19T14:44:40Z) - Learning Theory of Mind via Dynamic Traits Attribution [59.9781556714202]
本稿では,過去のトラジェクトリからアクターの潜在特性ベクトルを生成するニューラルToMアーキテクチャを提案する。
この特性ベクトルは、予測ニューラルネットワークの高速重み付けスキームを介して予測機構を乗法的に変調する。
実験により,高速重量はエージェントの特性をモデル化し,マインドリーディング能力を向上させるために優れた誘導バイアスを与えることが示された。
論文 参考訳(メタデータ) (2022-04-17T11:21:18Z) - Bayesian sense of time in biological and artificial brains [1.52292571922932]
時間の経過を処理する脳の能力は、私たちの経験の基本的な次元の1つです。
ベイジアン脳仮説を用いて、人間の時間知覚に関する経験的データをどのように説明できるのか?
エージェントベースの機械学習モデルは、この主題の研究にどのような洞察を与えることができるのか?
論文 参考訳(メタデータ) (2022-01-14T14:05:30Z) - A Developmental Neuro-Robotics Approach for Boosting the Recognition of
Handwritten Digits [91.3755431537592]
近年のエビデンスでは、子どもの体現戦略をシミュレーションすることで、マシンインテリジェンスも改善できることが示されている。
本稿では,発達神経ロボティクスの文脈における畳み込みニューラルネットワークモデルへの具体的戦略の適用について検討する。
論文 参考訳(メタデータ) (2020-03-23T14:55:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。