論文の概要: Active Tree Search in Large POMDPs
- arxiv url: http://arxiv.org/abs/2103.13860v1
- Date: Thu, 25 Mar 2021 14:17:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-26 18:19:30.797417
- Title: Active Tree Search in Large POMDPs
- Title(参考訳): 大型PMDPにおけるアクティブツリー探索
- Authors: Domenico Maisto, Francesco Gregoretti, Karl Friston, Giovanni Pezzulo
- Abstract要約: 大規模POMDP(Active Tree Search)で計画する新しい手法を提案する。
これは、神経科学における主要な計画理論(活性推論)の規範的性格と生物学的リアリズムと、AIにおけるモンテカルロ法の拡張性を組み合わせたものである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Model-based planning and prospection are widely studied in both cognitive
neuroscience and artificial intelligence (AI), but from different perspectives
- and with different desiderata in mind (biological realism versus scalability)
that are difficult to reconcile. Here, we introduce a novel method to plan in
large POMDPs - Active Tree Search - that combines the normative character and
biological realism of a leading planning theory in neuroscience (Active
Inference) and the scalability of Monte-Carlo methods in AI. This unification
is beneficial for both approaches. On the one hand, using Monte-Carlo planning
permits scaling up the biologically grounded approach of Active Inference to
large-scale problems. On the other hand, the theory of Active Inference
provides a principled solution to the balance of exploration and exploitation,
which is often addressed heuristically in Monte-Carlo methods. Our simulations
show that Active Tree Search successfully navigates binary trees that are
challenging for sampling-based methods, problems that require adaptive
exploration, and the large POMDP problem Rocksample. Furthermore, we illustrate
how Active Tree Search can be used to simulate neurophysiological responses
(e.g., in the hippocampus and prefrontal cortex) of humans and other animals
that contain large planning problems. These simulations show that Active Tree
Search is a principled realisation of neuroscientific and AI theories of
planning, which offers both biological realism and scalability.
- Abstract(参考訳): モデルに基づく計画と展望は認知神経科学と人工知能(ai)の両方で広く研究されているが、異なる視点から、和解が困難である異なるデシデラタ(生物学的リアリズムとスケーラビリティ)を念頭に置いている。
本稿では,脳神経科学(Active Inference)における主要な計画理論の規範的性格と生物学的リアリズムと,AIにおけるモンテカルロ法の拡張性を組み合わせた,大規模POMDP(Active Tree Search)の計画手法を提案する。
この統一はどちらのアプローチにも有益である。
一方、モンテカルロ計画を用いることで、大規模問題に対する活性推論の生物学的基盤的なアプローチのスケールアップが可能になる。
一方、アクティブ推論の理論は、モンテカルロ法でしばしばヒューリスティックに扱われる探索と搾取のバランスの原理的な解を提供する。
シミュレーションの結果,アクティブツリー探索は,サンプリングベース手法や適応的探索を必要とする問題,大規模pomdp問題に挑戦する二分木をうまくナビゲートできることが判明した。
さらに,大規模計画問題を含むヒトおよび他の動物の神経生理学的反応(海馬および前頭前皮質など)をシミュレートするために,活性樹探索をどのように利用できるかを示す。
これらのシミュレーションは、アクティブツリーサーチが、生物学的リアリズムと拡張性の両方を提供する計画の神経科学およびAI理論の原則的実現であることを示している。
関連論文リスト
- Technical Report: Enhancing LLM Reasoning with Reward-guided Tree Search [95.06503095273395]
o1のような推論アプローチは困難で、研究者はこのオープンな研究領域を前進させようとさまざまな試みを行ってきた。
本稿では,報酬誘導木探索アルゴリズムを用いて,LLMの推論能力を高めるための予備的な検討を行う。
論文 参考訳(メタデータ) (2024-11-18T16:15:17Z) - Causal Representation Learning from Multimodal Biological Observations [57.00712157758845]
我々は,マルチモーダルデータに対するフレキシブルな識別条件の開発を目指している。
我々は、各潜伏成分の識別可能性を保証するとともに、サブスペース識別結果を事前の作業から拡張する。
我々の重要な理論的要素は、異なるモーダル間の因果関係の構造的空間性である。
論文 参考訳(メタデータ) (2024-11-10T16:40:27Z) - A Review of Artificial Intelligence based Biological-Tree Construction: Priorities, Methods, Applications and Trends [43.12448177569722]
生物学的ツリー分析は、生物、遺伝子、細胞間の進化的および分化的関係を明らかにする重要なツールとなる。
従来の木推論手法は、初期の研究に基礎を置いているが、大規模で複雑なデータセットを処理する際の制限が増大している。
ディープラーニングの最近の進歩は有望なソリューションを提供し、データ処理とパターン認識機能を提供する。
論文 参考訳(メタデータ) (2024-10-07T08:00:41Z) - Dynamic planning in hierarchical active inference [0.0]
人間の脳が認知決定に関連する運動軌跡を推論し、導入する能力について述べる。
本研究では,アクティブ推論における動的計画の話題に焦点を当てた。
論文 参考訳(メタデータ) (2024-02-18T17:32:53Z) - A Review of Neuroscience-Inspired Machine Learning [58.72729525961739]
バイオプルーシブル・クレジット・アサインメントは、事実上あらゆる学習条件と互換性があり、エネルギー効率が高い。
本稿では,人工ニューラルネットワークにおける信用代入の生体評価可能なルールをモデル化する,いくつかの重要なアルゴリズムについて検討する。
我々は,このようなアルゴリズムを実用アプリケーションでより有用にするためには,今後の課題に対処する必要があることを論じる。
論文 参考訳(メタデータ) (2024-02-16T18:05:09Z) - Brain-Inspired Machine Intelligence: A Survey of
Neurobiologically-Plausible Credit Assignment [65.268245109828]
本稿では,神経生物学にインスパイアされた,あるいは動機付けられた人工ニューラルネットワークにおける信用割当を行うアルゴリズムについて検討する。
我々は、脳にインスパイアされた学習スキームを6つの一般的なファミリーにまとめ、これらを誤りのバックプロパゲーションの文脈で検討する。
本研究の成果は,神経ミメティックシステムとその構成的学習プロセスの今後の発展を促進することを目的としている。
論文 参考訳(メタデータ) (2023-12-01T05:20:57Z) - Causal machine learning for single-cell genomics [94.28105176231739]
単細胞ゲノミクスへの機械学習技術の応用とその課題について論じる。
まず, 単一細胞生物学における現在の因果的アプローチの基盤となるモデルについて述べる。
次に、単一セルデータへの因果的アプローチの適用におけるオープンな問題を特定する。
論文 参考訳(メタデータ) (2023-10-23T13:35:24Z) - A Neuro-mimetic Realization of the Common Model of Cognition via Hebbian
Learning and Free Energy Minimization [55.11642177631929]
大規模なニューラル生成モデルは、意味的に豊富なテキストのパスを合成したり、複雑な画像を生成することができる。
我々はコモン・モデル・オブ・コグニティブ・ニューラル・ジェネレーティブ・システムについて論じる。
論文 参考訳(メタデータ) (2023-10-14T23:28:48Z) - Adaptive patch foraging in deep reinforcement learning agents [4.654270325882834]
機械学習エージェントは、生物学的な捕食者に似たパターンに適応的に飼料にパッチを当てることを学ぶことができることを示す。
この研究は、生態学的に妥当な圧力で複雑な環境で相互作用するエージェントが共通の解に達することを示唆している。
論文 参考訳(メタデータ) (2022-10-14T20:16:02Z) - Information theoretic analysis of computational models as a tool to
understand the neural basis of behaviors [0.0]
今世紀最大の研究課題の1つは、脳の身体環境システムにおける行動の神経基盤を理解することである。
計算モデルは、モデルシステムを研究することができる別のフレームワークを提供する。
本稿では,計算モデルの情報理論解析が強力な研究手法であることを示すための紹介,レビュー,議論を行う。
論文 参考訳(メタデータ) (2021-06-02T02:08:18Z) - Grounding Artificial Intelligence in the Origins of Human Behavior [0.0]
人工知能(AI)の最近の進歩は、オープンエンドのスキルのレパートリーを獲得できるエージェントの探求を復活させた。
人間行動生態学(HBE)の研究は、人間の自然を特徴づける行動が、我々の生態学的ニッチの構造に大きな変化に対する適応的な反応としてどのように考えられるかを理解することを目指している。
我々は,HBEの仮説と近年の強化学習(RL)への貢献に基づく,オープンエンドスキル獲得における環境複雑性の役割を強調する枠組みを提案する。
論文 参考訳(メタデータ) (2020-12-15T19:28:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。