論文の概要: Active Inference Tree Search in Large POMDPs
- arxiv url: http://arxiv.org/abs/2103.13860v4
- Date: Fri, 16 Aug 2024 11:28:31 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-19 21:24:14.533846
- Title: Active Inference Tree Search in Large POMDPs
- Title(参考訳): 大規模PMMDPにおけるアクティブ推論木探索
- Authors: Domenico Maisto, Francesco Gregoretti, Karl Friston, Giovanni Pezzulo,
- Abstract要約: POMDPsにおける新しい計画手法--Active Inference Tree Search (AcT)について紹介する。
AcTは、神経科学(Active Inference)における主要な計画理論の規範的性格と生物学的リアリズムと、AIにおける木探索法のスケーラビリティを組み合わせたものである。
シミュレーションの結果、AcTはサンプリングベース手法に挑戦する二分木、適応探索を必要とする問題、そしてAcTが最先端のPOMDPソリューションを再現する大規模POMDP問題「RockSample」をうまくナビゲートしていることがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The ability to plan ahead efficiently is key for both living organisms and artificial systems. Model-based planning and prospection are widely studied in cognitive neuroscience and artificial intelligence (AI), but from different perspectives--and with different desiderata in mind (biological realism versus scalability) that are difficult to reconcile. Here, we introduce a novel method to plan in POMDPs--Active Inference Tree Search (AcT)--that combines the normative character and biological realism of a leading planning theory in neuroscience (Active Inference) and the scalability of tree search methods in AI. This unification enhances both approaches. On the one hand, tree searches enable the biologically grounded, first principle method of active inference to be applied to large-scale problems. On the other hand, active inference provides a principled solution to the exploration-exploitation dilemma, which is often addressed heuristically in tree search methods. Our simulations show that AcT successfully navigates binary trees that are challenging for sampling-based methods, problems that require adaptive exploration, and the large POMDP problem 'RockSample'--in which AcT reproduces state-of-the-art POMDP solutions. Furthermore, we illustrate how AcT can be used to simulate neurophysiological responses (e.g., in the hippocampus and prefrontal cortex) of humans and other animals that solve large planning problems. These numerical analyses show that Active Tree Search is a principled realisation of neuroscientific and AI planning theories, which offer both biological realism and scalability.
- Abstract(参考訳): 効率的に計画する能力は、生物と人工システムの両方にとって鍵となる。
モデルに基づく計画と予測は、認知神経科学と人工知能(AI)において広く研究されているが、異なる視点から考えると、調整が難しい異なるデシダタ(生物学的リアリズムとスケーラビリティ)を念頭に置いている。この記事では、POMDPにおいて計画する新しい手法を紹介する。-Active Inference Tree Search(AcT)は、神経科学における主要な計画理論(Active Inference)の規範的特徴と生物学的リアリズムと、AIにおけるツリーサーチ手法のスケーラビリティを組み合わせたものである。
この統合は両方のアプローチを強化します。
一方、木探索により、大規模問題に適用できる生物学的基盤を持つ第一原理的推論法が実現される。
一方、能動推論は探索・探索ジレンマの原理的な解であり、しばしば木探索法でヒューリスティックに扱われる。
シミュレーションの結果、AcTはサンプリングベース手法に挑戦する二分木、適応探索を必要とする問題、そしてAcTが最先端のPOMDPソリューションを再現する大規模POMDP問題「RockSample」をうまくナビゲートしていることがわかった。
さらに、AcTが人間の神経生理学的反応(例えば海馬や前頭前皮質)をシミュレートし、大きな計画課題を解決する方法について述べる。
これらの数値解析により、アクティブツリー探索は、生物学的リアリズムと拡張性の両方を提供する神経科学およびAI計画理論の原則的実現であることが示された。
関連論文リスト
- Technical Report: Enhancing LLM Reasoning with Reward-guided Tree Search [95.06503095273395]
o1のような推論アプローチは困難で、研究者はこのオープンな研究領域を前進させようとさまざまな試みを行ってきた。
本稿では,報酬誘導木探索アルゴリズムを用いて,LLMの推論能力を高めるための予備的な検討を行う。
論文 参考訳(メタデータ) (2024-11-18T16:15:17Z) - Causal Representation Learning from Multimodal Biological Observations [57.00712157758845]
我々は,マルチモーダルデータに対するフレキシブルな識別条件の開発を目指している。
我々は、各潜伏成分の識別可能性を保証するとともに、サブスペース識別結果を事前の作業から拡張する。
我々の重要な理論的要素は、異なるモーダル間の因果関係の構造的空間性である。
論文 参考訳(メタデータ) (2024-11-10T16:40:27Z) - A Review of Artificial Intelligence based Biological-Tree Construction: Priorities, Methods, Applications and Trends [43.12448177569722]
生物学的ツリー分析は、生物、遺伝子、細胞間の進化的および分化的関係を明らかにする重要なツールとなる。
従来の木推論手法は、初期の研究に基礎を置いているが、大規模で複雑なデータセットを処理する際の制限が増大している。
ディープラーニングの最近の進歩は有望なソリューションを提供し、データ処理とパターン認識機能を提供する。
論文 参考訳(メタデータ) (2024-10-07T08:00:41Z) - Dynamic planning in hierarchical active inference [0.0]
人間の脳が認知決定に関連する運動軌跡を推論し、導入する能力について述べる。
本研究では,アクティブ推論における動的計画の話題に焦点を当てた。
論文 参考訳(メタデータ) (2024-02-18T17:32:53Z) - A Review of Neuroscience-Inspired Machine Learning [58.72729525961739]
バイオプルーシブル・クレジット・アサインメントは、事実上あらゆる学習条件と互換性があり、エネルギー効率が高い。
本稿では,人工ニューラルネットワークにおける信用代入の生体評価可能なルールをモデル化する,いくつかの重要なアルゴリズムについて検討する。
我々は,このようなアルゴリズムを実用アプリケーションでより有用にするためには,今後の課題に対処する必要があることを論じる。
論文 参考訳(メタデータ) (2024-02-16T18:05:09Z) - Brain-Inspired Machine Intelligence: A Survey of
Neurobiologically-Plausible Credit Assignment [65.268245109828]
本稿では,神経生物学にインスパイアされた,あるいは動機付けられた人工ニューラルネットワークにおける信用割当を行うアルゴリズムについて検討する。
我々は、脳にインスパイアされた学習スキームを6つの一般的なファミリーにまとめ、これらを誤りのバックプロパゲーションの文脈で検討する。
本研究の成果は,神経ミメティックシステムとその構成的学習プロセスの今後の発展を促進することを目的としている。
論文 参考訳(メタデータ) (2023-12-01T05:20:57Z) - Causal machine learning for single-cell genomics [94.28105176231739]
単細胞ゲノミクスへの機械学習技術の応用とその課題について論じる。
まず, 単一細胞生物学における現在の因果的アプローチの基盤となるモデルについて述べる。
次に、単一セルデータへの因果的アプローチの適用におけるオープンな問題を特定する。
論文 参考訳(メタデータ) (2023-10-23T13:35:24Z) - A Neuro-mimetic Realization of the Common Model of Cognition via Hebbian
Learning and Free Energy Minimization [55.11642177631929]
大規模なニューラル生成モデルは、意味的に豊富なテキストのパスを合成したり、複雑な画像を生成することができる。
我々はコモン・モデル・オブ・コグニティブ・ニューラル・ジェネレーティブ・システムについて論じる。
論文 参考訳(メタデータ) (2023-10-14T23:28:48Z) - Adaptive patch foraging in deep reinforcement learning agents [4.654270325882834]
機械学習エージェントは、生物学的な捕食者に似たパターンに適応的に飼料にパッチを当てることを学ぶことができることを示す。
この研究は、生態学的に妥当な圧力で複雑な環境で相互作用するエージェントが共通の解に達することを示唆している。
論文 参考訳(メタデータ) (2022-10-14T20:16:02Z) - Information theoretic analysis of computational models as a tool to
understand the neural basis of behaviors [0.0]
今世紀最大の研究課題の1つは、脳の身体環境システムにおける行動の神経基盤を理解することである。
計算モデルは、モデルシステムを研究することができる別のフレームワークを提供する。
本稿では,計算モデルの情報理論解析が強力な研究手法であることを示すための紹介,レビュー,議論を行う。
論文 参考訳(メタデータ) (2021-06-02T02:08:18Z) - Grounding Artificial Intelligence in the Origins of Human Behavior [0.0]
人工知能(AI)の最近の進歩は、オープンエンドのスキルのレパートリーを獲得できるエージェントの探求を復活させた。
人間行動生態学(HBE)の研究は、人間の自然を特徴づける行動が、我々の生態学的ニッチの構造に大きな変化に対する適応的な反応としてどのように考えられるかを理解することを目指している。
我々は,HBEの仮説と近年の強化学習(RL)への貢献に基づく,オープンエンドスキル獲得における環境複雑性の役割を強調する枠組みを提案する。
論文 参考訳(メタデータ) (2020-12-15T19:28:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。