論文の概要: Whence the Expected Free Energy?
- arxiv url: http://arxiv.org/abs/2004.08128v5
- Date: Mon, 28 Sep 2020 21:04:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-12 13:15:02.279932
- Title: Whence the Expected Free Energy?
- Title(参考訳): 自由エネルギーとは何か?
- Authors: Beren Millidge, Alexander Tschantz, Christopher L Buckley
- Abstract要約: 我々は、期待される自由エネルギー(EFE)が単に「未来の自由エネルギー」ではないことを示した。
そして、新しい目標、期待される未来自由エネルギー(FEEF)を開発する。
- 参考スコア(独自算出の注目度): 68.8204255655161
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Expected Free Energy (EFE) is a central quantity in the theory of active
inference. It is the quantity that all active inference agents are mandated to
minimize through action, and its decomposition into extrinsic and intrinsic
value terms is key to the balance of exploration and exploitation that active
inference agents evince. Despite its importance, the mathematical origins of
this quantity and its relation to the Variational Free Energy (VFE) remain
unclear. In this paper, we investigate the origins of the EFE in detail and
show that it is not simply "the free energy in the future". We present a
functional that we argue is the natural extension of the VFE, but which
actively discourages exploratory behaviour, thus demonstrating that exploration
does not directly follow from free energy minimization into the future. We then
develop a novel objective, the Free-Energy of the Expected Future (FEEF), which
possesses both the epistemic component of the EFE as well as an intuitive
mathematical grounding as the divergence between predicted and desired futures.
- Abstract(参考訳): 期待自由エネルギー(EFE)は、活動的推論の理論の中心的な量である。
全ての活性推論エージェントは行動を通じて最小化するために強制される量であり、その外生的および内生的な値項への分解は、活性推論エージェントが生み出す探索と搾取のバランスの鍵となる。
その重要性にもかかわらず、この量の数学的起源と変分自由エネルギー(VFE)との関係はいまだ不明である。
本稿では,EFEの起源を詳細に検討し,単に「未来の自由エネルギー」ではないことを示す。
我々は、VFEの自然な拡張であると主張する機能を示すが、探索的な振る舞いを積極的に妨げ、探索が自由エネルギーの最小化から未来へ直接従わないことを示す。
そこで我々は,EFEのエピステミック成分と,予測された未来と望まれる未来との相違を兼ね備えた,新たな目標である「期待される未来の自由エネルギー」を開発する。
関連論文リスト
- Value of Information and Reward Specification in Active Inference and POMDPs [7.120454740315046]
期待される自由エネルギー(EFE)は、活動的推論の中心的な量である。
EFEは情報値を用いてベイズ最適RLポリシーを近似することを示す。
論文 参考訳(メタデータ) (2024-08-13T00:32:05Z) - Reframing the Expected Free Energy: Four Formulations and a Unification [3.9121134770873733]
能動推論は期待される自由エネルギーに基づいている。
本稿では、これらの定式化を1つのルート予測自由エネルギー定義から導出する問題を定式化する。
論文 参考訳(メタデータ) (2024-02-22T11:38:43Z) - A Neural Active Inference Model of Perceptual-Motor Learning [62.39667564455059]
アクティブ推論フレームワーク(英: active inference framework、AIF)は、現代の神経科学を基盤とした、有望な新しい計算フレームワークである。
本研究では,ヒトの視覚行動指導において,AIFが期待する役割を捉える能力をテストする。
本稿では,多次元世界状態から自由エネルギーの一次元分布にマッピングする先行関数の新たな定式化について述べる。
論文 参考訳(メタデータ) (2022-11-16T20:00:38Z) - Variational Inference with Holder Bounds [68.8008396694788]
熱力学的変動目標(TVO)の慎重に分析する。
熱力学曲線の病理幾何学がTVOにどのように悪影響を及ぼすかを明らかにする。
これは、ホルダー境界と呼ばれ、熱力学曲線を平坦化し、正確な辺辺対の1ステップ近似を達成することを約束する新しいVI目標を動機付けている。
論文 参考訳(メタデータ) (2021-11-04T15:35:47Z) - Active inference, Bayesian optimal design, and expected utility [1.433758865948252]
活性推論がベイズ決定理論とベイズ設計の最適原理を結合し、期待される自由エネルギーを最小化する方法について述べる。
情報探索行動の自然発生を可能にする、活発な推論のこの側面である。
我々のTmazeシミュレーションは、期待される自由エネルギーを最適化し、期待されるユーティリティを最適化し、純粋に悪用的な振る舞いを誘導することを示す。
論文 参考訳(メタデータ) (2021-09-21T20:56:32Z) - Active Inference and Epistemic Value in Graphical Models [3.9457043990895904]
自由エネルギー原則(FEP)は、生物エージェントが環境の生成モデルに関して変動自由エネルギー(VFE)を最小化するために環境を知覚し、相互作用することを仮定している。
本稿では,制約されたBethe Free Energy(CBFE)の観点からの疫学的行動にアプローチする。
シミュレーションされたT迷路環境を計画し, 相互作用させることによりCBFEの挙動を明らかにする。
論文 参考訳(メタデータ) (2021-09-01T16:43:35Z) - The problem of engines in statistical physics [62.997667081978825]
エンジンは、外部の不均衡を犠牲にして、仕事を循環的に生成できるオープンシステムである。
オープン量子系の理論の最近の進歩は、自律エンジンのより現実的な記述を示している。
運動方程式に外部荷重力と熱雑音を組み込む方法を示す。
論文 参考訳(メタデータ) (2021-08-17T03:59:09Z) - Collective effects on the performance and stability of quantum heat
engines [62.997667081978825]
小型熱機関の動作における量子力学的拡張の最近の予測は、新たな関心を集めている。
1つの重要な問題は、集団効果が大規模に拡張するのに役立つかどうかである。
エンジンを構成するスピンの数とともに, パワー, 効率, 一貫性のスケールについて検討する。
論文 参考訳(メタデータ) (2021-06-25T18:00:07Z) - Sophisticated Inference [8.145323363883234]
アクティブ推論は、知覚的振る舞いの第一原理的な説明を提供する。
これは値関数を(ベイジアン)信念の関数に置き換える。
本稿では,高度な能動推論について考察する。
論文 参考訳(メタデータ) (2020-06-07T11:18:58Z) - Maximizing Information Gain in Partially Observable Environments via
Prediction Reward [64.24528565312463]
本稿では,深いRLエージェントに対する信念に基づく報酬の活用という課題に取り組む。
負のエントロピーと予測される予測報酬の正確な誤差を導出する。
この洞察は、予測報酬を用いたいくつかの分野の理論的動機を与える。
論文 参考訳(メタデータ) (2020-05-11T08:13:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。