論文の概要: Active Inference and Epistemic Value in Graphical Models
- arxiv url: http://arxiv.org/abs/2109.00541v1
- Date: Wed, 1 Sep 2021 16:43:35 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-03 14:00:50.974554
- Title: Active Inference and Epistemic Value in Graphical Models
- Title(参考訳): 図形モデルにおけるアクティブ推論と疫学値
- Authors: Thijs van de Laar, Magnus Koudahl, Bart van Erp, Bert de Vries
- Abstract要約: 自由エネルギー原則(FEP)は、生物エージェントが環境の生成モデルに関して変動自由エネルギー(VFE)を最小化するために環境を知覚し、相互作用することを仮定している。
本稿では,制約されたBethe Free Energy(CBFE)の観点からの疫学的行動にアプローチする。
シミュレーションされたT迷路環境を計画し, 相互作用させることによりCBFEの挙動を明らかにする。
- 参考スコア(独自算出の注目度): 3.9457043990895904
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Free Energy Principle (FEP) postulates that biological agents perceive
and interact with their environment in order to minimize a Variational Free
Energy (VFE) with respect to a generative model of their environment. The
inference of a policy (future control sequence) according to the FEP is known
as Active Inference (AIF). The AIF literature describes multiple VFE objectives
for policy planning that lead to epistemic (information-seeking) behavior.
However, most objectives have limited modeling flexibility. This paper
approaches epistemic behavior from a constrained Bethe Free Energy (CBFE)
perspective. Crucially, variational optimization of the CBFE can be expressed
in terms of message passing on free-form generative models. The key intuition
behind the CBFE is that we impose a point-mass constraint on predicted
outcomes, which explicitly encodes the assumption that the agent will make
observations in the future. We interpret the CBFE objective in terms of its
constituent behavioral drives. We then illustrate resulting behavior of the
CBFE by planning and interacting with a simulated T-maze environment.
Simulations for the T-maze task illustrate how the CBFE agent exhibits an
epistemic drive, and actively plans ahead to account for the impact of
predicted outcomes. Compared to an EFE agent, the CBFE agent incurs expected
reward in significantly more environmental scenarios. We conclude that CBFE
optimization by message passing suggests a general mechanism for
epistemic-aware AIF in free-form generative models.
- Abstract(参考訳): 自由エネルギー原則(FEP)は、生物エージェントが環境の生成モデルに関して変動自由エネルギー(VFE)を最小化するために環境を知覚し、相互作用することを仮定している。
FEPによるポリシー(未来制御シーケンス)の推論は、アクティブ推論(AIF)として知られている。
AIF文献は、エピステミック(情報探索)行動を引き起こす政策計画のための複数のVFE目標を記述している。
しかし、ほとんどの目的はモデリングの柔軟性に制限がある。
本稿では,制約されたBethe Free Energy(CBFE)の観点からの疫学的行動にアプローチする。
重要なことは、CBFEの変分最適化は、自由形式生成モデルにおけるメッセージパッシングの観点で表現することができる。
CBFEの背後にある重要な直感は、予測結果にポイントマスの制約を課すことであり、エージェントが将来観察を行うという仮定を明示的にエンコードしている。
我々はCBFEの目的を構成的行動駆動の観点から解釈する。
次に,シミュレーションt-maze環境の計画と相互作用によりcbfeの挙動を示す。
t-mazeタスクのシミュレーションは、cbfeエージェントがどのように認識駆動を示すかを示し、予測結果の影響を考慮するために積極的に計画する。
EFEエージェントと比較すると、CBFEエージェントは予想される報酬をはるかに多くの環境シナリオで得る。
メッセージパッシングによるcbfe最適化は,自由形生成モデルにおける認識論的aifの一般的なメカニズムを示唆する。
関連論文リスト
- Free Energy Projective Simulation (FEPS): Active inference with interpretability [40.11095094521714]
FEP(Free Energy Projective Simulation)とAIF(Active Inference)は、多くの成功を収めている。
最近の研究は、最新の機械学習技術を取り入れた複雑な環境におけるエージェントの性能向上に重点を置いている。
ディープニューラルネットワークを使わずに解釈可能な方法でエージェントをモデル化するための自由エネルギー射影シミュレーション(FEPS)を導入する。
論文 参考訳(メタデータ) (2024-11-22T15:01:44Z) - R-AIF: Solving Sparse-Reward Robotic Tasks from Pixels with Active Inference and World Models [50.19174067263255]
我々は、エージェントがスパース・リワード、継続的なアクション、ゴールベースのロボット制御POMDP環境においてエクササイズするのを助けるために、事前の選好学習手法と自己修正スケジュールを導入する。
我々のエージェントは、累積報酬、相対安定性、成功率の観点から、最先端モデルよりも優れたパフォーマンスを提供する。
論文 参考訳(メタデータ) (2024-09-21T18:32:44Z) - Value of Information and Reward Specification in Active Inference and POMDPs [7.120454740315046]
期待される自由エネルギー(EFE)は、活動的推論の中心的な量である。
EFEは情報値を用いてベイズ最適RLポリシーを近似することを示す。
論文 参考訳(メタデータ) (2024-08-13T00:32:05Z) - Flexible and Robust Counterfactual Explanations with Minimal Satisfiable
Perturbations [56.941276017696076]
我々は、最小満足度摂動(CEMSP)を用いた対実的説明法という概念的に単純だが効果的な解を提案する。
CEMSPは、意味論的に意味のある正常範囲の助けを借りて、異常な特徴の値を変更することを制限している。
既存の手法と比較して、我々は合成データセットと実世界のデータセットの両方で包括的な実験を行い、柔軟性を維持しつつ、より堅牢な説明を提供することを示した。
論文 参考訳(メタデータ) (2023-09-09T04:05:56Z) - For Better or Worse: The Impact of Counterfactual Explanations'
Directionality on User Behavior in xAI [6.883906273999368]
対物的説明(CFE)は説明可能な人工知能(xAI)の一般的なアプローチである
CFEは、事実状態(上向きCFE)よりも優れているシナリオや、事実状態(下向きCFE)よりも悪いシナリオを記述します。
本研究では,CFEの方向性が参加者の行動と経験に及ぼす影響を自動システムから新たな知識を引き出すために比較した。
論文 参考訳(メタデータ) (2023-06-13T09:16:38Z) - Realising Synthetic Active Inference Agents, Part II: Variational Message Updates [2.2940141855172036]
アクティブ推論 (AIF) は自由エネルギー原理 (FEP) の系譜である
自由形Forney-style Factor Graphs(FFGs)上のメッセージパッシングによるAIFのスケーラブルでエピステマティックなアプローチについて述べる。
合成AIFエージェントの完全なメッセージパッシングアカウントにより、モデル間でのメッセージ更新の導出と再利用が可能になる。
論文 参考訳(メタデータ) (2023-06-05T09:29:46Z) - A Neural Active Inference Model of Perceptual-Motor Learning [62.39667564455059]
アクティブ推論フレームワーク(英: active inference framework、AIF)は、現代の神経科学を基盤とした、有望な新しい計算フレームワークである。
本研究では,ヒトの視覚行動指導において,AIFが期待する役割を捉える能力をテストする。
本稿では,多次元世界状態から自由エネルギーの一次元分布にマッピングする先行関数の新たな定式化について述べる。
論文 参考訳(メタデータ) (2022-11-16T20:00:38Z) - Active inference, Bayesian optimal design, and expected utility [1.433758865948252]
活性推論がベイズ決定理論とベイズ設計の最適原理を結合し、期待される自由エネルギーを最小化する方法について述べる。
情報探索行動の自然発生を可能にする、活発な推論のこの側面である。
我々のTmazeシミュレーションは、期待される自由エネルギーを最適化し、期待されるユーティリティを最適化し、純粋に悪用的な振る舞いを誘導することを示す。
論文 参考訳(メタデータ) (2021-09-21T20:56:32Z) - Instance-Aware Predictive Navigation in Multi-Agent Environments [93.15055834395304]
エージェント間の相互作用と将来のシーン構造を予測するIPC(Instance-Aware Predictive Control)アプローチを提案する。
我々は,ego中心の視点でエージェント間のインタラクションを推定するために,新しいマルチインスタンスイベント予測モジュールを採用する。
シーンレベルとインスタンスレベルの両方の予測状態をより有効活用するために、一連のアクションサンプリング戦略を設計します。
論文 参考訳(メタデータ) (2021-01-14T22:21:25Z) - Exploiting Submodular Value Functions For Scaling Up Active Perception [60.81276437097671]
アクティブな知覚タスクでは、エージェントは1つ以上の隠れ変数の不確実性を減少させる感覚行動を選択することを目的としている。
部分的に観測可能なマルコフ決定過程(POMDP)は、そのような問題に対する自然なモデルを提供する。
エージェントが利用できるセンサーの数が増えるにつれて、POMDP計画の計算コストは指数関数的に増加する。
論文 参考訳(メタデータ) (2020-09-21T09:11:36Z) - Whence the Expected Free Energy? [68.8204255655161]
我々は、期待される自由エネルギー(EFE)が単に「未来の自由エネルギー」ではないことを示した。
そして、新しい目標、期待される未来自由エネルギー(FEEF)を開発する。
論文 参考訳(メタデータ) (2020-04-17T09:06:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。