論文の概要: A Message Passing Realization of Expected Free Energy Minimization
- arxiv url: http://arxiv.org/abs/2508.02197v1
- Date: Mon, 04 Aug 2025 08:48:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-05 18:25:22.260374
- Title: A Message Passing Realization of Expected Free Energy Minimization
- Title(参考訳): 期待される自由エネルギー最小化のメッセージパッシング実現
- Authors: Wouter W. L. Nuijten, Mykola Lukashchuk, Thijs van de Laar, Bert de Vries,
- Abstract要約: 本稿では,因子グラフ上の期待自由エネルギー(EFE)に対するメッセージパッシング手法を提案する。
我々は,解答可能な探索問題を,標準変分法を用いて抽出可能な推論問題に変換する。
因数化状態空間モデルにメッセージパッシング手法を適用することで、効率的なポリシー推論が可能になる。
- 参考スコア(独自算出の注目度): 2.099922236065961
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a message passing approach to Expected Free Energy (EFE) minimization on factor graphs, based on the theory introduced in arXiv:2504.14898. By reformulating EFE minimization as Variational Free Energy minimization with epistemic priors, we transform a combinatorial search problem into a tractable inference problem solvable through standard variational techniques. Applying our message passing method to factorized state-space models enables efficient policy inference. We evaluate our method on environments with epistemic uncertainty: a stochastic gridworld and a partially observable Minigrid task. Agents using our approach consistently outperform conventional KL-control agents on these tasks, showing more robust planning and efficient exploration under uncertainty. In the stochastic gridworld environment, EFE-minimizing agents avoid risky paths, while in the partially observable minigrid setting, they conduct more systematic information-seeking. This approach bridges active inference theory with practical implementations, providing empirical evidence for the efficiency of epistemic priors in artificial agents.
- Abstract(参考訳): 本稿では、arXiv:2504.14898で導入された理論に基づいて、因子グラフに基づく期待自由エネルギー(EFE)最小化へのメッセージパッシング手法を提案する。
本研究では,EFEの最小化を変動自由エネルギーの最小化として定式化することで,組合せ探索問題を標準変分法により解けるトラクタブル推論問題に変換する。
因数化状態空間モデルにメッセージパッシング手法を適用することで、効率的なポリシー推論が可能になる。
我々は,確率的グリッドワールドと部分的に観測可能なミニグリッドタスクという,てんかん性不確実性のある環境における本手法の評価を行った。
提案手法を用いたエージェントは,これらのタスクにおいて従来型のKL制御エージェントよりも一貫して優れており,不確実性下でのより堅牢な計画と効率的な探索が示される。
確率的グリッドワールド環境では、EFE最小化エージェントは危険経路を避け、部分的に観測可能なミニグリッド環境では、より体系的な情報探索を行う。
このアプローチは、アクティブ推論理論を実践的な実装で橋渡しし、人工エージェントにおける先天的な先行の効率の実証的な証拠を提供する。
関連論文リスト
- Robust Invariant Representation Learning by Distribution Extrapolation [3.5051814539447474]
不変リスク最小化(IRM)は、ディープラーニングにおけるアウト・オブ・ディストリビューションの一般化を可能にすることを目的としている。
IRMv1を含む既存のアプローチでは、ペナルティベースの単一レベル近似を採用している。
合成分布シフトによるITMペナルティの増大により環境多様性を高める新しい枠組みが提案されている。
論文 参考訳(メタデータ) (2025-05-22T02:03:34Z) - Minimum-Excess-Work Guidance [17.15668604906196]
本稿では,事前学習した確率フロー生成モデルを導くための正規化フレームワークを提案する。
本手法は,科学応用に共通するスパースデータ体制における効率的なガイダンスを可能にする。
粗粒タンパク質モデルにおけるフレームワークの汎用性を実証する。
論文 参考訳(メタデータ) (2025-05-19T17:19:43Z) - Expected Free Energy-based Planning as Variational Inference [3.559846046435839]
EFEに基づくプランニングは、生成モデル上での変動自由エネルギー関数の最小化から自然に発生することを示す。
この結果は、不確実性それ自体で計画を変分推論の形式としてキャストすることで、自由エネルギー原理との理論的整合性を強化する。
我々の定式化は,有界計算資源を考慮に入れた複雑性項を取り入れつつ,目標達成と情報獲得を共同で支援する政策を導出する。
論文 参考訳(メタデータ) (2025-04-21T07:09:05Z) - Free Energy Projective Simulation (FEPS): Active inference with interpretability [40.11095094521714]
FEP(Free Energy Projective Simulation)とAIF(Active Inference)は、多くの成功を収めている。
最近の研究は、最新の機械学習技術を取り入れた複雑な環境におけるエージェントの性能向上に重点を置いている。
ディープニューラルネットワークを使わずに解釈可能な方法でエージェントをモデル化するための自由エネルギー射影シミュレーション(FEPS)を導入する。
論文 参考訳(メタデータ) (2024-11-22T15:01:44Z) - Energy-Guided Continuous Entropic Barycenter Estimation for General Costs [95.33926437521046]
任意のOTコスト関数に対して連続的エントロピーOT(EOT)バリセンタを近似する新しいアルゴリズムを提案する。
本手法は、弱いOTに基づくEOT問題の二重再構成に基づいている。
論文 参考訳(メタデータ) (2023-10-02T11:24:36Z) - Sampling with Mollified Interaction Energy Descent [57.00583139477843]
モーフィファイド相互作用エネルギー降下(MIED)と呼ばれる新しい最適化に基づくサンプリング手法を提案する。
MIEDは、モル化相互作用エネルギー(MIE)と呼ばれる確率測度に関する新しいクラスのエネルギーを最小化する
我々は,制約のないサンプリング問題に対して,我々のアルゴリズムがSVGDのような既存の粒子ベースアルゴリズムと同等に動作することを示す。
論文 参考訳(メタデータ) (2022-10-24T16:54:18Z) - Latent State Marginalization as a Low-cost Approach for Improving
Exploration [79.12247903178934]
我々はMaxEntフレームワークにおける潜在変数ポリシーの採用を提案する。
我々は、潜在変数ポリシーが、潜在信念状態を持つ世界モデルの下で自然に現れることを示す。
提案手法を連続制御タスクに対して実験的に検証し, 有効限界化がよりよい探索とより堅牢な訓練につながることを示した。
論文 参考訳(メタデータ) (2022-10-03T15:09:12Z) - Shortest-Path Constrained Reinforcement Learning for Sparse Reward Tasks [59.419152768018506]
最適ポリシーは必ずk-SP制約を満たすことを示す。
本研究では,SP制約に違反するポリシーを完全に排除する代わりに,新たなコスト関数を提案する。
また,MiniGrid,DeepMind Lab,Atari,Fetchを用いた実験の結果,提案手法はPPOを著しく改善することが示された。
論文 参考訳(メタデータ) (2021-07-13T21:39:21Z) - Strictly Batch Imitation Learning by Energy-based Distribution Matching [104.33286163090179]
すなわち、強化信号へのアクセスがなく、遷移力学の知識がなく、環境とのさらなる相互作用もない。
1つの解決策は、既存のアルゴリズムをオフライン環境で動作させるために、見習いの学習に適合させることである。
しかし、このようなアプローチは、政治外の評価やオフラインモデルの推定に大きく依存しており、間接的で非効率である可能性がある。
優れたソリューションは、ポリシーを明示的にパラメータ化し、ロールアウトダイナミクスから暗黙的に学習し、完全にオフラインで運用できるべきだ、と私たちは主張する。
論文 参考訳(メタデータ) (2020-06-25T03:27:59Z) - Risk-Aware Energy Scheduling for Edge Computing with Microgrid: A
Multi-Agent Deep Reinforcement Learning Approach [82.6692222294594]
マイクログリッドを用いたMECネットワークにおけるリスク対応エネルギースケジューリング問題について検討する。
ニューラルネットワークを用いたマルチエージェントディープ強化学習(MADRL)に基づくアドバンテージアクター・クリティック(A3C)アルゴリズムを適用し,その解を導出する。
論文 参考訳(メタデータ) (2020-02-21T02:14:38Z) - Targeted free energy estimation via learned mappings [66.20146549150475]
自由エネルギー摂動 (FEP) は60年以上前にズワンツィヒによって自由エネルギー差を推定する方法として提案された。
FEPは、分布間の十分な重複の必要性という厳しい制限に悩まされている。
目標自由エネルギー摂動(Targeted Free Energy Perturbation)と呼ばれるこの問題を緩和するための1つの戦略は、オーバーラップを増やすために構成空間の高次元マッピングを使用する。
論文 参考訳(メタデータ) (2020-02-12T11:10:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。