論文の概要: Expected Free Energy-based Planning as Variational Inference
- arxiv url: http://arxiv.org/abs/2504.14898v2
- Date: Wed, 23 Apr 2025 12:05:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:52.731472
- Title: Expected Free Energy-based Planning as Variational Inference
- Title(参考訳): 変動推論としての自由エネルギー計画への期待
- Authors: Bert de Vries, Wouter Nuijten, Thijs van de Laar, Wouter Kouw, Sepideh Adamiat, Tim Nisslbeck, Mykola Lukashchuk, Hoang Minh Huu Nguyen, Marco Hidalgo Araya, Raphael Tresor, Thijs Jenneskens, Ivana Nikoloska, Raaja Ganapathy Subramanian, Bart van Erp, Dmitry Bagaev, Albert Podusenko,
- Abstract要約: EFEに基づくプランニングは、生成モデル上での変動自由エネルギー関数の最小化から自然に発生することを示す。
この結果は、不確実性それ自体で計画を変分推論の形式としてキャストすることで、自由エネルギー原理との理論的整合性を強化する。
我々の定式化は,有界計算資源を考慮に入れた複雑性項を取り入れつつ,目標達成と情報獲得を共同で支援する政策を導出する。
- 参考スコア(独自算出の注目度): 3.559846046435839
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We address the problem of planning under uncertainty, where an agent must choose actions that not only achieve desired outcomes but also reduce uncertainty. Traditional methods often treat exploration and exploitation as separate objectives, lacking a unified inferential foundation. Active inference, grounded in the Free Energy Principle, provides such a foundation by minimizing Expected Free Energy (EFE), a cost function that combines utility with epistemic drives, such as ambiguity resolution and novelty seeking. However, the computational burden of EFE minimization had remained a significant obstacle to its scalability. In this paper, we show that EFE-based planning arises naturally from minimizing a variational free energy functional on a generative model augmented with preference and epistemic priors. This result reinforces theoretical consistency with the Free Energy Principle by casting planning under uncertainty itself as a form of variational inference. Our formulation yields policies that jointly support goal achievement and information gain, while incorporating a complexity term that accounts for bounded computational resources. This unifying framework connects and extends existing methods, enabling scalable, resource-aware implementations of active inference agents.
- Abstract(参考訳): 我々は,不確実性の下での計画の問題に対処する。エージェントは望ましい結果を達成するだけでなく,不確実性を低減する行動を選択する必要がある。
伝統的な方法はしばしば探検と搾取を別々の目的として扱い、統一された推論基盤を欠いていた。
アクティブ推論は、自由エネルギー原則に基づいており、あいまいさの解決や新規性の追求など、効用とてんかんのドライブを組み合わせたコスト関数である期待自由エネルギー(EFE)を最小化することによって、そのような基盤を提供する。
しかし、EFEの最小化の計算負荷は、そのスケーラビリティにとって大きな障害であった。
本稿では,EFEをベースとしたプランニングが,嗜好とてんかんの先行を付加した生成モデル上での変動自由エネルギー関数の最小化から自然に発生することを示す。
この結果は、不確実性それ自体で計画を変分推論の形式としてキャストすることで、自由エネルギー原理との理論的整合性を強化する。
我々の定式化は,有界計算資源を考慮に入れた複雑性項を取り入れつつ,目標達成と情報獲得を共同で支援する政策を導出する。
この統合フレームワークは既存のメソッドを接続し拡張し、アクティブな推論エージェントのスケーラブルでリソースを意識した実装を可能にする。
関連論文リスト
- FEAT: Free energy Estimators with Adaptive Transport [61.85373609950878]
自由エネルギー推定のための新しいフレームワークである適応輸送を用いた自由エネルギー推定器(FEAT)を提案する。
FEATは、インターポーラントを介して実装された学習された輸送を、自由エネルギー差の変分上と下の境界とともに活用する。
おもちゃの例、分子シミュレーション、量子場理論に関する実験的検証は、既存の学習法よりも改善されていることを示す。
論文 参考訳(メタデータ) (2025-04-15T15:16:18Z) - Boosting MCTS with Free Energy Minimization [0.0]
我々はモンテカルロ木探索(MCTS)をアクティブな推論対象と統合する新しい計画フレームワークを提案する。
MCTSは、期待される報酬と情報ゲインをブレンドすることで、自由エネルギーの最小化を組み込むように自然に拡張することができる。
このシナジーにより、プランナーは計算的トラクタビリティを犠牲にすることなく、計画全体の価値と不確実性のコヒーレントな見積を維持できる。
論文 参考訳(メタデータ) (2025-01-22T18:45:15Z) - Energy-Aware Dynamic Neural Inference [39.04688735618206]
エネルギーハーベスターと有限容量エネルギーストレージを備えたオンデバイス適応型推論システムを提案する。
環境エネルギーの速度が増加するにつれて、エネルギー・信頼性を考慮した制御方式は精度を約5%向上させることが示されている。
我々は、信頼性を意識し、認識できないコントローラを理論的に保証する原則的なポリシーを導出する。
論文 参考訳(メタデータ) (2024-11-04T16:51:22Z) - Resilient Constrained Reinforcement Learning [87.4374430686956]
本稿では,複数の制約仕様を事前に特定しない制約付き強化学習(RL)のクラスについて検討する。
報酬訓練目標と制約満足度との間に不明確なトレードオフがあるため、適切な制約仕様を特定することは困難である。
我々は、ポリシーと制約仕様を一緒に検索する新しい制約付きRLアプローチを提案する。
論文 参考訳(メタデータ) (2023-12-28T18:28:23Z) - A Safe Genetic Algorithm Approach for Energy Efficient Federated
Learning in Wireless Communication Networks [53.561797148529664]
フェデレートラーニング(FL)は、従来の集中型アプローチとは対照的に、デバイスが協調的にモデルトレーニングを行う分散技術として登場した。
FLの既存の取り組みにもかかわらず、その環境影響は、無線ネットワークへの適用性に関するいくつかの重要な課題が特定されているため、まだ調査中である。
現在の研究は遺伝的アルゴリズム(GA)アプローチを提案しており、FLプロセス全体のエネルギー消費と不要な資源利用の両方を最小化することを目標としている。
論文 参考訳(メタデータ) (2023-06-25T13:10:38Z) - Active Inference for Autonomous Decision-Making with Contextual
Multi-Armed Bandits [1.3670071336891754]
不確実性の下での自律的なロボット意思決定では、搾取と利用可能な選択肢の探索のトレードオフを考慮する必要がある。
本研究では,近年神経科学の分野で積極的に研究されている能動推論をCMABの代替行動選択戦略として応用する。
論文 参考訳(メタデータ) (2022-09-19T17:11:21Z) - Strictly Batch Imitation Learning by Energy-based Distribution Matching [104.33286163090179]
すなわち、強化信号へのアクセスがなく、遷移力学の知識がなく、環境とのさらなる相互作用もない。
1つの解決策は、既存のアルゴリズムをオフライン環境で動作させるために、見習いの学習に適合させることである。
しかし、このようなアプローチは、政治外の評価やオフラインモデルの推定に大きく依存しており、間接的で非効率である可能性がある。
優れたソリューションは、ポリシーを明示的にパラメータ化し、ロールアウトダイナミクスから暗黙的に学習し、完全にオフラインで運用できるべきだ、と私たちは主張する。
論文 参考訳(メタデータ) (2020-06-25T03:27:59Z) - Whence the Expected Free Energy? [68.8204255655161]
我々は、期待される自由エネルギー(EFE)が単に「未来の自由エネルギー」ではないことを示した。
そして、新しい目標、期待される未来自由エネルギー(FEEF)を開発する。
論文 参考訳(メタデータ) (2020-04-17T09:06:56Z) - Risk-Aware Energy Scheduling for Edge Computing with Microgrid: A
Multi-Agent Deep Reinforcement Learning Approach [82.6692222294594]
マイクログリッドを用いたMECネットワークにおけるリスク対応エネルギースケジューリング問題について検討する。
ニューラルネットワークを用いたマルチエージェントディープ強化学習(MADRL)に基づくアドバンテージアクター・クリティック(A3C)アルゴリズムを適用し,その解を導出する。
論文 参考訳(メタデータ) (2020-02-21T02:14:38Z) - Targeted free energy estimation via learned mappings [66.20146549150475]
自由エネルギー摂動 (FEP) は60年以上前にズワンツィヒによって自由エネルギー差を推定する方法として提案された。
FEPは、分布間の十分な重複の必要性という厳しい制限に悩まされている。
目標自由エネルギー摂動(Targeted Free Energy Perturbation)と呼ばれるこの問題を緩和するための1つの戦略は、オーバーラップを増やすために構成空間の高次元マッピングを使用する。
論文 参考訳(メタデータ) (2020-02-12T11:10:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。