論文の概要: Active inference, Bayesian optimal design, and expected utility
- arxiv url: http://arxiv.org/abs/2110.04074v1
- Date: Tue, 21 Sep 2021 20:56:32 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-17 05:08:36.966051
- Title: Active inference, Bayesian optimal design, and expected utility
- Title(参考訳): 能動推論, ベイズ最適設計, 期待される実用性
- Authors: Noor Sajid, Lancelot Da Costa, Thomas Parr, Karl Friston
- Abstract要約: 活性推論がベイズ決定理論とベイズ設計の最適原理を結合し、期待される自由エネルギーを最小化する方法について述べる。
情報探索行動の自然発生を可能にする、活発な推論のこの側面である。
我々のTmazeシミュレーションは、期待される自由エネルギーを最適化し、期待されるユーティリティを最適化し、純粋に悪用的な振る舞いを誘導することを示す。
- 参考スコア(独自算出の注目度): 1.433758865948252
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Active inference, a corollary of the free energy principle, is a formal way
of describing the behavior of certain kinds of random dynamical systems that
have the appearance of sentience. In this chapter, we describe how active
inference combines Bayesian decision theory and optimal Bayesian design
principles under a single imperative to minimize expected free energy. It is
this aspect of active inference that allows for the natural emergence of
information-seeking behavior. When removing prior outcomes preferences from
expected free energy, active inference reduces to optimal Bayesian design,
i.e., information gain maximization. Conversely, active inference reduces to
Bayesian decision theory in the absence of ambiguity and relative risk, i.e.,
expected utility maximization. Using these limiting cases, we illustrate how
behaviors differ when agents select actions that optimize expected utility,
expected information gain, and expected free energy. Our T-maze simulations
show optimizing expected free energy produces goal-directed information-seeking
behavior while optimizing expected utility induces purely exploitive behavior
and maximizing information gain engenders intrinsically motivated behavior.
- Abstract(参考訳): 能動推論(active inference)は自由エネルギー原理(free energy principle)の典拠であり、感覚の外観を持つある種のランダム力学系の振る舞いを記述する形式的な方法である。
この章では、期待される自由エネルギーを最小化するために、ベイズ決定理論と最適なベイズ設計原則をいかに組み合わせるかを説明する。
情報探索行動の自然発生を可能にする能動推論のこの側面である。
期待される自由エネルギーから事前の結果の選好を取り除くと、アクティブ推論は最適なベイズ設計、すなわち情報ゲイン最大化へと還元される。
逆に、アクティブ推論は曖昧さと相対リスク、すなわち期待効用最大化の欠如によりベイズ決定理論に還元される。
これらの制限ケースを用いて、エージェントが期待効用、期待情報ゲイン、期待自由エネルギーを最適化するアクションを選択するとき、振る舞いがどう異なるかを示す。
提案するt-mazeシミュレーションでは,期待自由エネルギーの最適化によって目標指向の情報探索行動がもたらされる一方で,期待効用の最適化は純粋に搾取的行動を引き起こし,情報利得を最大化する。
関連論文リスト
- Enhancing Population-based Search with Active Inference [0.0]
本稿では,アクティブ推論を人口ベースメタヒューリスティクスに統合し,性能を向上させることを提案する。
実験結果から,能動推論は計算コストを極端に増加させるだけで,いくつかの改善された解が得られることが示唆された。
論文 参考訳(メタデータ) (2024-08-18T17:21:21Z) - Value of Information and Reward Specification in Active Inference and POMDPs [7.120454740315046]
期待される自由エネルギー(EFE)は、活動的推論の中心的な量である。
EFEは情報値を用いてベイズ最適RLポリシーを近似することを示す。
論文 参考訳(メタデータ) (2024-08-13T00:32:05Z) - Confronting Reward Overoptimization for Diffusion Models: A Perspective of Inductive and Primacy Biases [76.9127853906115]
拡散モデルと人間の嗜好のギャップを埋めることが、実用的生成への統合に不可欠である。
本稿では,拡散モデルの時間的帰納バイアスを利用したポリシー勾配アルゴリズムTDPO-Rを提案する。
実験の結果,報酬過小評価を緩和する手法が有効であることが示された。
論文 参考訳(メタデータ) (2024-02-13T15:55:41Z) - Modeling arousal potential of epistemic emotions using Bayesian
information gain: Inquiry cycle driven by free energy fluctuations [0.0]
好奇心や興味などの感情が調査プロセスを促進する。
自由エネルギーと発散原理に基づく2種類の情報ゲイン : Kullback-Leibler(KLD)
本研究では,情報ゲイン関数のピークに対する予測不確実性(事前分散)と観測不確実性(類似分散)の影響を最適サプライズとして解析した。
論文 参考訳(メタデータ) (2023-12-14T02:59:20Z) - Model-based Causal Bayesian Optimization [74.78486244786083]
乗算重み付き因果ベイズ最適化のための最初のアルゴリズム(CBO-MW)を提案する。
グラフ関連の量に自然に依存するCBO-MWに対する後悔の限界を導出する。
我々の実験は、共有モビリティシステムにおいて、ユーザの需要パターンを学習するためにCBO-MWをどのように使用できるかの現実的なデモを含む。
論文 参考訳(メタデータ) (2023-07-31T13:02:36Z) - Prediction-Oriented Bayesian Active Learning [51.426960808684655]
予測情報ゲイン(EPIG)は、パラメータではなく予測空間における情報ゲインを測定する。
EPIGは、さまざまなデータセットやモデルにわたるBALDと比較して、予測パフォーマンスが向上する。
論文 参考訳(メタデータ) (2023-04-17T10:59:57Z) - A Neural Active Inference Model of Perceptual-Motor Learning [62.39667564455059]
アクティブ推論フレームワーク(英: active inference framework、AIF)は、現代の神経科学を基盤とした、有望な新しい計算フレームワークである。
本研究では,ヒトの視覚行動指導において,AIFが期待する役割を捉える能力をテストする。
本稿では,多次元世界状態から自由エネルギーの一次元分布にマッピングする先行関数の新たな定式化について述べる。
論文 参考訳(メタデータ) (2022-11-16T20:00:38Z) - Generalizing Bayesian Optimization with Decision-theoretic Entropies [102.82152945324381]
統計的決定論の研究からシャノンエントロピーの一般化を考える。
まず,このエントロピーの特殊なケースがBO手順でよく用いられる獲得関数に繋がることを示す。
次に、損失に対する選択肢の選択が、どのようにして柔軟な獲得関数の族をもたらすかを示す。
論文 参考訳(メタデータ) (2022-10-04T04:43:58Z) - Preference Enhanced Social Influence Modeling for Network-Aware Cascade
Prediction [59.221668173521884]
本稿では,ユーザの嗜好モデルを強化することで,カスケードサイズ予測を促進する新しいフレームワークを提案する。
エンド・ツー・エンドの手法により,ユーザの情報拡散プロセスがより適応的で正確になる。
論文 参考訳(メタデータ) (2022-04-18T09:25:06Z) - Goal-Directed Planning by Reinforcement Learning and Active Inference [16.694117274961016]
ベイジアン推論を用いた新たな意思決定フレームワークを提案する。
ゴール指向の振る舞いは、計画によって$z$の後方分布から決定される。
本稿では,カメラ観測と連続運動動作を用いたセンサモレータナビゲーションタスクの実験により,提案手法の有効性を実証する。
論文 参考訳(メタデータ) (2021-06-18T06:41:01Z) - Reward Maximisation through Discrete Active Inference [1.2074552857379273]
報酬の最大化に最適なアクションを、アクティブな推論エージェントがどのように、いつ実行するかを示す。
能動推論がベルマン方程式の最適解を生成する条件を示す。
我々は,この分析を,能動推論と強化学習のより広い関係に関する議論に付加する。
論文 参考訳(メタデータ) (2020-09-17T07:13:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。