論文の概要: Deriving time-averaged active inference from control principles
- arxiv url: http://arxiv.org/abs/2208.10601v1
- Date: Mon, 22 Aug 2022 21:20:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-24 13:55:51.499689
- Title: Deriving time-averaged active inference from control principles
- Title(参考訳): 制御原理に基づく時間平均アクティブ推論の導出
- Authors: Eli Sennesh, Jordan Theriault, Jan-Willem van de Meent, Lisa Feldman
Barrett, Karen Quigley
- Abstract要約: アクティブ推論は、時間とともに平均的な感覚的驚きを最小限に抑えるものとして、行動の原則的な説明を提供する。
我々は、最適制御原理から活性推論の無限水平平均サプライズ定式化を導出する。
- 参考スコア(独自算出の注目度): 6.625391013374865
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Active inference offers a principled account of behavior as minimizing
average sensory surprise over time. Applications of active inference to control
problems have heretofore tended to focus on finite-horizon or
discounted-surprise problems, despite deriving from the infinite-horizon,
average-surprise imperative of the free-energy principle. Here we derive an
infinite-horizon, average-surprise formulation of active inference from optimal
control principles. Our formulation returns to the roots of active inference in
neuroanatomy and neurophysiology, formally reconnecting active inference to
optimal feedback control. Our formulation provides a unified objective
functional for sensorimotor control and allows for reference states to vary
over time.
- Abstract(参考訳): アクティブ推論は、平均的な感覚的サプライズを時間とともに最小化する行動の原則的な説明を提供する。
制御問題に対するアクティブ推論の応用は、無限水平平均サプライズ原理から導かれるにもかかわらず、これまで有限ホライズンや割引サプライズ問題に集中する傾向にあった。
ここでは、最適制御原理から活性推論の無限水平平均サプライズ定式化を導出する。
本論文は神経解剖学および神経生理学における能動推論のルーツに戻り,能動推論を最適フィードバック制御に再結合する。
提案方式は,センサモジュレータ制御のための統一的な客観的機能を提供し,時間とともに参照状態が変化することを可能にする。
関連論文リスト
- Lyapunov Neural ODE Feedback Control Policies [6.165163123577486]
本稿では,Lyapunov-NODE制御(L-NODEC)による連続時間最適制御問題の解法を提案する。
我々は,L-NODECが制御システムの指数的安定性を保証するとともに,不確実な初期条件に対する対角的ロバスト性を保証することを確立する。
論文 参考訳(メタデータ) (2024-08-31T08:59:18Z) - Growing Q-Networks: Solving Continuous Control Tasks with Adaptive Control Resolution [51.83951489847344]
ロボット工学の応用において、スムーズな制御信号はシステム摩耗とエネルギー効率を減らすために一般的に好まれる。
本研究では,離散的な動作空間を粗い状態から細かい制御分解能まで拡大することにより,この性能ギャップを埋めることを目的とする。
我々の研究は、値分解とアダプティブ・コントロール・リゾリューションが組み合わさることで、単純な批判のみのアルゴリズムが得られ、連続制御タスクにおいて驚くほど高い性能が得られることを示唆している。
論文 参考訳(メタデータ) (2024-04-05T17:58:37Z) - ACE : Off-Policy Actor-Critic with Causality-Aware Entropy Regularization [52.5587113539404]
因果関係を考慮したエントロピー(entropy)という用語を導入し,効率的な探索を行うための潜在的影響の高いアクションを効果的に識別し,優先順位付けする。
提案アルゴリズムであるACE:Off-policy Actor-critic with Causality-aware Entropy regularizationは,29種類の連続制御タスクに対して,大幅な性能上の優位性を示す。
論文 参考訳(メタデータ) (2024-02-22T13:22:06Z) - Learning Control Policies of Hodgkin-Huxley Neuronal Dynamics [1.629803445577911]
ニューラルネットワークを用いてオフラインで値関数を近似し、フィードバックフォームを介してリアルタイムで制御(刺激)を生成する。
数値実験では, 分布外サンプルに対するアプローチの精度と, 系の緩やかな衝撃や乱れに対する頑健さが示されている。
論文 参考訳(メタデータ) (2023-11-13T18:53:50Z) - A Neural Active Inference Model of Perceptual-Motor Learning [62.39667564455059]
アクティブ推論フレームワーク(英: active inference framework、AIF)は、現代の神経科学を基盤とした、有望な新しい計算フレームワークである。
本研究では,ヒトの視覚行動指導において,AIFが期待する役割を捉える能力をテストする。
本稿では,多次元世界状態から自由エネルギーの一次元分布にマッピングする先行関数の新たな定式化について述べる。
論文 参考訳(メタデータ) (2022-11-16T20:00:38Z) - Minimizing Control for Credit Assignment with Strong Feedback [65.59995261310529]
ディープニューラルネットワークにおける勾配に基づくクレジット割り当ての現在の手法は、無限小のフィードバック信号を必要とする。
我々は、神経活動に対する強いフィードバックと勾配に基づく学習を組み合わせることで、ニューラルネットワークの最適化に関する新たな視点を自然に導き出すことを示す。
DFCにおける強いフィードバックを用いることで、空間と時間において完全に局所的な学習規則を用いることで、前向きとフィードバックの接続を同時に学習できることを示す。
論文 参考訳(メタデータ) (2022-04-14T22:06:21Z) - Inference of Affordances and Active Motor Control in Simulated Agents [0.5161531917413706]
本稿では,出力確率,時間的予測,モジュール型人工ニューラルネットワークアーキテクチャを提案する。
我々のアーキテクチャは、割当マップと解釈できる潜在状態が発達していることを示す。
アクティブな推論と組み合わせることで、フレキシブルでゴール指向の動作が実行可能であることを示す。
論文 参考訳(メタデータ) (2022-02-23T14:13:04Z) - Neural optimal feedback control with local learning rules [67.5926699124528]
運動制御の大きな問題は、脳がどのように遅延と雑音の刺激に直面して適切な動きを計画し実行するかを理解することである。
本稿では,適応カルマンフィルタとモデル自由制御手法を組み合わせた新しいオンラインアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-11-12T20:02:00Z) - Active inference, Bayesian optimal design, and expected utility [1.433758865948252]
活性推論がベイズ決定理論とベイズ設計の最適原理を結合し、期待される自由エネルギーを最小化する方法について述べる。
情報探索行動の自然発生を可能にする、活発な推論のこの側面である。
我々のTmazeシミュレーションは、期待される自由エネルギーを最適化し、期待されるユーティリティを最適化し、純粋に悪用的な振る舞いを誘導することを示す。
論文 参考訳(メタデータ) (2021-09-21T20:56:32Z) - Adaptive Rational Activations to Boost Deep Reinforcement Learning [68.10769262901003]
我々は、合理的が適応可能なアクティベーション機能に適合する理由と、ニューラルネットワークへの含意が重要である理由を動機付けている。
人気アルゴリズムに(繰り返しの)アクティベーションを組み込むことで,アタリゲームにおいて一貫した改善がもたらされることを実証する。
論文 参考訳(メタデータ) (2021-02-18T14:53:12Z) - Regularity and stability of feedback relaxed controls [4.48579723067867]
本稿では,ロバストなフィードバック制御を設計するための一般探索報酬を用いた緩和制御正則化を提案する。
正規化制御問題の値関数とフィードバック制御の両方がパラメータ摂動に関してリプシッツ安定であることを示す。
論文 参考訳(メタデータ) (2020-01-09T18:24:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。