論文の概要: Active Inference or Control as Inference? A Unifying View
- arxiv url: http://arxiv.org/abs/2010.00262v1
- Date: Thu, 1 Oct 2020 09:08:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-12 07:27:35.475239
- Title: Active Inference or Control as Inference? A Unifying View
- Title(参考訳): 推論としてのアクティブ推論か制御か?
統一的視点
- Authors: Joe Watson, Abraham Imohiosen, Jan Peters
- Abstract要約: 制御レンズによる能動推論のフレーム化(CaI)
CaIは原理的で、数値的に堅牢な最適制御解法を提供する。
コスト関数が観測状態に特異的に定義されている場合、AIは部分的に観測されたCaIとしてフレーム化される可能性があることを示す。
- 参考スコア(独自算出の注目度): 33.361301128504905
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Active inference (AI) is a persuasive theoretical framework from
computational neuroscience that seeks to describe action and perception as
inference-based computation. However, this framework has yet to provide
practical sensorimotor control algorithms that are competitive with alternative
approaches. In this work, we frame active inference through the lens of control
as inference (CaI), a body of work that presents trajectory optimization as
inference. From the wider view of `probabilistic numerics', CaI offers
principled, numerically robust optimal control solvers that provide uncertainty
quantification, and can scale to nonlinear problems with approximate inference.
We show that AI may be framed as partially-observed CaI when the cost function
is defined specifically in the observation states.
- Abstract(参考訳): active inference (ai) は、行動と知覚を推論に基づく計算として記述することを目的とした、計算神経科学からの説得力のある理論的枠組みである。
しかし、このフレームワークは代替手法と競合する実用的な感覚運動量制御アルゴリズムを提供していない。
本研究では,軌道最適化を推論として提示する作業体であるCaI (Inference as Inference) の制御レンズを通して,アクティブな推論を行う。
確率的数値」というより広い視点から、CaIは原理的かつ数値的に堅牢な最適制御解法を提供し、不確実な定量化を提供し、近似推論で非線形問題にスケールできる。
コスト関数が特に観測状態で定義される場合、AIは部分的に観測されたCaIとしてフレーム化される可能性がある。
関連論文リスト
- Stable Inverse Reinforcement Learning: Policies from Control Lyapunov Landscapes [4.229902091180109]
実験データからリアプノフ関数を学習するための新しい安定度認証IRL手法を提案する。
関連する制御ポリシーのクローズドフォーム表現を利用することで、CLFの空間を効率的に探索することができる。
我々は,CLFが提供する最適性に関する理論的解析を行い,シミュレーションデータと実世界データの両方を用いて我々のアプローチを評価する。
論文 参考訳(メタデータ) (2024-05-14T16:40:45Z) - Advancing Counterfactual Inference through Nonlinear Quantile Regression [77.28323341329461]
ニューラルネットワークで実装された効率的かつ効果的な対実的推論のためのフレームワークを提案する。
提案手法は、推定された反事実結果から見つからないデータまでを一般化する能力を高める。
複数のデータセットで実施した実証実験の結果は、我々の理論的な主張に対する説得力のある支持を提供する。
論文 参考訳(メタデータ) (2023-06-09T08:30:51Z) - Learning to Optimize with Stochastic Dominance Constraints [103.26714928625582]
本稿では,不確実量を比較する問題に対して,単純かつ効率的なアプローチを開発する。
我々はラグランジアンの内部最適化をサロゲート近似の学習問題として再考した。
提案したライト-SDは、ファイナンスからサプライチェーン管理に至るまで、いくつかの代表的な問題において優れた性能を示す。
論文 参考訳(メタデータ) (2022-11-14T21:54:31Z) - Understanding Approximation for Bayesian Inference in Neural Networks [7.081604594416339]
ベイズニューラルネットワークにおける近似推論について検討する。
近似後部の期待効用は推論品質を測定することができる。
継続的かつ活発な学習セットは、後部品質とは無関係な課題を引き起こします。
論文 参考訳(メタデータ) (2022-11-11T11:31:13Z) - Active Inference in Robotics and Artificial Agents: Survey and
Challenges [51.29077770446286]
我々は、状態推定、制御、計画、学習のためのアクティブ推論の最先端理論と実装についてレビューする。
本稿では、適応性、一般化性、堅牢性の観点から、その可能性を示す関連する実験を紹介する。
論文 参考訳(メタデータ) (2021-12-03T12:10:26Z) - Learning Robust Output Control Barrier Functions from Safe Expert Demonstrations [50.37808220291108]
本稿では,専門家によるデモンストレーションの部分的な観察から,安全な出力フィードバック制御法を考察する。
まず,安全性を保証する手段として,ロバスト出力制御バリア関数(ROCBF)を提案する。
次に、安全なシステム動作を示す専門家による実証からROCBFを学習するための最適化問題を定式化する。
論文 参考訳(メタデータ) (2021-11-18T23:21:00Z) - General bound on the performance of counter-diabatic driving acting on
dissipative spin systems [0.0]
反断熱駆動(英: Counter-diabatic driving、CD)は、非断熱励起に対処するために設計された量子制御理論の技法である。
我々は、駆動型スピンボソンモデルをプロトタイプ的な設定とみなす。
時間依存性の系-バス結合角を許容すれば、得られた境界は飽和し、単位忠実度を実現することができることを示す。
論文 参考訳(メタデータ) (2021-04-06T09:06:50Z) - Loss Bounds for Approximate Influence-Based Abstraction [81.13024471616417]
影響に基づく抽象化は、システムの残りの部分が与える「影響」とともに、局所的なサブプロブレムをモデル化することでレバレッジを得ることを目的としている。
本稿では,理論的観点から,そのような手法の性能について考察する。
交叉エントロピーで訓練されたニューラルネットワークは、近似的な影響表現を学習するのに適していることを示す。
論文 参考訳(メタデータ) (2020-11-03T15:33:10Z) - QuLBIT: Quantum-Like Bayesian Inference Technologies for Cognition and
Decision [0.11470070927586014]
本稿では、量子論から派生した統合認知意思決定フレームワーク(QulBIT)の基礎を提供する。
本稿では,統合フレームワークの主要なモジュール,説明的分析手法について詳述し,その適用が確実な原則に反する状況で説明する。
論文 参考訳(メタデータ) (2020-05-30T09:02:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。