論文の概要: Variational Inference MPC using Tsallis Divergence
- arxiv url: http://arxiv.org/abs/2104.00241v1
- Date: Thu, 1 Apr 2021 04:00:49 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-02 13:31:06.054821
- Title: Variational Inference MPC using Tsallis Divergence
- Title(参考訳): Tsallis Divergence を用いた変分推定 MPC
- Authors: Ziyi Wang, Oswin So, Jason Gibson, Bogdan Vlahov, Manan S. Gandhi,
Guan-Horng Liu and Evangelos A. Theodorou
- Abstract要約: 非拡張型Tsallis発散を用いた可変推論確率最適制御の枠組みを提供する。
新規な Tsallis Variational Inference-Model Predictive Control アルゴリズムが導出される。
- 参考スコア(独自算出の注目度): 10.013572514839082
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we provide a generalized framework for Variational
Inference-Stochastic Optimal Control by using thenon-extensive Tsallis
divergence. By incorporating the deformed exponential function into the
optimality likelihood function, a novel Tsallis Variational Inference-Model
Predictive Control algorithm is derived, which includes prior works such as
Variational Inference-Model Predictive Control, Model Predictive PathIntegral
Control, Cross Entropy Method, and Stein VariationalInference Model Predictive
Control as special cases. The proposed algorithm allows for effective control
of the cost/reward transform and is characterized by superior performance in
terms of mean and variance reduction of the associated cost. The aforementioned
features are supported by a theoretical and numerical analysis on the level of
risk sensitivity of the proposed algorithm as well as simulation experiments on
5 different robotic systems with 3 different policy parameterizations.
- Abstract(参考訳): 本稿では,拡張型 tsallis 発散を用いた変分推論・確率的最適制御のための一般化フレームワークを提案する。
変形した指数関数を最適度推定関数に組み込むことにより、変分推論モデル予測制御、モデル予測経路積分制御、クロスエントロピー法、スタイン変分参照モデル予測制御などの先行処理を特別に含む新しいツァリス変分推論モデル予測制御アルゴリズムが導出される。
提案アルゴリズムはコスト/リワード変換を効果的に制御することができ、関連するコストの平均と分散の低減の点で優れた性能を特徴とする。
上記の特徴は,提案アルゴリズムのリスク感度のレベルに関する理論的および数値的な解析と,3つの異なるポリシーパラメータを持つ5つのロボットシステムのシミュレーション実験によって支持される。
関連論文リスト
- Proximal Interacting Particle Langevin Algorithms [0.0]
本稿では,潜時変動モデルにおける推論と学習のためのPIPLAアルゴリズムを提案する。
非微分不可能な統計モデルにおけるパラメータ推定の問題に合わせた、新しい近位IPLAファミリー内のいくつかの変種を提案する。
我々の理論と実験は、PIPLAファミリーが非微分可能モデルの潜在変数モデルにおけるパラメータ推定問題のデファクト選択であることを示している。
論文 参考訳(メタデータ) (2024-06-20T13:16:41Z) - Variational Bayesian surrogate modelling with application to robust design optimisation [0.9626666671366836]
サロゲートモデルは複雑な計算モデルに対して素早く評価できる近似を提供する。
入力の不確かさと次元減少を伴う統計的代理を構築するためのベイズ推定について考察する。
コスト関数がモデル出力の平均および標準偏差の重み付け和に依存するような本質的で頑健な構造最適化問題を示す。
論文 参考訳(メタデータ) (2024-04-23T09:22:35Z) - On the Forward Invariance of Neural ODEs [92.07281135902922]
本稿では,ニューラル常微分方程式(ODE)が出力仕様を満たすことを保証するための新しい手法を提案する。
提案手法では,出力仕様を学習システムのパラメータや入力の制約に変換するために,制御障壁関数のクラスを用いる。
論文 参考訳(メタデータ) (2022-10-10T15:18:28Z) - Learning Stochastic Parametric Differentiable Predictive Control
Policies [2.042924346801313]
本稿では、ニューラルネットワークポリシーの教師なし学習のための、パラメトリック微分可能予測制御(SP-DPC)と呼ばれるスケーラブルな代替手法を提案する。
SP-DPCはパラメトリック制約最適制御問題に対する決定論的近似として定式化される。
閉ループ制約と確率満足度に関するSP-DPC法を用いて学習したポリシーに関する理論的確率的保証を提供する。
論文 参考訳(メタデータ) (2022-03-02T22:46:32Z) - A Variational Inference Approach to Inverse Problems with Gamma
Hyperpriors [60.489902135153415]
本稿では,ガンマハイパープライヤを用いた階層的逆問題に対する変分反復交替方式を提案する。
提案した変分推論手法は正確な再構成を行い、意味のある不確実な定量化を提供し、実装が容易である。
論文 参考訳(メタデータ) (2021-11-26T06:33:29Z) - Combining Gaussian processes and polynomial chaos expansions for
stochastic nonlinear model predictive control [0.0]
最適制御問題の時間不変不確かさを明示的に考慮する新しいアルゴリズムを提案する。
本稿では, 非線形変換の平均および分散推定値を得るために, この組み合わせを効率的に利用することを提案する。
最適制御問題に対する確率的目標と確率的制約の両方を定式化する方法を示す。
論文 参考訳(メタデータ) (2021-03-09T14:25:08Z) - Stein Variational Model Predictive Control [130.60527864489168]
不確実性の下での意思決定は、現実の自律システムにとって極めて重要である。
モデル予測制御 (MPC) 法は, 複雑な分布を扱う場合, 適用範囲が限られている。
この枠組みが、挑戦的で非最適な制御問題における計画の成功に繋がることを示す。
論文 参考訳(メタデータ) (2020-11-15T22:36:59Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Control as Hybrid Inference [62.997667081978825]
本稿では、反復推論と償却推論のバランスを自然に仲介するCHIの実装について述べる。
連続的な制御ベンチマークでアルゴリズムのスケーラビリティを検証し、強力なモデルフリーおよびモデルベースラインを上回る性能を示す。
論文 参考訳(メタデータ) (2020-07-11T19:44:09Z) - Scalable Control Variates for Monte Carlo Methods via Stochastic
Optimization [62.47170258504037]
本稿では,制御,カーネル,ニューラルネットワークを用いた既存のアプローチを包含し,一般化するフレームワークを提案する。
新たな理論的結果は、達成可能な分散還元に関する洞察を与えるために提示され、ベイズ推定への応用を含む経験的評価が支持される。
論文 参考訳(メタデータ) (2020-06-12T22:03:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。