論文の概要: Safe Optimal Control Using Stochastic Barrier Functions and Deep
Forward-Backward SDEs
- arxiv url: http://arxiv.org/abs/2009.01196v1
- Date: Wed, 2 Sep 2020 17:10:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-22 19:54:12.921139
- Title: Safe Optimal Control Using Stochastic Barrier Functions and Deep
Forward-Backward SDEs
- Title(参考訳): 確率バリア関数と深部前方SDEを用いた安全最適制御
- Authors: Marcus Aloysius Pereira and Ziyi Wang and Ioannis Exarchos and
Evangelos A. Theodorou
- Abstract要約: 本稿では,最適制御と動的最適化のための新しい定式化を提案する。
ニューラルネットワークアーキテクチャは、エンド・ツー・エンドで学習を行うことのできる安全な軌道最適化のために設計されている。
- 参考スコア(独自算出の注目度): 23.554700972887375
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces a new formulation for stochastic optimal control and
stochastic dynamic optimization that ensures safety with respect to state and
control constraints. The proposed methodology brings together concepts such as
Forward-Backward Stochastic Differential Equations, Stochastic Barrier
Functions, Differentiable Convex Optimization and Deep Learning. Using the
aforementioned concepts, a Neural Network architecture is designed for safe
trajectory optimization in which learning can be performed in an end-to-end
fashion. Simulations are performed on three systems to show the efficacy of the
proposed methodology.
- Abstract(参考訳): 本稿では, 状態と制御制約に対する安全性を保証する確率的最適制御と確率的動的最適化の新しい定式化を提案する。
提案手法は,前向きの確率微分方程式,確率障壁関数,微分可能凸最適化,深層学習といった概念を組み合わせる。
前述の概念を用いて、ニューラルネットワークアーキテクチャは、エンドツーエンドで学習を実行できる安全な軌道最適化のために設計されている。
提案手法の有効性を示すために3つのシステム上でシミュレーションを行う。
関連論文リスト
- A Simulation-Free Deep Learning Approach to Stochastic Optimal Control [12.699529713351287]
最適制御(SOC)における一般問題の解法のためのシミュレーションフリーアルゴリズムを提案する。
既存の手法とは異なり、我々の手法は随伴問題の解を必要としない。
論文 参考訳(メタデータ) (2024-10-07T16:16:53Z) - Analyzing and Enhancing the Backward-Pass Convergence of Unrolled
Optimization [50.38518771642365]
ディープネットワークにおけるコンポーネントとしての制約付き最適化モデルの統合は、多くの専門的な学習タスクに有望な進歩をもたらした。
この設定における中心的な課題は最適化問題の解によるバックプロパゲーションであり、しばしば閉形式を欠いている。
本稿では, 非線形最適化の後方通過に関する理論的知見を提供し, 特定の反復法による線形システムの解と等価であることを示す。
Folded Optimizationと呼ばれるシステムが提案され、非ローリングなソルバ実装からより効率的なバックプロパゲーションルールを構築する。
論文 参考訳(メタデータ) (2023-12-28T23:15:18Z) - Backpropagation of Unrolled Solvers with Folded Optimization [55.04219793298687]
ディープネットワークにおけるコンポーネントとしての制約付き最適化モデルの統合は、多くの専門的な学習タスクに有望な進歩をもたらした。
1つの典型的な戦略はアルゴリズムのアンローリングであり、これは反復解法の操作による自動微分に依存している。
本稿では,非ロール最適化の後方通過に関する理論的知見を提供し,効率よく解けるバックプロパゲーション解析モデルを生成するシステムに繋がる。
論文 参考訳(メタデータ) (2023-01-28T01:50:42Z) - Introduction to Online Nonstochastic Control [34.77535508151501]
オンラインの非確率制御では、コスト関数と仮定された力学モデルからの摂動の両方が敵によって選択される。
目標は、ベンチマーククラスの政策から見て、最高の政策に対して低い後悔を得ることだ。
論文 参考訳(メタデータ) (2022-11-17T16:12:45Z) - Guaranteed Conservation of Momentum for Learning Particle-based Fluid
Dynamics [96.9177297872723]
本稿では,学習物理シミュレーションにおける線形運動量を保証する新しい手法を提案する。
我々は、強い制約で運動量の保存を強制し、反対称的な連続的な畳み込み層を通して実現する。
提案手法により,学習シミュレータの物理的精度を大幅に向上させることができる。
論文 参考訳(メタデータ) (2022-10-12T09:12:59Z) - Chance-Constrained Optimization in Contact-Rich Systems for Robust
Manipulation [13.687891070512828]
離散時間線形相補性システム(SDLCS)の確率制約最適化を提案する。
我々の定式化では、相補性に対する合同確率制約と、ダイナミクスの進化を捉える状態について明確に検討する。
このロバスト性はSDLCSのロバストな軌道最適化に対する最近の手法よりも優れている。
論文 参考訳(メタデータ) (2022-03-05T00:16:22Z) - Probabilistic robust linear quadratic regulators with Gaussian processes [73.0364959221845]
ガウス過程(GP)のような確率モデルは、制御設計に続く使用のためのデータから未知の動的システムを学ぶための強力なツールです。
本稿では、確率的安定性マージンに関して堅牢なコントローラを生成する線形化GPダイナミクスのための新しいコントローラ合成について述べる。
論文 参考訳(メタデータ) (2021-05-17T08:36:18Z) - A Backward SDE Method for Uncertainty Quantification in Deep Learning [9.7140720884508]
本稿では,ニューラルネットワークのクラスを最適制御問題により定式化する確率論的機械学習手法を提案する。
最大原理に基づく効率的な降下アルゴリズムが導入された。
論文 参考訳(メタデータ) (2020-11-28T15:19:36Z) - Chance-Constrained Trajectory Optimization for Safe Exploration and
Learning of Nonlinear Systems [81.7983463275447]
学習に基づく制御アルゴリズムは、訓練のための豊富な監督を伴うデータ収集を必要とする。
本稿では,機会制約付き最適制御と動的学習とフィードバック制御を統合した安全な探索による最適動作計画のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2020-05-09T05:57:43Z) - Learning Control Barrier Functions from Expert Demonstrations [69.23675822701357]
制御障壁関数(CBF)に基づく安全な制御器合成のための学習に基づくアプローチを提案する。
最適化に基づくCBFの学習手法を解析し、基礎となる力学系のリプシッツ仮定の下で証明可能な安全保証を享受する。
私たちの知る限りでは、これらはデータから確実に安全な制御障壁関数を学習する最初の結果です。
論文 参考訳(メタデータ) (2020-04-07T12:29:06Z) - Adaptive Stochastic Optimization [1.7945141391585486]
適応最適化手法は、大規模システムの訓練に際し、計算量を大幅に削減する可能性がある。
勾配法に基づく現代的なアプローチは、それぞれのアプリケーションに調整が必要な所定のパラメータ値を採用するという意味では適応的ではない。
論文 参考訳(メタデータ) (2020-01-18T16:30:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。