論文の概要: On the Convexity of Discrete Time Covariance Steering in Stochastic
Linear Systems with Wasserstein Terminal Cost
- arxiv url: http://arxiv.org/abs/2103.13579v1
- Date: Thu, 25 Mar 2021 03:24:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-26 13:20:16.586487
- Title: On the Convexity of Discrete Time Covariance Steering in Stochastic
Linear Systems with Wasserstein Terminal Cost
- Title(参考訳): Wasserstein 終端コストを考慮した確率線形系の離散時間共分散ステアリングの凸性について
- Authors: Isin M. Balci, Abhishek Halder, Efstathios Bakolas
- Abstract要約: 端末状態の共分散が上界であるとき、L"所有者部分順序に関して、この問題は一意に大域的最小化状態フィードバックゲインを許容することを示す。
本研究の結果は, 特殊制御設計ツールの開発に向けての段階を定めている。
- 参考スコア(独自算出の注目度): 1.1602089225841632
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work, we analyze the properties of the solution to the covariance
steering problem for discrete time Gaussian linear systems with a squared
Wasserstein distance terminal cost. In our previous work, we have shown that by
utilizing the state feedback control policy parametrization, this stochastic
optimal control problem can be associated with a difference of convex functions
program. Here, we revisit the same covariance control problem but this time we
focus on the analysis of the problem. Specifically, we establish the existence
of solutions to the optimization problem and derive the first and second order
conditions for optimality. We provide analytic expressions for the gradient and
the Hessian of the performance index by utilizing specialized tools from matrix
calculus. Subsequently, we prove that the optimization problem always admits a
global minimizer, and finally, we provide a sufficient condition for the
performance index to be a strictly convex function (under the latter condition,
the problem admits a unique global minimizer). In particular, we show that when
the terminal state covariance is upper bounded, with respect to the L\"{o}wner
partial order, by the covariance matrix of the desired terminal normal
distribution, then our problem admits a unique global minimizing state feedback
gain. The results of this paper set the stage for the development of
specialized control design tools that exploit the structure of the solution to
the covariance steering problem with a squared Wasserstein distance terminal
cost.
- Abstract(参考訳): 本研究では,二乗ワッサースタイン距離端末コストを持つ離散時間ガウス線形系の共分散ステアリング問題に対する解の性質を分析する。
本稿では,状態フィードバック制御ポリシのパラメータ化を利用して,この確率的最適制御問題を凸関数プログラムの差に関連付けることができることを示した。
ここでは,同じ共分散制御問題を再検討するが,今回は問題の解析に注目する。
具体的には、最適化問題に対する解の存在を確立し、最適性の第一および第二次条件を導出する。
本稿では,行列計算の特殊ツールを用いて,性能指標の勾配とヘシアンの解析式を提供する。
その後、最適化問題は常に大域最小化を許容し、最後に、性能指標が厳密な凸関数となる十分な条件を提供する(後者の条件では、問題は一意の大域最小化を許容する)。
特に、l\"{o}wner部分順序に関して端末状態共分散が上界である場合、所望の端末正規分布の共分散行列により、この問題は一意な大域的最小化状態フィードバックゲインを与える。
本研究は, 共分散ステアリング問題に対する解の構造を二乗ワッサーシュタイン距離終端コストで利用した, 特殊制御設計ツールの開発に向けての段階を定めている。
関連論文リスト
- Error Feedback under $(L_0,L_1)$-Smoothness: Normalization and Momentum [56.37522020675243]
機械学習の幅広い問題にまたがる正規化誤差フィードバックアルゴリズムに対する収束の最初の証明を提供する。
提案手法では,許容可能なステップサイズが大きくなったため,新しい正規化エラーフィードバックアルゴリズムは,各種タスクにおける非正規化エラーよりも優れていた。
論文 参考訳(メタデータ) (2024-10-22T10:19:27Z) - Harmonic Path Integral Diffusion [0.4527270266697462]
本稿では,連続多変量確率分布から抽出する新しい手法を提案する。
本手法では,状態空間の起点を中心とするデルタ関数を$t=0$とし,ターゲット分布に$t=1$で変換する。
これらのアルゴリズムは他のサンプリング手法、特にシミュレートおよびパス積分サンプリングと対比し、解析制御、精度、計算効率の点でそれらの利点を強調した。
論文 参考訳(メタデータ) (2024-09-23T16:20:21Z) - Constrained Optimization via Exact Augmented Lagrangian and Randomized
Iterative Sketching [55.28394191394675]
等式制約付き非線形非IBS最適化問題に対する適応的不正確なニュートン法を開発した。
ベンチマーク非線形問題,LVMのデータによる制約付きロジスティック回帰,PDE制約問題において,本手法の優れた性能を示す。
論文 参考訳(メタデータ) (2023-05-28T06:33:37Z) - Fully Stochastic Trust-Region Sequential Quadratic Programming for
Equality-Constrained Optimization Problems [62.83783246648714]
目的と決定論的等式制約による非線形最適化問題を解くために,逐次2次プログラミングアルゴリズム(TR-StoSQP)を提案する。
アルゴリズムは信頼領域半径を適応的に選択し、既存の直線探索StoSQP方式と比較して不確定なヘッセン行列を利用することができる。
論文 参考訳(メタデータ) (2022-11-29T05:52:17Z) - A Physics-informed Deep Learning Approach for Minimum Effort Stochastic
Control of Colloidal Self-Assembly [9.791617215182598]
制御目的は、所定の初期確率尺度から最小制御労力で所定の終端確率尺度へ状態PDFを操る観点から定式化される。
我々は、関連する最適制御問題に対する最適性の条件を導出する。
提案手法の性能は, ベンチマークコロイド自己集合問題に対する数値シミュレーションにより検証した。
論文 参考訳(メタデータ) (2022-08-19T07:01:57Z) - Optimal Rates for Random Order Online Optimization [60.011653053877126]
敵が損失関数を選択できるカテットガルバー2020onlineについて検討するが、一様にランダムな順序で提示される。
2020onlineアルゴリズムが最適境界を達成し,安定性を著しく向上することを示す。
論文 参考訳(メタデータ) (2021-06-29T09:48:46Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - An improved convergence analysis for decentralized online stochastic
non-convex optimization [17.386715847732468]
本稿では,GT-Loakjasiewics(GT-Loakjasiewics)と呼ばれる手法が,GT-Loakjasiewics(GT-Loakjasiewics)が現在の収束率を満たすことを示す。
結果はすぐに適用できるだけでなく、現在知られている最高の収束率にも適用できる。
論文 参考訳(メタデータ) (2020-08-10T15:29:13Z) - Provably Convergent Working Set Algorithm for Non-Convex Regularized
Regression [0.0]
本稿では、収束保証付き非正則正規化器のためのワーキングセットアルゴリズムを提案する。
その結果,ブロックコーディネートや勾配ソルバの完全解法と比較して高い利得を示した。
論文 参考訳(メタデータ) (2020-06-24T07:40:31Z) - Convergence of adaptive algorithms for weakly convex constrained
optimization [59.36386973876765]
モローエンベロープの勾配のノルムに対して$mathcaltilde O(t-1/4)$収束率を証明する。
我々の分析では、最小バッチサイズが1ドル、定数が1位と2位のモーメントパラメータが1ドル、そしておそらくスムーズな最適化ドメインで機能する。
論文 参考訳(メタデータ) (2020-06-11T17:43:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。