論文の概要: Sub-optimality of the Separation Principle for Quadratic Control from Bilinear Observations
- arxiv url: http://arxiv.org/abs/2504.11555v1
- Date: Tue, 15 Apr 2025 18:53:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-17 14:40:21.848658
- Title: Sub-optimality of the Separation Principle for Quadratic Control from Bilinear Observations
- Title(参考訳): 双線形観測からの二次制御のための分離原理の準最適性
- Authors: Yahya Sattar, Sunmook Choi, Yassir Jedra, Maryam Fazel, Sarah Dean,
- Abstract要約: 最小2次コストで双線形観測から数値力学系を制御することの問題点を考察する。
この問題と標準線型二次ガウスフィルタ(LQG)との類似性にもかかわらず、どちらも二線型分離原理モデルではないことを示す。
複数の合成条件で実験を行った結果について述べる。
- 参考スコア(独自算出の注目度): 16.7109402673221
- License:
- Abstract: We consider the problem of controlling a linear dynamical system from bilinear observations with minimal quadratic cost. Despite the similarity of this problem to standard linear quadratic Gaussian (LQG) control, we show that when the observation model is bilinear, neither does the Separation Principle hold, nor is the optimal controller affine in the estimated state. Moreover, the cost-to-go is non-convex in the control input. Hence, finding an analytical expression for the optimal feedback controller is difficult in general. Under certain settings, we show that the standard LQG controller locally maximizes the cost instead of minimizing it. Furthermore, the optimal controllers (derived analytically) are not unique and are nonlinear in the estimated state. We also introduce a notion of input-dependent observability and derive conditions under which the Kalman filter covariance remains bounded. We illustrate our theoretical results through numerical experiments in multiple synthetic settings.
- Abstract(参考訳): 最小2次コストの双線形観測から線形力学系を制御することの問題点を考察する。
この問題と標準線型二次ガウス制御(LQG)との類似性にもかかわらず、観測モデルが双線型であるとき、分離原理も、推定状態の最適制御アフィンも持たないことを示す。
さらに、コスト・トゥ・ゴーは制御入力において非凸である。
したがって、最適フィードバックコントローラの解析式を見つけることは一般に困難である。
特定の設定下では、標準LQGコントローラが最小化せずに、ローカルでコストを最大化することを示す。
さらに、最適制御器は(解析的に導かれる)一意ではなく、推定状態において非線形である。
また、入力依存可観測性の概念やカルマンフィルタの共分散が有界な条件も導入する。
複数の合成環境における数値実験による理論的結果について述べる。
関連論文リスト
- Physics-informed Gaussian Processes as Linear Model Predictive Controller [5.89889361990138]
追従問題における線形時間不変系を制御する新しいアルゴリズムを提案する。
コントローラはガウス過程(GP)に基づいており、その実現は定数係数を持つ線形常微分方程式の系を満たす。
論文 参考訳(メタデータ) (2024-12-02T15:37:37Z) - Multirotor Ensemble Model Predictive Control I: Simulation Experiments [0.0]
アンサンブル表現されたガウス過程は、初期時間の最適利得を決定するために後方計算を行う。
端末制御と制御問題のためのEMPCを構築し、シミュレーション・同一双対研究の制御に適用する。
論文 参考訳(メタデータ) (2023-05-22T01:32:17Z) - On the Optimization Landscape of Dynamic Output Feedback: A Case Study
for Linear Quadratic Regulator [12.255864026960403]
動的コントローラの座標変換によってdLQRコストがどう変化するかを示し、次に与えられた可観測安定化コントローラの最適変換を導出する。
これらの結果は、部分的に観測された情報を含む一般的な意思決定問題に対する効率的なアルゴリズムの設計に光を当てた。
論文 参考訳(メタデータ) (2022-09-12T06:43:35Z) - Deep Learning Approximation of Diffeomorphisms via Linear-Control
Systems [91.3755431537592]
我々は、制御に線形に依存する$dot x = sum_i=1lF_i(x)u_i$という形の制御系を考える。
対応するフローを用いて、コンパクトな点のアンサンブル上の微分同相写像の作用を近似する。
論文 参考訳(メタデータ) (2021-10-24T08:57:46Z) - Sparsity in Partially Controllable Linear Systems [56.142264865866636]
本研究では, 部分制御可能な線形力学系について, 基礎となる空間パターンを用いて検討する。
最適制御には無関係な状態変数を特徴付ける。
論文 参考訳(メタデータ) (2021-10-12T16:41:47Z) - Robust Online Control with Model Misspecification [96.23493624553998]
本研究では,未知の非線形力学系のモデル不特定性を考慮したオンライン制御について検討する。
本研究は, 線形近似からの偏差を許容できる程度に測定できるロバスト性に着目した。
論文 参考訳(メタデータ) (2021-07-16T07:04:35Z) - Advancing Trajectory Optimization with Approximate Inference:
Exploration, Covariance Control and Adaptive Risk [29.811633555275666]
制御(i2c)アルゴリズムの入力推論を検討し、高度な軌道最適化を可能にする3つの重要な特性を導出する。
非線形システムを最適化する際に、オープンループオプティマとクローズドループ分散低減の利点を組み合わせた専門家の線形ガウスコントローラ。
論文 参考訳(メタデータ) (2021-03-10T19:52:31Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z) - Improper Learning for Non-Stochastic Control [78.65807250350755]
逆方向の摂動, 逆方向に選択された凸損失関数, 部分的に観察された状態を含む, 未知の線形力学系を制御することの問題点を考察する。
このパラメトリゼーションにオンライン降下を適用することで、大規模なクローズドループポリシーに対してサブリニア後悔を実現する新しいコントローラが得られる。
我々の境界は、線形力学コントローラの安定化と競合する非確率的制御設定における最初のものである。
論文 参考訳(メタデータ) (2020-01-25T02:12:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。