論文の概要: Closed-loop Parameter Identification of Linear Dynamical Systems through
the Lens of Feedback Channel Coding Theory
- arxiv url: http://arxiv.org/abs/2003.12548v1
- Date: Fri, 27 Mar 2020 17:30:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-19 05:37:51.655874
- Title: Closed-loop Parameter Identification of Linear Dynamical Systems through
the Lens of Feedback Channel Coding Theory
- Title(参考訳): フィードバックチャネル符号化理論のレンズによる線形力学系の閉ループパラメータ同定
- Authors: Ali Reza Pedram and Takashi Tanaka
- Abstract要約: 本稿では,ガウス過程雑音を伴う線形スカラー系の閉ループ同定の問題について考察する。
学習速度は,対応するAWGNチャネルの容量によって基本的に上界にあることを示す。
フィードバックポリシの最適設計は依然として難しいが、上限が達成される条件を導出する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper considers the problem of closed-loop identification of linear
scalar systems with Gaussian process noise, where the system input is
determined by a deterministic state feedback policy. The regularized
least-square estimate (LSE) algorithm is adopted, seeking to find the best
estimate of unknown model parameters based on noiseless measurements of the
state. We are interested in the fundamental limitation of the rate at which
unknown parameters can be learned, in the sense of the D-optimality
scalarization criterion subject to a quadratic control cost. We first establish
a novel connection between a closed-loop identification problem of interest and
a channel coding problem involving an additive white Gaussian noise (AWGN)
channel with feedback and a certain structural constraint. Based on this
connection, we show that the learning rate is fundamentally upper bounded by
the capacity of the corresponding AWGN channel. Although the optimal design of
the feedback policy remains challenging, we derive conditions under which the
upper bound is achieved. Finally, we show that the obtained upper bound implies
that super-linear convergence is unattainable for any choice of the policy.
- Abstract(参考訳): 本稿では,システム入力が決定論的状態フィードバックポリシによって決定されるガウス過程雑音を伴う線形スカラーシステムの閉ループ同定の問題について考察する。
正規化最小二乗推定(LSE)アルゴリズムが採用され、状態のノイズレス測定に基づいて未知のモデルパラメータの最適推定を求める。
我々は、D-最適スカラー化基準を2次制御コストの条件として、未知のパラメータが学習できる速度の基本的な制限に興味を持っている。
まず、興味のある閉ループ識別問題と、フィードバックを伴う付加的な白色ガウス雑音(AWGN)チャネルを含むチャネル符号化問題との新たな接続を確立する。
この関係に基づき、学習速度は、対応するAWGNチャネルの容量によって基本的に上限値であることを示す。
フィードバックポリシーの最適設計は依然として困難であるが、上限が達成される条件を導出する。
最後に、得られた上限は、超線型収束がポリシーの選択に対して到達できないことを意味することを示す。
関連論文リスト
- Accelerated zero-order SGD under high-order smoothness and overparameterized regime [79.85163929026146]
凸最適化問題を解くための新しい勾配のないアルゴリズムを提案する。
このような問題は医学、物理学、機械学習で発生する。
両種類の雑音下で提案アルゴリズムの収束保証を行う。
論文 参考訳(メタデータ) (2024-11-21T10:26:17Z) - A least-square method for non-asymptotic identification in linear switching control [17.938732931331064]
基礎となる部分観測線形力学系は、既知の候補モデルの有限集合内にあることが知られている。
線形最小二乗法の非漸近解析における最近の進歩を活用して、この問題の有限時間サンプル複雑性を特徴づける。
基礎となるシステムの未知のパラメータを識別するデータ駆動型スイッチング戦略を提案する。
論文 参考訳(メタデータ) (2024-04-11T20:55:38Z) - Towards Model-Free LQR Control over Rate-Limited Channels [2.908482270923597]
作業者エージェントが(LQRコストの)量子化ポリシー勾配を有限ビットレートのノイズレスチャネル上でサーバに送信する環境について検討する。
我々は、適応量子化グラディエントDescent (textttAQGD) という新しいアルゴリズムを提案し、ある有限しきい値ビットレートを超えると、textttAQGDは、グローバルな最適ポリシーへの指数的に高速な収束を保証することを証明した。
論文 参考訳(メタデータ) (2024-01-02T15:59:00Z) - Sub-linear Regret in Adaptive Model Predictive Control [56.705978425244496]
本稿では,STT-MPC (Self-Tuning tube-based Model Predictive Control) について述べる。
システム力学を最初に認識したアルゴリズムと比較して,アルゴリズムの後悔を解析する。
論文 参考訳(メタデータ) (2023-10-07T15:07:10Z) - Log Barriers for Safe Black-box Optimization with Application to Safe
Reinforcement Learning [72.97229770329214]
本稿では,学習時の安全性維持が不可欠である高次元非線形最適化問題に対する一般的なアプローチを提案する。
LBSGDと呼ばれるアプローチは、慎重に選択されたステップサイズで対数障壁近似を適用することに基づいている。
安全強化学習における政策課題の違反を最小限に抑えるためのアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2022-07-21T11:14:47Z) - A Priori Denoising Strategies for Sparse Identification of Nonlinear
Dynamical Systems: A Comparative Study [68.8204255655161]
本研究では, 局所的およびグローバルな平滑化手法の性能と, 状態測定値の偏差について検討・比較する。
一般に,測度データセット全体を用いたグローバルな手法は,局所点の周辺に隣接するデータサブセットを用いる局所的手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-01-29T23:31:25Z) - Formal Verification of Stochastic Systems with ReLU Neural Network
Controllers [22.68044012584378]
reluニューラルネットワーク(nn)コントローラを備えたサイバーフィジカルシステムの形式的安全性検証の問題に対処する。
私たちの目標は、所定の自信を持って、システムが安全でない構成に達しない初期状態のセットを見つけることです。
論文 参考訳(メタデータ) (2021-03-08T23:53:13Z) - Correct-by-construction reach-avoid control of partially observable
linear stochastic systems [7.912008109232803]
離散時間線形時間不変系のリーチエイド制御のための頑健なフィードバックコントローラを定式化する。
問題は、必要となる証明状態の抽象化問題を満たすコントローラを計算することである。
論文 参考訳(メタデータ) (2021-03-03T13:46:52Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z) - Convergence and sample complexity of gradient methods for the model-free
linear quadratic regulator problem [27.09339991866556]
本稿では,コントローラの空間を直接探索することにより,未知の計算系に対する最適制御を求める。
我々は、安定化フィードバックゲインの勾配-フローのダイナミクスセットに焦点をあてて、そのような手法の性能と効率を最小化するための一歩を踏み出した。
論文 参考訳(メタデータ) (2019-12-26T16:56:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。