論文の概要: Online Learning of Kalman Filtering: From Output to State Estimation
- arxiv url: http://arxiv.org/abs/2603.27159v1
- Date: Sat, 28 Mar 2026 06:48:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:44.82095
- Title: Online Learning of Kalman Filtering: From Output to State Estimation
- Title(参考訳): カルマンフィルタのオンライン学習:出力から状態推定へ
- Authors: Lintao Ye, Ankang Zhang, Ming Chi, Bin Du, Jianghai Hu,
- Abstract要約: 本稿では,オンライン最適化に基づく統一的なアルゴリズムフレームワークを提案し,出力推定と状態推定の両方のシナリオを解決する。
本稿では,提案アルゴリズムが出力推定シナリオに対して水平長$T$で$log T$-regretを達成することを示す。
- 参考スコア(独自算出の注目度): 5.8573341935374375
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we study the problem of learning Kalman filtering with unknown system model in partially observed linear dynamical systems. We propose a unified algorithmic framework based on online optimization that can be used to solve both the output estimation and state estimation scenarios. By exploring the properties of the estimation error cost functions, such as conditionally strong convexity, we show that our algorithm achieves a $\log T$-regret in the horizon length $T$ for the output estimation scenario. More importantly, we tackle the more challenging scenario of learning Kalman filtering for state estimation, which is an open problem in the literature. We first characterize a fundamental limitation of the problem, demonstrating the impossibility of any algorithm to achieve sublinear regret in $T$. By further introducing a random query scheme into our algorithm, we show that a $\sqrt{T}$-regret is achievable when rendering the algorithm limited query access to more informative measurements of the system state in practice. Our algorithm and regret readily capture the trade-off between the number of queries and the achieved regret, and shed light on online learning problems with limited observations. We validate the performance of our algorithms using numerical examples.
- Abstract(参考訳): 本稿では,部分的に観測された線形力学系における未知の系モデルを用いたカルマンフィルタの学習問題について検討する。
本稿では,オンライン最適化に基づく統一的なアルゴリズムフレームワークを提案し,出力推定と状態推定の両方のシナリオを解く。
条件付き強い凸性などの推定誤差コスト関数の特性を探索することにより,提案アルゴリズムが出力推定シナリオに対して水平長$T$で$\log T$-regretを達成することを示す。
さらに重要なことは、カルマンフィルタを状態推定のために学習するより難しいシナリオに取り組み、これは文献において未解決の問題である。
まず、この問題の基本的な制限を特徴付け、$T$でサブ線形後悔を達成するアルゴリズムが不可能であることを証明した。
さらにアルゴリズムにランダムなクエリスキームを導入することで、実際にシステム状態のより情報的な測定を行うために、アルゴリズムに制限されたクエリアクセスをレンダリングする場合、$\sqrt{T}$-regretが実現可能であることを示す。
我々のアルゴリズムと後悔は、クエリ数と達成された後悔の間のトレードオフを簡単に捉え、限られた観察でオンライン学習の問題に光を当てた。
数値例を用いてアルゴリズムの性能を検証した。
関連論文リスト
- A Polynomial-time Algorithm for Online Sparse Linear Regression with Improved Regret Bound under Weaker Conditions [75.69959433669244]
オンラインスパース線形回帰(OSLR)では,予測のために1インスタンスあたり$d$あたり$k$しかアクセスできない。
提案手法では, 過去の後悔点を大幅に改善する拡張時間アルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-10-31T05:02:33Z) - Sublinear Regret for a Class of Continuous-Time Linear-Quadratic Reinforcement Learning Problems [10.404992912881601]
拡散に対する連続時間線形四元数(LQ)制御のクラスに対する強化学習(RL)について検討した。
モデルパラメータの知識にも,その推定にも依存しないモデルフリーアプローチを適用し,RLアルゴリズムを設計して,適切なポリシパラメータを直接学習する。
論文 参考訳(メタデータ) (2024-07-24T12:26:21Z) - Online Estimation via Offline Estimation: An Information-Theoretic Framework [75.80823630681323]
オフライン推定アルゴリズムをオンライン推定アルゴリズムに変換することは可能か?
我々はOracle-Efficient Online Estimation (OEOE)という新しいフレームワークを導入し,学習者はストリーム上で動作しているブラックボックスアルゴリズムによって生成されたオフライン推定器のシーケンスを通じて,データストリームと間接的にのみ対話することができる。
論文 参考訳(メタデータ) (2024-04-15T20:19:18Z) - Learning to Control under Time-Varying Environment [18.48729114775298]
本稿では,線形時間変化(LTV)力学系における後悔の問題について検討する。
提案するオンラインアルゴリズムは, 計算に難易度を保証した最初のオンラインアルゴリズムである。
論文 参考訳(メタデータ) (2022-06-06T11:40:46Z) - A Data-Driven Line Search Rule for Support Recovery in High-dimensional
Data Analysis [5.180648702293017]
適切なステップサイズを適応的に決定する新しい,効率的なデータ駆動行探索法を提案する。
線形回帰問題とロジスティック回帰問題における最先端アルゴリズムとの比較は,提案アルゴリズムの安定性,有効性,優越性を示す。
論文 参考訳(メタデータ) (2021-11-21T12:18:18Z) - Online estimation and control with optimal pathlength regret [52.28457815067461]
オンライン学習アルゴリズムを設計する際の自然なゴールは、入力シーケンスの時間的変動の観点から、アルゴリズムの後悔を束縛することである。
OCOや盗賊など、さまざまなオンライン学習問題に対して、データ依存の「病的」後悔境界が最近取得されている。
論文 参考訳(メタデータ) (2021-10-24T22:43:15Z) - Machine Learning for Online Algorithm Selection under Censored Feedback [71.6879432974126]
オンラインアルゴリズム選択(OAS)では、アルゴリズム問題クラスのインスタンスがエージェントに次々に提示され、エージェントは、固定された候補アルゴリズムセットから、おそらく最高のアルゴリズムを迅速に選択する必要がある。
SAT(Satisfiability)のような決定問題に対して、品質は一般的にアルゴリズムのランタイムを指す。
本研究では,OASのマルチアームバンディットアルゴリズムを再検討し,この問題に対処する能力について議論する。
ランタイム指向の損失に適応し、時間的地平線に依存しない空間的・時間的複雑さを維持しながら、部分的に検閲されたデータを可能にする。
論文 参考訳(メタデータ) (2021-09-13T18:10:52Z) - Active Model Estimation in Markov Decision Processes [108.46146218973189]
マルコフ決定過程(MDP)をモデル化した環境の正確なモデル学習のための効率的な探索の課題について検討する。
マルコフに基づくアルゴリズムは,本アルゴリズムと極大エントロピーアルゴリズムの両方を小サンプル方式で上回っていることを示す。
論文 参考訳(メタデータ) (2020-03-06T16:17:24Z) - Logarithmic Regret for Adversarial Online Control [56.12283443161479]
対数的後悔を伴う最初のアルゴリズムを任意対数外乱列に対して与える。
我々のアルゴリズムと分析はオフライン制御法の特徴を利用してオンライン制御問題を(遅延)オンライン学習に還元する。
論文 参考訳(メタデータ) (2020-02-29T06:29:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。