論文の概要: Differentiable Adaptive Kalman Filtering via Optimal Transport
- arxiv url: http://arxiv.org/abs/2508.07037v1
- Date: Sat, 09 Aug 2025 16:36:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-12 21:23:28.667144
- Title: Differentiable Adaptive Kalman Filtering via Optimal Transport
- Title(参考訳): 最適輸送による微分適応カルマンフィルタ
- Authors: Yangguang He, Wenhao Li, Minzhe Li, Juan Zhang, Xiangfeng Wang, Bo Jin,
- Abstract要約: OTAKNetは、学習ベースの適応カルマンフィルタリングにおけるノイズ統計のドリフトに対する最初のオンラインソリューションである。
OTAKNetと従来のモデルベース適応カルマンフィルタとオフライン学習ベースフィルタを比較した。
- 参考スコア(独自算出の注目度): 23.40376181606577
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning-based filtering has demonstrated strong performance in non-linear dynamical systems, particularly when the statistics of noise are unknown. However, in real-world deployments, environmental factors, such as changing wind conditions or electromagnetic interference, can induce unobserved noise-statistics drift, leading to substantial degradation of learning-based methods. To address this challenge, we propose OTAKNet, the first online solution to noise-statistics drift within learning-based adaptive Kalman filtering. Unlike existing learning-based methods that perform offline fine-tuning using batch pointwise matching over entire trajectories, OTAKNet establishes a connection between the state estimate and the drift via one-step predictive measurement likelihood, and addresses it using optimal transport. This leverages OT's geometry - aware cost and stable gradients to enable fully online adaptation without ground truth labels or retraining. We compare OTAKNet against classical model-based adaptive Kalman filtering and offline learning-based filtering. The performance is demonstrated on both synthetic and real-world NCLT datasets, particularly under limited training data.
- Abstract(参考訳): 学習に基づくフィルタリングは非線形力学系において、特にノイズの統計が不明な場合に強い性能を示す。
しかし、現実の展開では、風条件の変化や電磁干渉などの環境要因が観測されていないノイズ統計の漂流を誘発し、学習ベースの手法が大幅に劣化する。
この課題に対処するため,我々は,学習に基づく適応カルマンフィルタリングにおいて,ノイズ統計量に対する最初のオンラインソリューションであるOTAKNetを提案する。
OTAKNetは、全軌道上でバッチポイントワイドマッチングを用いてオフラインで微調整を行う既存の学習手法とは異なり、状態推定とドリフトとの接続を1ステップの予測精度で確立し、最適な輸送手段を用いて対処する。
これはOTの幾何、すなわち意識的なコストと安定した勾配を利用して、真実のラベルや再訓練なしに完全なオンライン適応を可能にします。
OTAKNetと従来のモデルベース適応カルマンフィルタとオフライン学習ベースフィルタを比較した。
この性能は、特に限られたトレーニングデータの下で、合成および実世界のNCLTデータセットの両方で実証される。
関連論文リスト
- Offline Reinforcement Learning with Wasserstein Regularization via Optimal Transport Maps [47.57615889991631]
オフライン強化学習(RL)は、静的データセットから最適なポリシーを学ぶことを目的としている。
本稿では,分布外データに対して頑健なワッサースタイン距離を利用する手法を提案する。
提案手法は,D4RLベンチマークデータセット上で広く使用されている手法と同等あるいは優れた性能を示す。
論文 参考訳(メタデータ) (2025-07-14T22:28:36Z) - State Estimation Using Particle Filtering in Adaptive Machine Learning Methods: Integrating Q-Learning and NEAT Algorithms with Noisy Radar Measurements [0.8528368686417979]
本稿では,Q-LearningとNEATを統合化して,ノイズ測定の課題に対処する統合フレームワークを提案する。
グリッドベースのナビゲーションとシミュレートされた自動車環境の実験は、トレーニングの安定性、最終的なパフォーマンス、高度なフィルタリングを欠いたベースラインに対する成功率において、一貫した向上を浮き彫りにした。
論文 参考訳(メタデータ) (2025-04-10T02:20:45Z) - Differentially Flat Learning-based Model Predictive Control Using a
Stability, State, and Input Constraining Safety Filter [10.52705437098686]
学習に基づく最適制御アルゴリズムは、過去の軌跡データとシステムダイナミクスの学習モデルを用いて未知のシステムを制御する。
本稿では、微分平坦性を利用して、最先端の学習ベースコントローラに類似した性能を実現する非線形制御器を提案する。
論文 参考訳(メタデータ) (2023-07-20T02:42:23Z) - Kalman Filter for Online Classification of Non-Stationary Data [101.26838049872651]
オンライン連続学習(OCL)では、学習システムはデータのストリームを受け取り、予測とトレーニングの手順を順次実行する。
本稿では,線形予測量に対するニューラル表現と状態空間モデルを用いた確率ベイズオンライン学習モデルを提案する。
多クラス分類の実験では、モデルの予測能力と非定常性を捉える柔軟性を示す。
論文 参考訳(メタデータ) (2023-06-14T11:41:42Z) - KalmanNet: Neural Network Aided Kalman Filtering for Partially Known
Dynamics [84.18625250574853]
KalmanNetは、データから学習し、非線形力学の下でKalmanフィルタを実行するリアルタイム状態推定器である。
我々は、KalmanNetが非線形性とモデルミスマッチを克服し、古典的なフィルタリング手法より優れていることを数値的に示す。
論文 参考訳(メタデータ) (2021-07-21T12:26:46Z) - Unsupervised Domain Adaptation for Speech Recognition via Uncertainty
Driven Self-Training [55.824641135682725]
WSJ をソースドメインとし,TED-Lium 3 とSWITCHBOARD を併用したドメイン適応実験を行った。
論文 参考訳(メタデータ) (2020-11-26T18:51:26Z) - Tracking Performance of Online Stochastic Learners [57.14673504239551]
オンラインアルゴリズムは、大規模なバッチにデータを保存したり処理したりすることなく、リアルタイムで更新を計算できるため、大規模な学習環境で人気がある。
一定のステップサイズを使用すると、これらのアルゴリズムはデータやモデル特性などの問題パラメータのドリフトに適応し、適切な精度で最適解を追跡する能力を持つ。
定常仮定に基づく定常状態性能とランダムウォークモデルによるオンライン学習者の追跡性能の関連性を確立する。
論文 参考訳(メタデータ) (2020-04-04T14:16:27Z) - Logarithmic Regret Bound in Partially Observable Linear Dynamical
Systems [91.43582419264763]
部分的に観測可能な線形力学系におけるシステム同定と適応制御の問題について検討する。
開ループ系と閉ループ系の両方において有限時間保証付きの最初のモデル推定法を提案する。
AdaptOnは、未知の部分観測可能な線形力学系の適応制御において、$textpolylogleft(Tright)$ regretを達成する最初のアルゴリズムであることを示す。
論文 参考訳(メタデータ) (2020-03-25T06:00:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。