論文の概要: State Estimation Using Particle Filtering in Adaptive Machine Learning Methods: Integrating Q-Learning and NEAT Algorithms with Noisy Radar Measurements
- arxiv url: http://arxiv.org/abs/2504.07393v1
- Date: Thu, 10 Apr 2025 02:20:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-18 22:01:49.680777
- Title: State Estimation Using Particle Filtering in Adaptive Machine Learning Methods: Integrating Q-Learning and NEAT Algorithms with Noisy Radar Measurements
- Title(参考訳): 適応機械学習における粒子フィルタリングを用いた状態推定:Q-LearningアルゴリズムとNEATアルゴリズムをノイズレーダ計測に統合する
- Authors: Wonjin Song, Feng Bao,
- Abstract要約: 本稿では,Q-LearningとNEATを統合化して,ノイズ測定の課題に対処する統合フレームワークを提案する。
グリッドベースのナビゲーションとシミュレートされた自動車環境の実験は、トレーニングの安定性、最終的なパフォーマンス、高度なフィルタリングを欠いたベースラインに対する成功率において、一貫した向上を浮き彫りにした。
- 参考スコア(独自算出の注目度): 0.8528368686417979
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reliable state estimation is essential for autonomous systems operating in complex, noisy environments. Classical filtering approaches, such as the Kalman filter, can struggle when facing nonlinear dynamics or non-Gaussian noise, and even more flexible particle filters often encounter sample degeneracy or high computational costs in large-scale domains. Meanwhile, adaptive machine learning techniques, including Q-learning and neuroevolutionary algorithms such as NEAT, rely heavily on accurate state feedback to guide learning; when sensor data are imperfect, these methods suffer from degraded convergence and suboptimal performance. In this paper, we propose an integrated framework that unifies particle filtering with Q-learning and NEAT to explicitly address the challenge of noisy measurements. By refining radar-based observations into reliable state estimates, our particle filter drives more stable policy updates (in Q-learning) or controller evolution (in NEAT), allowing both reinforcement learning and neuroevolution to converge faster, achieve higher returns or fitness, and exhibit greater resilience to sensor uncertainty. Experiments on grid-based navigation and a simulated car environment highlight consistent gains in training stability, final performance, and success rates over baselines lacking advanced filtering. Altogether, these findings underscore that accurate state estimation is not merely a preprocessing step, but a vital component capable of substantially enhancing adaptive machine learning in real-world applications plagued by sensor noise.
- Abstract(参考訳): 複雑でノイズの多い環境で稼働する自律システムには、信頼性の高い状態推定が不可欠である。
カルマンフィルタのような古典的なフィルタリング手法は、非線形力学や非ガウス雑音に直面する際に苦労し、さらに柔軟な粒子フィルタは、大規模な領域でサンプル縮退や高い計算コストに遭遇することがある。
一方、Q-learningやNEATのような神経進化アルゴリズムを含む適応型機械学習技術は、学習を導くための正確な状態フィードバックに大きく依存している。
本稿では,Q-learning と NEAT を統合化して,ノイズ測定の課題に対処する統合フレームワークを提案する。
レーダベースの観測結果を信頼性の高い状態推定に精製することにより、粒子フィルタはより安定したポリシー更新(Q-learning)やコントローラの進化(NEAT)を駆動し、強化学習と神経進化の両方がより早く収束し、より高いリターンや適合性を達成し、センサの不確実性に対するレジリエンスを高める。
グリッドベースのナビゲーションとシミュレートされた自動車環境の実験は、トレーニングの安定性、最終的なパフォーマンス、高度なフィルタリングを欠いたベースラインに対する成功率において、一貫した向上を浮き彫りにした。
これらの知見は、正確な状態推定は単に前処理の段階ではなく、センサーノイズに悩まされる現実世界のアプリケーションにおいて、適応機械学習を大幅に強化できる重要な要素であることを示している。
関連論文リスト
- Efficient Transformed Gaussian Process State-Space Models for Non-Stationary High-Dimensional Dynamical Systems [49.819436680336786]
ガウス過程状態空間モデル(GPSSM)は動的システムのモデリングのための強力なフレームワークとして登場した。
本稿では,これらの制約に対処するため,効率的に変換されたガウス過程状態空間モデル(ETGPSSM)を提案する。
提案手法は,単一共有ガウス過程(GP)と正規化フローとベイズニューラルネットワークを組み合わせることで,複雑な高次元状態遷移の効率的なモデリングを可能にする。
論文 参考訳(メタデータ) (2025-03-24T03:19:45Z) - 3D Multi-Object Tracking with Semi-Supervised GRU-Kalman Filter [6.13623925528906]
3D Multi-Object Tracking (MOT)は、自律運転やロボットセンシングのようなインテリジェントなシステムに不可欠である。
本稿では,学習可能なカルマンフィルタを移動モジュールに導入するGRUベースのMOT法を提案する。
このアプローチは、データ駆動学習を通じてオブジェクトの動き特性を学習することができ、手動モデル設計やモデルエラーを回避することができる。
論文 参考訳(メタデータ) (2024-11-13T08:34:07Z) - Model-aware reinforcement learning for high-performance Bayesian experimental design in quantum metrology [0.4999814847776097]
量子センサは、様々なパラメータにわたる実験者による操作を可能にすることで、推定中に制御の柔軟性を提供する。
量子力学、推定、仮説テストにおいて、幅広い問題を最適化できる汎用的な手順を導入する。
粒子フィルタリングに基づくモデル認識強化学習(RL)とベイズ推定を組み合わせた。
論文 参考訳(メタデータ) (2023-12-28T12:04:15Z) - An Ensemble Score Filter for Tracking High-Dimensional Nonlinear Dynamical Systems [10.997994515823798]
本研究では,高次元非線形フィルタ問題に対するアンサンブルスコアフィルタ(EnSF)を提案する。
ニューラルネットワークをトレーニングしてスコア関数を近似する既存の拡散モデルとは異なり、トレーニング不要スコア推定を開発する。
EnSFは、最先端のLocal Ensemble Transform Kalman Filter法と比較して、驚くべきパフォーマンスを提供する。
論文 参考訳(メタデータ) (2023-09-02T16:48:02Z) - Learning IMM Filter Parameters from Measurements using Gradient Descent [45.335821132209766]
トラック下のターゲットの固有のパラメータは、システムがデプロイされるまで完全に観測不可能である。
最先端のセンサーシステムはますます複雑になり、パラメータの数が自然に増加する。
本稿では,対話型多重モデル (IMM) フィルタのパラメータを計測のみで最適化する。
論文 参考訳(メタデータ) (2023-07-13T08:35:40Z) - Neural optimal feedback control with local learning rules [67.5926699124528]
運動制御の大きな問題は、脳がどのように遅延と雑音の刺激に直面して適切な動きを計画し実行するかを理解することである。
本稿では,適応カルマンフィルタとモデル自由制御手法を組み合わせた新しいオンラインアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-11-12T20:02:00Z) - KalmanNet: Neural Network Aided Kalman Filtering for Partially Known
Dynamics [84.18625250574853]
KalmanNetは、データから学習し、非線形力学の下でKalmanフィルタを実行するリアルタイム状態推定器である。
我々は、KalmanNetが非線形性とモデルミスマッチを克服し、古典的なフィルタリング手法より優れていることを数値的に示す。
論文 参考訳(メタデータ) (2021-07-21T12:26:46Z) - DANAE: a denoising autoencoder for underwater attitude estimation [1.0312968200748116]
DANAEは、カルマンフィルタIMU/AHRSデータ統合で動作する、姿勢推定のためのDenoising AutoeNcoderである。
本稿では、DANAEが堅牢で信頼性が高く、カルマンフィルタの結果を大幅に改善していることを示す。
論文 参考訳(メタデータ) (2020-11-13T10:53:01Z) - End-To-End Semi-supervised Learning for Differentiable Particle Filters [15.187145925738553]
ニューラルネットワークを粒子フィルタに組み込むことの最近の進歩は、実世界のアプリケーションに粒子フィルタを適用するために望ましい柔軟性を提供する。
このようなモデルを最適化する過去の努力は、実際に入手したり利用できなくなったりするのに費用がかかる真の状態の知識を必要とすることが多い。
本研究では,実状態の大部分が未知である場合の状態を推定し,擬似的様相関数の最大化に基づくエンドツーエンド学習目標を提案する。
論文 参考訳(メタデータ) (2020-11-11T13:10:11Z) - Robust Reinforcement Learning with Wasserstein Constraint [49.86490922809473]
最適なロバストなポリシーの存在を示し、摂動に対する感度分析を行い、新しいロバストな学習アルゴリズムを設計する。
提案アルゴリズムの有効性はCart-Pole環境で検証する。
論文 参考訳(メタデータ) (2020-06-01T13:48:59Z) - Neural Networks Versus Conventional Filters for Inertial-Sensor-based
Attitude Estimation [1.0957528713294873]
慣性測定ユニットは、移動する物体の姿勢を推定するために一般的に使用される。
センサ融合問題の解法として非線形フィルタ法が提案されている。
人工ニューラルネットワークによってこれらの制限が克服できる範囲について検討する。
論文 参考訳(メタデータ) (2020-05-14T11:59:19Z) - Tracking Performance of Online Stochastic Learners [57.14673504239551]
オンラインアルゴリズムは、大規模なバッチにデータを保存したり処理したりすることなく、リアルタイムで更新を計算できるため、大規模な学習環境で人気がある。
一定のステップサイズを使用すると、これらのアルゴリズムはデータやモデル特性などの問題パラメータのドリフトに適応し、適切な精度で最適解を追跡する能力を持つ。
定常仮定に基づく定常状態性能とランダムウォークモデルによるオンライン学習者の追跡性能の関連性を確立する。
論文 参考訳(メタデータ) (2020-04-04T14:16:27Z) - Logarithmic Regret Bound in Partially Observable Linear Dynamical
Systems [91.43582419264763]
部分的に観測可能な線形力学系におけるシステム同定と適応制御の問題について検討する。
開ループ系と閉ループ系の両方において有限時間保証付きの最初のモデル推定法を提案する。
AdaptOnは、未知の部分観測可能な線形力学系の適応制御において、$textpolylogleft(Tright)$ regretを達成する最初のアルゴリズムであることを示す。
論文 参考訳(メタデータ) (2020-03-25T06:00:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。