論文の概要: Score Matching Diffusion Based Feedback Control and Planning of Nonlinear Systems
- arxiv url: http://arxiv.org/abs/2504.09836v1
- Date: Mon, 14 Apr 2025 03:04:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-15 16:48:41.314507
- Title: Score Matching Diffusion Based Feedback Control and Planning of Nonlinear Systems
- Title(参考訳): スコアマッチング拡散に基づく非線形システムのフィードバック制御と計画
- Authors: Karthik Elamvazhuthi, Darshan Gadginmath, Fabio Pasqualetti,
- Abstract要約: 非ホロノミック制約を持つ制御アフィン系を安定化する新しい制御理論フレームワークを提案する。
後ろ向きのプロセスでノイズを除去することで、我々のアプローチは、機械学習に基づくdenoisingメソッドのより実践的な代替手段を提供する。
- 参考スコア(独自算出の注目度): 3.072340427031969
- License:
- Abstract: We propose a novel control-theoretic framework that leverages principles from generative modeling -- specifically, Denoising Diffusion Probabilistic Models (DDPMs) -- to stabilize control-affine systems with nonholonomic constraints. Unlike traditional stochastic approaches, which rely on noise-driven dynamics in both forward and reverse processes, our method crucially eliminates the need for noise in the reverse phase, making it particularly relevant for control applications. We introduce two formulations: one where noise perturbs all state dimensions during the forward phase while the control system enforces time reversal deterministically, and another where noise is restricted to the control channels, embedding system constraints directly into the forward process. For controllable nonlinear drift-free systems, we prove that deterministic feedback laws can exactly reverse the forward process, ensuring that the system's probability density evolves correctly without requiring artificial diffusion in the reverse phase. Furthermore, for linear time-invariant systems, we establish a time-reversal result under the second formulation. By eliminating noise in the backward process, our approach provides a more practical alternative to machine learning-based denoising methods, which are unsuitable for control applications due to the presence of stochasticity. We validate our results through numerical simulations on benchmark systems, including a unicycle model in a domain with obstacles, a driftless five-dimensional system, and a four-dimensional linear system, demonstrating the potential for applying diffusion-inspired techniques in linear, nonlinear, and settings with state space constraints.
- Abstract(参考訳): 非ホロノミック制約を持つ制御アフィン系を安定化させるために、生成モデリング、特に拡散確率モデル(DDPM)の原理を利用する新しい制御理論フレームワークを提案する。
前処理と逆処理の両方においてノイズ駆動力学に依存する従来の確率的アプローチとは異なり、本手法は逆相におけるノイズの必要性を著しく排除し、制御アプリケーションに特に関係している。
制御系が時間逆転を決定的に強制する間、制御系は前フェーズの全ての状態次元を摂動し、ノイズは制御チャネルに制限され、システム制約を直接フォワードプロセスに埋め込むという2つの定式化を導入する。
制御可能な非線形ドリフトフリー系では、決定論的フィードバック法則が前方過程を正確に逆転させ、逆相での人工拡散を必要とせずに系の確率密度が正しく進化することを証明する。
さらに、線形時間不変系に対しては、第2の定式化の下で時間反転結果を確立する。
提案手法は,後方処理におけるノイズを除去することにより,確率性の存在により制御用途に適さない機械学習に基づく denoising 法に対して,より実用的な代替手段を提供する。
本研究では, 障害物のある領域における一サイクルモデル, ドリフトレス5次元システム, および4次元線形システムなどのベンチマークシステム上での数値シミュレーションにより, 線形, 非線形, 状態空間制約のある設定に拡散誘導技術を適用する可能性を示す。
関連論文リスト
- Latent feedback control of distributed systems in multiple scenarios through deep learning-based reduced order models [3.5161229331588095]
高次元分散システムの継続的な監視とリアルタイム制御は、望まれる物理的な振る舞いを保証するためにアプリケーションに不可欠である。
完全順序モデルに依存する従来のフィードバック制御設計は、制御計算の遅延のため、これらの要求を満たすことができない。
非線形非侵襲的深層学習に基づく還元順序モデル(DL-ROM)により強化されたリアルタイム閉ループ制御戦略を提案する。
論文 参考訳(メタデータ) (2024-12-13T08:04:21Z) - Learning Controlled Stochastic Differential Equations [61.82896036131116]
本研究では,非一様拡散を伴う連続多次元非線形微分方程式のドリフト係数と拡散係数の両方を推定する新しい手法を提案する。
我々は、(L2)、(Linfty)の有限サンプル境界や、係数の正則性に適応する学習率を持つリスクメトリクスを含む、強力な理論的保証を提供する。
当社のメソッドはオープンソースPythonライブラリとして利用可能です。
論文 参考訳(メタデータ) (2024-11-04T11:09:58Z) - Denoising Diffusion-Based Control of Nonlinear Systems [3.4530027457862]
本稿では,非線形力学系を制御するために,拡散確率モデル(DDPM)に基づく新しい手法を提案する。
DDPMは様々なサンプリングタスクで成功を収めた生成モデルの最先端技術である。
様々な非線形システムに対する我々のアプローチを数値的に研究し、理論的結果を検証する。
論文 参考訳(メタデータ) (2024-02-03T23:19:26Z) - Data-Guided Regulator for Adaptive Nonlinear Control [0.27195102129094995]
本稿では,複雑な非線形システムに対するデータ駆動型フィードバックコントローラの問題に対処する。
目標は、直接的なポリシー更新を通じて、システム状態の有限時間規制を達成することである。
論文 参考訳(メタデータ) (2023-11-20T23:02:39Z) - Stability Bounds for Learning-Based Adaptive Control of Discrete-Time
Multi-Dimensional Stochastic Linear Systems with Input Constraints [3.8004168340068336]
本研究では,有界制御入力制約と非有界障害を有する離散時間多次元システムの適応安定化問題について考察する。
本稿では,オンラインパラメータ推定と飽和線形制御を組み合わせた等価制御手法を提案する。
論文 参考訳(メタデータ) (2023-04-02T16:38:13Z) - Robust Control for Dynamical Systems With Non-Gaussian Noise via Formal
Abstractions [59.605246463200736]
雑音分布の明示的な表現に依存しない新しい制御器合成法を提案する。
まず、連続制御系を有限状態モデルに抽象化し、離散状態間の確率的遷移によってノイズを捕捉する。
我々は最先端の検証技術を用いてマルコフ決定プロセスの間隔を保証し、これらの保証が元の制御システムに受け継がれるコントローラを演算する。
論文 参考訳(メタデータ) (2023-01-04T10:40:30Z) - A Priori Denoising Strategies for Sparse Identification of Nonlinear
Dynamical Systems: A Comparative Study [68.8204255655161]
本研究では, 局所的およびグローバルな平滑化手法の性能と, 状態測定値の偏差について検討・比較する。
一般に,測度データセット全体を用いたグローバルな手法は,局所点の周辺に隣接するデータサブセットを用いる局所的手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-01-29T23:31:25Z) - Adaptive Robust Model Predictive Control with Matched and Unmatched
Uncertainty [28.10549712956161]
離散時間系のダイナミクスにおける大きな不確実性を扱うことができる学習ベースの堅牢な予測制御アルゴリズムを提案する。
既存の学習に基づく予測制御アルゴリズムが大規模な不確実性が存在する場合の安全性を確保することができず、性能が大幅に向上する。
論文 参考訳(メタデータ) (2021-04-16T17:47:02Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Active Learning for Nonlinear System Identification with Guarantees [102.43355665393067]
状態遷移が既知の状態-作用対の特徴埋め込みに線形に依存する非線形力学系のクラスについて検討する。
そこで本稿では, トラジェクティブ・プランニング, トラジェクティブ・トラッキング, システムの再推定という3つのステップを繰り返すことで, この問題を解決するためのアクティブ・ラーニング・アプローチを提案する。
本手法は, 非線形力学系を標準線形回帰の統計速度と同様, パラメトリック速度で推定する。
論文 参考訳(メタデータ) (2020-06-18T04:54:11Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。