論文の概要: Neural Operators for Boundary Stabilization of Stop-and-go Traffic
- arxiv url: http://arxiv.org/abs/2312.10374v1
- Date: Sat, 16 Dec 2023 08:18:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-19 16:50:58.694277
- Title: Neural Operators for Boundary Stabilization of Stop-and-go Traffic
- Title(参考訳): ストップ・アンド・ゴー交通の境界安定化のためのニューラル演算子
- Authors: Yihuai Zhang, Ruiguo Zhong, Huan Yu
- Abstract要約: 本稿では,ニューラル演算子を用いたPDE境界制御設計への新しいアプローチを提案する。
本稿では,トラフィックPDEシステムの安定化を目的とした2種類のニューラル演算子学習手法を提案する。
特定の近似精度条件下では,NOをベースとした閉ループシステムは実用的に安定であることが証明された。
- 参考スコア(独自算出の注目度): 1.90298817989995
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces a novel approach to PDE boundary control design using
neural operators to alleviate stop-and-go instabilities in congested traffic
flow. Our framework leverages neural operators to design control strategies for
traffic flow systems. The traffic dynamics are described by the Aw-Rascle-Zhang
(ARZ) model, which comprises a set of second-order coupled hyperbolic partial
differential equations (PDEs). Backstepping method is widely used for boundary
control of such PDE systems. The PDE model-based control design can be
time-consuming and require intensive depth of expertise since it involves
constructing and solving backstepping control kernels. To overcome these
challenges, we present two distinct neural operator (NO) learning schemes aimed
at stabilizing the traffic PDE system. The first scheme embeds NO-approximated
gain kernels within a predefined backstepping controller, while the second one
directly learns a boundary control law. The Lyapunov analysis is conducted to
evaluate the stability of the NO-approximated gain kernels and control law. It
is proved that the NO-based closed-loop system is practical stable under
certain approximation accuracy conditions in NO-learning. To validate the
efficacy of the proposed approach, simulations are conducted to compare the
performance of the two neural operator controllers with a PDE backstepping
controller and a Proportional Integral (PI) controller. While the
NO-approximated methods exhibit higher errors compared to the backstepping
controller, they consistently outperform the PI controller, demonstrating
faster computation speeds across all scenarios. This result suggests that
neural operators can significantly expedite and simplify the process of
obtaining boundary controllers in traffic PDE systems.
- Abstract(参考訳): 本稿では,ニューラル演算子を用いたpde境界制御設計における新しい手法を提案する。
当社のフレームワークは,トラヒックフローシステムの制御戦略設計にニューラルネットワークを活用する。
交通力学は、二階結合双曲型偏微分方程式(PDE)からなるAw-Rascle-Zhang(ARZ)モデルによって記述される。
このようなPDEシステムのバウンダリ制御にはバックステッピング法が広く用いられている。
PDEモデルに基づく制御設計は時間がかかり、バックステッピング制御カーネルの構築と解決を含むため、専門知識の深みを必要とする。
これらの課題を克服するために,トラヒックpdeシステムの安定化を目的とした2つの異なるニューラルオペレータ(no)学習方式を提案する。
第1のスキームは事前に定義されたバックステッピングコントローラ内にNO近似ゲインカーネルを埋め込み、第2のスキームは境界制御法則を直接学習する。
リアプノフ解析は、非近似利得核と制御則の安定性を評価するために行われる。
特定の近似精度条件下では,NO系閉ループシステムは事実上安定であることが証明された。
提案手法の有効性を検証するため,2つのニューラル演算子コントローラとPDEバックステッピングコントローラとProportional Integral(PI)コントローラの性能を比較するシミュレーションを行った。
NO近似法はバックステッピングコントローラよりも高い誤差を示すが、PIコントローラを一貫して上回り、全てのシナリオで高速な計算速度を示す。
この結果から,ニューラル演算子はトラフィックPDEシステムにおける境界制御器の獲得プロセスを大幅に高速化し,単純化することができることが示唆された。
関連論文リスト
- Structured Deep Neural Networks-Based Backstepping Trajectory Tracking
Control for Lagrangian Systems [10.505600836291837]
提案したコントローラは、任意の互換性のあるニューラルネットワークパラメータに対してクローズループ安定性を確保することができる。
モデル近似誤差や外乱の存在下では、閉ループ安定性と追従制御性能が保証されることが示されている。
論文 参考訳(メタデータ) (2024-03-01T09:09:37Z) - Sub-linear Regret in Adaptive Model Predictive Control [56.705978425244496]
本稿では,STT-MPC (Self-Tuning tube-based Model Predictive Control) について述べる。
システム力学を最初に認識したアルゴリズムと比較して,アルゴリズムの後悔を解析する。
論文 参考訳(メタデータ) (2023-10-07T15:07:10Z) - Proximal Policy Optimization Learning based Control of Congested Freeway
Traffic [3.816579519746557]
本研究では,PPO強化学習に基づく遅延補償フィードバックコントローラを提案する。
遅延のないシステムでは、PPO制御はリアプノフ制御よりも収束速度が速く、制御労力も少ない。
論文 参考訳(メタデータ) (2022-04-12T08:36:21Z) - Steady-State Error Compensation in Reference Tracking and Disturbance
Rejection Problems for Reinforcement Learning-Based Control [0.9023847175654602]
強化学習(Reinforcement Learning, RL)は、自動制御アプリケーションにおける将来的なトピックである。
アクター批判に基づくRLコントローラのためのイニシアティブアクション状態拡張(IASA)が導入される。
この拡張は専門家の知識を必要とせず、アプローチモデルを無償にしておく。
論文 参考訳(メタデータ) (2022-01-31T16:29:19Z) - Finite-time System Identification and Adaptive Control in Autoregressive
Exogenous Systems [79.67879934935661]
未知のARXシステムのシステム識別と適応制御の問題について検討する。
我々は,オープンループとクローズループの両方のデータ収集の下で,ARXシステムに対する有限時間学習保証を提供する。
論文 参考訳(メタデータ) (2021-08-26T18:00:00Z) - Regret-optimal Estimation and Control [52.28457815067461]
後悔最適推定器と後悔最適制御器は状態空間形式で導出可能であることを示す。
非線形力学系に対するモデル予測制御(MPC)と拡張KalmanFilter(EKF)の残差最適類似性を提案する。
論文 参考訳(メタデータ) (2021-06-22T23:14:21Z) - Data-Driven Optimized Tracking Control Heuristic for MIMO Structures: A
Balance System Case Study [8.035375408614776]
PIDは2入力の2アウトプットバランスシステムで示される。
自己調整型非線形しきい値とニューラルネットワークを統合し、所望の過渡特性と定常特性を妥協する。
ニューラルネットワークは、客観的コスト関数のような重み付き導関数の最適化を訓練する。
論文 参考訳(メタデータ) (2021-04-01T02:00:20Z) - Control of Stochastic Quantum Dynamics with Differentiable Programming [0.0]
微分可能プログラミングに基づく制御スキームの自動設計のためのフレームワークを提案する。
このアプローチを、ホモジエン検出を受けるクビットの状態準備と安定化に適用する。
その結果、信号と雑音の比が低いにもかかわらず、平均忠実度が約85%の目標状態へのキュービットの準備と安定化をコントローラに教えることができる。
論文 参考訳(メタデータ) (2021-01-04T19:00:03Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Learning Stabilizing Controllers for Unstable Linear Quadratic
Regulators from a Single Trajectory [85.29718245299341]
線形2次制御器(LQR)としても知られる2次コストモデルの下で線形制御器を研究する。
楕円形不確実性集合内の全ての系を安定化させる制御器を構成する2つの異なる半定値プログラム(SDP)を提案する。
高い確率で安定化コントローラを迅速に識別できる効率的なデータ依存アルゴリズムであるtextsceXplorationを提案する。
論文 参考訳(メタデータ) (2020-06-19T08:58:57Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。