論文の概要: Lane-Keeping Control of Autonomous Vehicles Through a Soft-Constrained
Iterative LQR
- arxiv url: http://arxiv.org/abs/2311.16900v1
- Date: Tue, 28 Nov 2023 15:58:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-29 17:54:34.973289
- Title: Lane-Keeping Control of Autonomous Vehicles Through a Soft-Constrained
Iterative LQR
- Title(参考訳): ソフト制約反復型LQRによる自動車のレーンキーピング制御
- Authors: Der-Hau Lee
- Abstract要約: 我々は、CILQRアルゴリズムとモデル予測制御(MPC)制約緩和法を統合することで、ソフト制約付き反復線形四元数レギュレータ(Soft-CILQR)アルゴリズムを開発した。
数値シミュレーションでは, ソフトCILQRおよびCILQRソルバは, 正常に基準に向かってシステムを動かすことができたが, 加法障害を伴う条件下でのCILQRソルバよりもスムーズなステアリング入力軌道を得ることができた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The accurate prediction of smooth steering inputs is crucial for autonomous
vehicle applications because control actions with jitter might cause the
vehicle system to become unstable. To address this problem in automobile
lane-keeping control without the use of additional smoothing algorithms, we
developed a soft-constrained iterative linear-quadratic regulator (soft-CILQR)
algorithm by integrating CILQR algorithm and a model predictive control (MPC)
constraint relaxation method. We incorporated slack variables into the state
and control barrier functions of the soft-CILQR solver to soften the
constraints in the optimization process so that stabilizing control inputs can
be calculated in a relatively simple manner. Two types of automotive
lane-keeping experiments were conducted with a linear system dynamics model to
test the performance of the proposed soft-CILQR algorithm and to compare its
performance with that of the CILQR algorithm: numerical simulations and
experiments involving challenging vision-based maneuvers. In the numerical
simulations, the soft-CILQR and CILQR solvers managed to drive the system
toward the reference state asymptotically; however, the soft-CILQR solver
obtained smooth steering input trajectories more easily than did the CILQR
solver under conditions involving additive disturbances. In the experiments
with visual inputs, the soft-CILQR controller outperformed the CILQR controller
in terms of tracking accuracy and steering smoothness during the driving of an
ego vehicle on TORCS.
- Abstract(参考訳): ジッタによる制御動作が車両システムの不安定化を引き起こす可能性があるため、スムーズなステアリング入力の正確な予測は自動運転車アプリケーションにとって極めて重要である。
そこで本研究では,CILQRアルゴリズムとモデル予測制御(MPC)制約緩和法を統合することで,自動車車線維持制御におけるこの問題に対処するため,ソフトコントラクト付き反復線形クアッドラティックレギュレータ(Soft-CILQR)アルゴリズムを開発した。
我々は,スラック変数をソフトCILQRソルバの状態と制御障壁関数に組み込んで最適化プロセスの制約を緩和し,安定化制御入力を比較的簡単な方法で計算できるようにした。
2種類の自動車車線維持実験を線形システムダイナミクスモデルを用いて行い,提案するソフトシルqrアルゴリズムの性能をテストし,その性能をcilqrアルゴリズムと比較した。
数値シミュレーションでは, ソフトCILQRおよびCILQRソルバは漸近的に基準状態に向かってシステムを駆動することができたが, 加法障害を伴う条件下でのCILQRソルバよりもスムーズなステアリング入力軌道を得ることができた。
視覚入力を用いた実験では、TORCS上でのエゴ車両の運転時のトラッキング精度とステアリングのスムーズさにおいて、ソフトCILQRコントローラはCILQRコントローラよりも優れていた。
関連論文リスト
- Partial End-to-end Reinforcement Learning for Robustness Against Modelling Error in Autonomous Racing [0.0]
本稿では、自動運転車における強化学習(RL)ソリューションの性能向上の問題に対処する。
計画タスクと制御タスクを分離する部分的なエンドツーエンドアルゴリズムを提案する。
従来の制御器のロバスト性を活用することにより,本アルゴリズムは標準のエンドツーエンドアルゴリズムよりもモデルミスマッチに対するロバスト性を向上する。
論文 参考訳(メタデータ) (2023-12-11T14:27:10Z) - Mixed-Integer Optimal Control via Reinforcement Learning: A Case Study on Hybrid Electric Vehicle Energy Management [2.0762193863564926]
本稿では,2つの遅延深い決定論的アクターQ(TD3AQ)を最適制御問題に適用するハイブリッドアクション強化学習(HARL)アルゴリズムを提案する。
TD3AQはアクター批判とQ-ラーニングの両方の利点を組み合わせ、離散的かつ連続的なアクション空間を同時に扱うことができる。
提案手法はプラグインハイブリッド電気自動車(PHEV)のエネルギー管理問題に対して評価される。
論文 参考訳(メタデータ) (2023-05-02T14:42:21Z) - Actor-Critic based Improper Reinforcement Learning [61.430513757337486]
我々は,未知のマルコフ決定プロセスに対して,学習者に100万ドルのベースコントローラを付与する不適切な強化学習環境を考える。
本稿では,(1)ポリシーグラディエントに基づくアプローチ,(2)単純なアクター・クリティカル・スキームとNatural Actor-Criticスキームを切り替えるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-07-19T05:55:02Z) - Tackling Real-World Autonomous Driving using Deep Reinforcement Learning [63.3756530844707]
本研究では,加速と操舵角度を予測するニューラルネットワークを学習するモデルレスディープ強化学習プランナを提案する。
実際の自動運転車にシステムをデプロイするために、我々は小さなニューラルネットワークで表されるモジュールも開発する。
論文 参考訳(メタデータ) (2022-07-05T16:33:20Z) - Automated Controller Calibration by Kalman Filtering [2.2237337682863125]
提案手法は広範囲のコントローラに適用可能である。
この方法は、オンラインで堅牢にパラメータをチューニングし、計算効率が高く、データストレージの要件が低く、実装が容易である。
高忠実度車両シミュレータCarSimによるシミュレーション研究により、複雑な力学系のコントローラをオンラインで校正できることが示されている。
論文 参考訳(メタデータ) (2021-11-21T14:57:11Z) - Finite-time System Identification and Adaptive Control in Autoregressive
Exogenous Systems [79.67879934935661]
未知のARXシステムのシステム識別と適応制御の問題について検討する。
我々は,オープンループとクローズループの両方のデータ収集の下で,ARXシステムに対する有限時間学習保証を提供する。
論文 参考訳(メタデータ) (2021-08-26T18:00:00Z) - Self-adaptive Torque Vectoring Controller Using Reinforcement Learning [6.8390297905731625]
トルクベクトルコントローラなどの連続直接ヨーモーメント制御システムは、車両の安定化に不可欠な部品です。
トルクベクトル制御器のパラメータを注意深くチューニングする能力は、車両の性能と安定性を著しく向上させることができる。
トルクベクトル制御のためのパラメータチューニングアルゴリズムとして、DDPG(Deep Deterministic Policy Gradient)に基づく強化学習(RL)の有用性を示す。
論文 参考訳(メタデータ) (2021-03-27T12:39:56Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Logarithmic Regret Bound in Partially Observable Linear Dynamical
Systems [91.43582419264763]
部分的に観測可能な線形力学系におけるシステム同定と適応制御の問題について検討する。
開ループ系と閉ループ系の両方において有限時間保証付きの最初のモデル推定法を提案する。
AdaptOnは、未知の部分観測可能な線形力学系の適応制御において、$textpolylogleft(Tright)$ regretを達成する最初のアルゴリズムであることを示す。
論文 参考訳(メタデータ) (2020-03-25T06:00:33Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。