論文の概要: Feedback Linearization of Car Dynamics for Racing via Reinforcement
Learning
- arxiv url: http://arxiv.org/abs/2110.10441v1
- Date: Wed, 20 Oct 2021 09:11:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-23 22:35:45.503742
- Title: Feedback Linearization of Car Dynamics for Racing via Reinforcement
Learning
- Title(参考訳): 強化学習によるレーシング車動特性のフィードバック線形化
- Authors: Michael Estrada, Sida Li, Xiangyu Cai
- Abstract要約: 我々は、自動走行する車の制御プロセスを簡素化するために、リニアライゼーションコントローラを学ぼうとしている。
ソフトアクター批判的手法は、手動設計の線形化制御器の誤差を効果的に補正するデカップリング行列とドリフトベクトルを学習するために用いられる。
そこで我々は、線形化制御器の出力をレース環境に必要な入力に変換するために教師付き学習を用いてトレーニングされたニューラルネットワークであるフィードバック線形化法の拡張を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Through the method of Learning Feedback Linearization, we seek to learn a
linearizing controller to simplify the process of controlling a car to race
autonomously. A soft actor-critic approach is used to learn a decoupling matrix
and drift vector that effectively correct for errors in a hand-designed
linearizing controller. The result is an exactly linearizing controller that
can be used to enable the well-developed theory of linear systems to design
path planning and tracking schemes that are easy to implement and significantly
less computationally demanding. To demonstrate the method of feedback
linearization, it is first used to learn a simulated model whose exact
structure is known, but varied from the initial controller, so as to introduce
error. We further seek to apply this method to a system that introduces even
more error in the form of a gym environment specifically designed for modeling
the dynamics of car racing. To do so, we posit an extension to the method of
learning feedback linearization; a neural network that is trained using
supervised learning to convert the output of our linearizing controller to the
required input for the racing environment. Our progress towards these goals is
reported and the next steps in their accomplishment are discussed.
- Abstract(参考訳): フィードバック線形化を学習する手法を用いて,リニアイゼーションコントローラを学習し,車両の自律走行制御プロセスを簡素化する。
ソフトアクター批判的手法は、手動設計の線形化制御器の誤差を効果的に補正するデカップリング行列とドリフトベクトルを学習するために用いられる。
その結果、線形システムのよく発達した理論を利用して、実装が容易で計算的に要求の少ない経路計画と追跡スキームを設計できる正確な線形化コントローラが得られた。
フィードバック線形化の手法を実証するために、まず、正確な構造が分かっているが初期制御器から異なるシミュレーションモデルを学習し、エラーを発生させる。
さらに,カーレースのダイナミックスをモデル化するためのジム環境として,さらに多くのエラーを発生させるシステムに本手法を適用することを提案する。
そこで我々は、線形化制御器の出力をレース環境に必要な入力に変換するために教師付き学習を用いてトレーニングされたニューラルネットワークであるフィードバック線形化法の拡張を提案する。
これらの目標に向けた我々の進歩を報告し、その達成の次のステップについて論じる。
関連論文リスト
- Partial End-to-end Reinforcement Learning for Robustness Against Modelling Error in Autonomous Racing [0.0]
本稿では、自動運転車における強化学習(RL)ソリューションの性能向上の問題に対処する。
計画タスクと制御タスクを分離する部分的なエンドツーエンドアルゴリズムを提案する。
従来の制御器のロバスト性を活用することにより,本アルゴリズムは標準のエンドツーエンドアルゴリズムよりもモデルミスマッチに対するロバスト性を向上する。
論文 参考訳(メタデータ) (2023-12-11T14:27:10Z) - Computationally Efficient Data-Driven Discovery and Linear
Representation of Nonlinear Systems For Control [0.0]
この研究は、制御のための非線形システムのシステム同定と線形化のためのクープマン作用素理論を用いたデータ駆動型フレームワークの開発に焦点をあてる。
提案手法は, オートエンコーダのベースラインよりも効率よく, 精度が高いことを示す。
論文 参考訳(メタデータ) (2023-09-08T02:19:14Z) - FastRLAP: A System for Learning High-Speed Driving via Deep RL and
Autonomous Practicing [71.76084256567599]
本稿では、自律型小型RCカーを強化学習(RL)を用いた視覚的観察から積極的に駆動するシステムを提案する。
我々のシステムであるFastRLAP (faster lap)は、人間の介入なしに、シミュレーションや専門家によるデモンストレーションを必要とせず、現実世界で自律的に訓練する。
結果として得られたポリシーは、タイミングブレーキや回転の加速度などの突発的な運転スキルを示し、ロボットの動きを妨げる領域を避け、トレーニングの途中で同様の1対1のインタフェースを使用して人間のドライバーのパフォーマンスにアプローチする。
論文 参考訳(メタデータ) (2023-04-19T17:33:47Z) - Real-to-Sim: Predicting Residual Errors of Robotic Systems with Sparse
Data using a Learning-based Unscented Kalman Filter [65.93205328894608]
我々は,動的・シミュレータモデルと実ロボット間の残差を学習する。
学習した残差誤差により、動的モデル、シミュレーション、および実際のハードウェア間の現実的ギャップをさらに埋めることができることを示す。
論文 参考訳(メタデータ) (2022-09-07T15:15:12Z) - Tackling Real-World Autonomous Driving using Deep Reinforcement Learning [63.3756530844707]
本研究では,加速と操舵角度を予測するニューラルネットワークを学習するモデルレスディープ強化学習プランナを提案する。
実際の自動運転車にシステムをデプロイするために、我々は小さなニューラルネットワークで表されるモジュールも開発する。
論文 参考訳(メタデータ) (2022-07-05T16:33:20Z) - Control-oriented meta-learning [25.316358215670274]
我々は、ニューラルネットワークを用いたデータ駆動モデリングを用いて、過去のデータからオフラインで学習し、非線形特徴の内部パラメトリックモデルによる適応制御を行う。
ベースラーナーとして閉ループ追従シミュレーションを用いた適応制御器をメタ学習し,メタ対象として平均追従誤差を推定する。
論文 参考訳(メタデータ) (2022-04-14T03:02:27Z) - Recursive Least-Squares Estimator-Aided Online Learning for Visual
Tracking [58.14267480293575]
オフライン学習を必要とせず、簡単な効果的なオンライン学習手法を提案する。
これは、モデルが以前見たオブジェクトに関する知識を記憶するための、内蔵されたメモリ保持メカニズムを可能にする。
我々は、RT-MDNetにおける多層パーセプトロンと、DiMPにおける畳み込みニューラルネットワークの追跡のためのオンライン学習ファミリーにおける2つのネットワークに基づくアプローチを評価する。
論文 参考訳(メタデータ) (2021-12-28T06:51:18Z) - Adaptive-Control-Oriented Meta-Learning for Nonlinear Systems [29.579737941918022]
我々は過去のデータからオフラインで学習し、非線形特徴の内部パラメトリックモデルによる適応制御を行う。
ベースランナーとして閉ループ追跡シミュレーション、メタオブジェクトとして平均トラッキングエラーで適応コントローラをメタ学習します。
非線形平面ロータークラフトを用いて,適応型コントローラが回帰型メタラーニングで学習した他のコントローラよりも優れていることを実証する。
論文 参考訳(メタデータ) (2021-03-07T23:49:59Z) - Logarithmic Regret Bound in Partially Observable Linear Dynamical
Systems [91.43582419264763]
部分的に観測可能な線形力学系におけるシステム同定と適応制御の問題について検討する。
開ループ系と閉ループ系の両方において有限時間保証付きの最初のモデル推定法を提案する。
AdaptOnは、未知の部分観測可能な線形力学系の適応制御において、$textpolylogleft(Tright)$ regretを達成する最初のアルゴリズムであることを示す。
論文 参考訳(メタデータ) (2020-03-25T06:00:33Z) - Closed-loop deep learning: generating forward models with
back-propagation [0.0]
反射は単純なクローズドループ制御アプローチであり、エラーを最小化しようとするが、反応が遅すぎるため失敗する。
適応アルゴリズムは、この誤差を利用して予測的手がかりの助けを借りて前方モデルを学ぶことができる。
ディープラーニングをクローズドループシステムに組み込んで,その連続処理を保存することで,これを直接実現できることを示す。
論文 参考訳(メタデータ) (2020-01-09T13:36:57Z) - Information Theoretic Model Predictive Q-Learning [64.74041985237105]
本稿では,情報理論的MPCとエントロピー正規化RLとの新たな理論的関連性を示す。
バイアスモデルを利用したQ-ラーニングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2019-12-31T00:29:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。