論文の概要: Safe Learning Reference Governor for Constrained Systems with
Application to Fuel Truck Rollover Avoidance
- arxiv url: http://arxiv.org/abs/2101.09298v1
- Date: Fri, 22 Jan 2021 19:13:11 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-20 17:12:07.542433
- Title: Safe Learning Reference Governor for Constrained Systems with
Application to Fuel Truck Rollover Avoidance
- Title(参考訳): 燃料トラックの転がり回避を目的とした拘束システムの安全学習基準管理
- Authors: Kaiwen Liu, Nan Li, Ilya Kolmanovsky, Denise Rizzo, and Anouck Girard
- Abstract要約: 本稿では,正確なモデルが利用できないシステムにおける状態制約と制御制約を強制する学習基準ガバナー(LRG)手法を提案する。
提案したLRGは,様々な運転条件下でのロールオーバー事故から燃料トラックを効果的に保護できることを示す。
- 参考スコア(独自算出の注目度): 2.6856763450986336
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper proposes a learning reference governor (LRG) approach to enforce
state and control constraints in systems for which an accurate model is
unavailable; and this approach enables the reference governor to gradually
improve command tracking performance through learning while enforcing the
constraints during learning and after learning is completed. The learning can
be performed either on a black-box type model of the system or directly on the
hardware. After introducing the LRG algorithm and outlining its theoretical
properties, this paper investigates LRG application to fuel truck rollover
avoidance. Through simulations based on a fuel truck model that accounts for
liquid fuel sloshing effects, we show that the proposed LRG can effectively
protect fuel trucks from rollover accidents under various operating conditions.
- Abstract(参考訳): 本稿では、正確なモデルが利用できないシステムにおいて、状態と制御の制約を強制するための学習基準ガバナ(lrg)アプローチを提案し、学習中と学習終了後の制約を強制しながら、学習を通じて徐々にコマンド追跡性能を向上させる手法を提案する。
学習はシステムのブラックボックス型モデルまたはハードウェア上で直接行うことができる。
本稿では,LRGアルゴリズムを導入し,その理論的特性を概説した後,燃料トラックのロールオーバー回避へのLRGの適用について検討する。
液体燃料スロッシング効果を考慮した燃料トラックモデルに基づくシミュレーションにより,提案するlrgは,様々な運転条件下での燃料トラックのロールオーバー事故から効果的に保護できることを示す。
関連論文リスト
- Tuning Path Tracking Controllers for Autonomous Cars Using Reinforcement
Learning [0.0]
本稿では,自動運転車のための強化学習(Reinforcement Learning, RL)に基づく適応経路追跡制御システムを提案する。
トラッカーのチューニングは、学習されたQラーニングアルゴリズムを用いて、横方向および操舵軌道誤差を最小化する。
論文 参考訳(メタデータ) (2023-01-09T14:17:12Z) - Robust Action Governor for Uncertain Piecewise Affine Systems with
Non-convex Constraints and Safe Reinforcement Learning [5.7406123763046955]
Action Governorは、制御アクションを監視し、調整し、ポイントインタイムの状態と制約として表現された安全仕様を強制する名目制御ループへのアドオンスキームである。
非時間付加的不確実性として表現できるシステムのロバスト行動知事(RAG)を紹介する。
この開発により、環境の安全なリアルタイム進化と、システムパラメータの変化への適応が可能になる。
論文 参考訳(メタデータ) (2022-07-17T17:31:07Z) - Tackling Real-World Autonomous Driving using Deep Reinforcement Learning [63.3756530844707]
本研究では,加速と操舵角度を予測するニューラルネットワークを学習するモデルレスディープ強化学習プランナを提案する。
実際の自動運転車にシステムをデプロイするために、我々は小さなニューラルネットワークで表されるモジュールも開発する。
論文 参考訳(メタデータ) (2022-07-05T16:33:20Z) - Deep Reinforcement Learning Aided Platoon Control Relying on V2X
Information [78.18186960475974]
車両間通信(V2X)が小隊制御性能に及ぼす影響について検討した。
我々の目的は、最も適切な状態空間を構築するために、車両間で共有されるべき特定の情報の集合を見つけることである。
状態空間に含めると、より高い状態次元を持つ負の効果を相殺する確率が高いため、より有益な情報が伝達においてより高い優先度で与えられる。
論文 参考訳(メタデータ) (2022-03-28T02:11:54Z) - Comparative analysis of machine learning methods for active flow control [60.53767050487434]
遺伝的プログラミング(GP)と強化学習(RL)はフロー制御において人気を集めている。
この研究は2つの比較分析を行い、地球規模の最適化手法に対して最も代表的なアルゴリズムのいくつかをベンチマークする。
論文 参考訳(メタデータ) (2022-02-23T18:11:19Z) - Learning Robust Output Control Barrier Functions from Safe Expert Demonstrations [50.37808220291108]
本稿では,専門家によるデモンストレーションの部分的な観察から,安全な出力フィードバック制御法を考察する。
まず,安全性を保証する手段として,ロバスト出力制御バリア関数(ROCBF)を提案する。
次に、安全なシステム動作を示す専門家による実証からROCBFを学習するための最適化問題を定式化する。
論文 参考訳(メタデータ) (2021-11-18T23:21:00Z) - Trajectory Planning for Autonomous Vehicles Using Hierarchical
Reinforcement Learning [21.500697097095408]
不確実かつ動的条件下で安全な軌道を計画することは、自律運転問題を著しく複雑にする。
RRT(Rapidly Exploring Random Trees)のような現在のサンプリングベース手法は、高い計算コストのため、この問題には理想的ではない。
軌道計画のための階層型強化学習構造とPID(Proportional-Integral-Derivative)コントローラを提案する。
論文 参考訳(メタデータ) (2020-11-09T20:49:54Z) - Reinforcement Learning for Low-Thrust Trajectory Design of
Interplanetary Missions [77.34726150561087]
本稿では, 惑星間軌道のロバスト設計における強化学習の適用について検討する。
最先端アルゴリズムのオープンソース実装が採用されている。
その結果得られた誘導制御ネットワークは、堅牢な名目的軌道と関連する閉ループ誘導法の両方を提供する。
論文 参考訳(メタデータ) (2020-08-19T15:22:15Z) - A Reinforcement Learning Approach for Transient Control of Liquid Rocket
Engines [0.0]
本研究では, ガス発生器エンジンの連続起動位相の最適制御のための深部強化学習手法について検討する。
学習したポリシは,異なる定常動作点に到達し,システムパラメータの変化に説得力を持って適応できることが示されている。
論文 参考訳(メタデータ) (2020-06-19T12:50:18Z) - End-to-End Vision-Based Adaptive Cruise Control (ACC) Using Deep
Reinforcement Learning [12.100265694989627]
本稿では,Double Deep Q-networksという深層強化学習手法を提案し,エンドツーエンドの視覚ベースの適応クルーズ制御(ACC)システムを設計した。
強化学習モデルでは, 後続距離とスロットル/ブレーキ力に付随するよく設計された報酬関数が実装された。
提案システムは, 先行車両の異なる速度軌跡に適応し, リアルタイムに動作可能である。
論文 参考訳(メタデータ) (2020-01-24T20:02:50Z) - Certified Reinforcement Learning with Logic Guidance [78.2286146954051]
線形時間論理(LTL)を用いて未知の連続状態/動作マルコフ決定過程(MDP)のゴールを定式化できるモデルフリーなRLアルゴリズムを提案する。
このアルゴリズムは、トレースが仕様を最大確率で満たす制御ポリシーを合成することが保証される。
論文 参考訳(メタデータ) (2019-02-02T20:09:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。