論文の概要: How to ensure a safe control strategy? Towards a SRL for urban transit
autonomous operation
- arxiv url: http://arxiv.org/abs/2311.14457v1
- Date: Fri, 24 Nov 2023 13:11:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-27 15:13:03.537958
- Title: How to ensure a safe control strategy? Towards a SRL for urban transit
autonomous operation
- Title(参考訳): 安全なコントロール戦略を確保するには?
都市交通自律運転のためのSRLを目指して
- Authors: Zicong Zhao
- Abstract要約: 本稿では,都市交通自律運転列車の安全インテリジェント制御のためのSSA-DRLフレームワークを提案する。
提案手法は,線形時間論理,強化学習,モンテカルロ木探索と組み合わせる。
フレームワークの出力は速度制約を満たし、スケジュール制約を満たし、操作プロセスを最適化することができる。
- 参考スコア(独自算出の注目度): 1.223779595809275
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep reinforcement learning has gradually shown its latent decision-making
ability in urban rail transit autonomous operation. However, since
reinforcement learning can not neither guarantee safety during learning nor
execution, this is still one of the major obstacles to the practical
application of reinforcement learning. Given this drawback, reinforcement
learning applied in the safety-critical autonomous operation domain remains
challenging without generating a safe control command sequence that avoids
overspeed operations. Therefore, a SSA-DRL framework is proposed in this paper
for safe intelligent control of urban rail transit autonomous operation trains.
The proposed framework is combined with linear temporal logic, reinforcement
learning and Monte Carlo tree search and consists of four mainly module: a
post-posed shielding, a searching tree module, a DRL framework and an
additional actor. Furthermore, the output of the framework can meet speed
constraint, schedule constraint and optimize the operation process. Finally,
the proposed SSA-DRL framework for decision-making in urban rail transit
autonomous operation is evaluated in sixteen different sections, and its
effectiveness is demonstrated through an ablation experiment and comparison
with the scheduled operation plan.
- Abstract(参考訳): 深層強化学習は、都市交通自律運転における決定能力の遅さを徐々に示してきた。
しかし、強化学習は学習や実行時の安全性を保証できないため、強化学習の実践的応用における大きな障害の1つである。
この欠点を考えると、安全クリティカルな自律操作領域に適用された強化学習は、過速操作を回避する安全な制御命令列を生成することなく困難である。
そこで本稿では,都市交通自律運転列車の安全インテリジェント制御のためのSSA-DRLフレームワークを提案する。
提案するフレームワークは,線形時間論理,強化学習,モンテカルロ木探索と組み合わせて,ポストプロットシールド,探索木モジュール,DRLフレームワーク,アクターの4つのモジュールで構成される。
さらに、フレームワークの出力は速度制約を満たし、スケジュール制約を満たし、操作プロセスを最適化することができる。
最後に、都市交通自律運転における意思決定のためのSSA-DRLフレームワークを16の異なる区間で評価し、その効果をアブレーション実験および予定運転計画との比較により示す。
関連論文リスト
- Towards Interactive and Learnable Cooperative Driving Automation: a Large Language Model-Driven Decision-Making Framework [79.088116316919]
コネクテッド・オートモービルズ(CAV)は世界中の道路試験を開始したが、複雑なシナリオにおける安全性と効率性はまだ十分ではない。
本稿では,対話型かつ学習可能なLLM駆動協調運転フレームワークCoDrivingLLMを提案する。
論文 参考訳(メタデータ) (2024-09-19T14:36:00Z) - RACER: Epistemic Risk-Sensitive RL Enables Fast Driving with Fewer Crashes [57.319845580050924]
本稿では,リスク感応制御と適応行動空間のカリキュラムを組み合わせた強化学習フレームワークを提案する。
提案アルゴリズムは,現実世界のオフロード運転タスクに対して,高速なポリシーを学習可能であることを示す。
論文 参考訳(メタデータ) (2024-05-07T23:32:36Z) - Long and Short-Term Constraints Driven Safe Reinforcement Learning for Autonomous Driving [11.072917563013428]
強化学習 (Reinforcement Learning, RL) は意思決定や制御作業に広く用いられているが, 訓練プロセスにおけるエージェントのリスクは非常に高い。
本稿では,安全RLのための長短制約(LSTC)に基づく新しいアルゴリズムを提案する。
提案手法は, 連続状態および動作タスクにおいて高い安全性を達成し, 長距離意思決定タスクにおいて高い探索性能を示す。
論文 参考訳(メタデータ) (2024-03-27T02:41:52Z) - Empowering Autonomous Driving with Large Language Models: A Safety Perspective [82.90376711290808]
本稿では,Large Language Models (LLM) の自律運転システムへの統合について検討する。
LLMは行動計画におけるインテリジェントな意思決定者であり、文脈的安全学習のための安全検証シールドを備えている。
適応型LLM条件モデル予測制御(MPC)と状態機械を用いたLLM対応対話型行動計画スキームという,シミュレーション環境における2つの重要な研究について述べる。
論文 参考訳(メタデータ) (2023-11-28T03:13:09Z) - Safety Correction from Baseline: Towards the Risk-aware Policy in
Robotics via Dual-agent Reinforcement Learning [64.11013095004786]
本稿では,ベースラインと安全エージェントからなる二重エージェント型安全強化学習戦略を提案する。
このような分離されたフレームワークは、RLベースの制御に対して高い柔軟性、データ効率、リスク認識を可能にする。
提案手法は,難易度の高いロボットの移動・操作作業において,最先端の安全RLアルゴリズムより優れる。
論文 参考訳(メタデータ) (2022-12-14T03:11:25Z) - Evaluating Model-free Reinforcement Learning toward Safety-critical
Tasks [70.76757529955577]
本稿では、国家安全RLの観点から、この領域における先行研究を再考する。
安全最適化と安全予測を組み合わせた共同手法であるUnrolling Safety Layer (USL)を提案する。
この領域のさらなる研究を容易にするため、我々は関連するアルゴリズムを統一パイプラインで再現し、SafeRL-Kitに組み込む。
論文 参考訳(メタデータ) (2022-12-12T06:30:17Z) - Differentiable Control Barrier Functions for Vision-based End-to-End
Autonomous Driving [100.57791628642624]
本稿では,視覚に基づくエンドツーエンド自動運転のための安全保証学習フレームワークを提案する。
我々は、勾配降下によりエンドツーエンドに訓練された微分制御バリア関数(dCBF)を備えた学習システムを設計する。
論文 参考訳(メタデータ) (2022-03-04T16:14:33Z) - Safe Model-Based Reinforcement Learning Using Robust Control Barrier
Functions [43.713259595810854]
安全に対処する一般的なアプローチとして、安全層が追加され、RLアクションを安全な一連のアクションに投影する。
本稿では,モデルベースRLフレームワークにおけるロバスト制御バリア機能層としての安全性について述べる。
論文 参考訳(メタデータ) (2021-10-11T17:00:45Z) - Safe Reinforcement Learning Using Robust Action Governor [6.833157102376731]
Reinforcement Learning(RL)は、基本的に試行錯誤学習の手順であり、探索と探索プロセス中に安全でない行動を引き起こす可能性があります。
本論文では, RLアルゴリズムとアドオン安全監視モジュールの統合に基づく安全RLの枠組みについて紹介する。
自動車用アダプティブクルーズ制御への適用を通じて,提案された安全RLフレームワークを例示する。
論文 参考訳(メタデータ) (2021-02-21T16:50:17Z) - Behavior Planning at Urban Intersections through Hierarchical
Reinforcement Learning [25.50973559614565]
本研究では,都市環境の階層構造を用いた自律走行計画を行うことができる強化学習(RL)に基づく行動計画構造を提案する。
我々のアルゴリズムは、車線封鎖やエゴ車前方の遅延による交差点に近づく際に、車線変更の可能な方向から左に曲がるタイミングや、車線変更の可能性など、規則に基づく決定方法よりも優れている。
また,提案手法は従来のRL法よりも高速に最適方針に収束することを示した。
論文 参考訳(メタデータ) (2020-11-09T19:23:26Z) - Decision-making at Unsignalized Intersection for Autonomous Vehicles:
Left-turn Maneuver with Deep Reinforcement Learning [17.715274169051494]
本研究は、自動運転車の信号なし交差点における深層強化学習に基づく左旋回意思決定フレームワークを提案する。
提案した意思決定戦略は、衝突率を効果的に低減し、輸送効率を向上させることができる。
この研究は、構築された左旋回制御構造がリアルタイムに適用可能な大きな可能性を持っていることも明らかにした。
論文 参考訳(メタデータ) (2020-08-14T22:44:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。