論文の概要: SafeLight: A Reinforcement Learning Method toward Collision-free Traffic
Signal Control
- arxiv url: http://arxiv.org/abs/2211.10871v1
- Date: Sun, 20 Nov 2022 05:09:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-22 18:19:20.158200
- Title: SafeLight: A Reinforcement Learning Method toward Collision-free Traffic
Signal Control
- Title(参考訳): SafeLight: 衝突のない交通信号制御のための強化学習手法
- Authors: Wenlu Du, Junyi Ye, Jingyi Gu, Jing Li, Hua Wei, Guiling Wang
- Abstract要約: アメリカの道路事故の4分の1は、信号のタイミングの問題により交差点で発生している。
安全強化強化学習法(SafeLight)を提案する。
本手法は交通の移動性を高めながら衝突を著しく低減することができる。
- 参考スコア(独自算出の注目度): 5.862792724739738
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Traffic signal control is safety-critical for our daily life. Roughly
one-quarter of road accidents in the U.S. happen at intersections due to
problematic signal timing, urging the development of safety-oriented
intersection control. However, existing studies on adaptive traffic signal
control using reinforcement learning technologies have focused mainly on
minimizing traffic delay but neglecting the potential exposure to unsafe
conditions. We, for the first time, incorporate road safety standards as
enforcement to ensure the safety of existing reinforcement learning methods,
aiming toward operating intersections with zero collisions. We have proposed a
safety-enhanced residual reinforcement learning method (SafeLight) and employed
multiple optimization techniques, such as multi-objective loss function and
reward shaping for better knowledge integration. Extensive experiments are
conducted using both synthetic and real-world benchmark datasets. Results show
that our method can significantly reduce collisions while increasing traffic
mobility.
- Abstract(参考訳): 交通信号制御は日常生活にとって安全性に欠かせない。
アメリカの道路事故の約4分の1は、信号のタイミングの問題により交差点で発生し、安全指向の交差点制御の開発を促している。
しかし、強化学習技術を用いた適応的な交通信号制御に関する研究は、交通遅延の最小化に重点を置いている。
我々は,道路安全基準を施行し,既存の強化学習手法の安全性を確保し,ゼロ衝突による交差点の運用を目指す。
安全強化強化学習法(safelight)を提案し,多目的損失関数や報奨シェーピングといった複数の最適化手法を用いて知識統合の改善を行った。
総合的な実験は、合成および実世界のベンチマークデータセットを用いて行われる。
その結果,交通の移動性を高めながら衝突を著しく低減できることがわかった。
関連論文リスト
- CAT: Closed-loop Adversarial Training for Safe End-to-End Driving [54.60865656161679]
Adversarial Training (CAT) は、自動運転車における安全なエンドツーエンド運転のためのフレームワークである。
Catは、安全クリティカルなシナリオでエージェントを訓練することで、運転エージェントの安全性を継続的に改善することを目的としている。
猫は、訓練中のエージェントに対抗する敵シナリオを効果的に生成できる。
論文 参考訳(メタデータ) (2023-10-19T02:49:31Z) - Evaluation of Safety Constraints in Autonomous Navigation with Deep
Reinforcement Learning [62.997667081978825]
学習可能なナビゲーションポリシとして,セーフとアンセーフの2つを比較します。
安全なポリシは、制約をアカウントに含めますが、もう一方はそうではありません。
安全政策は、よりクリアランスの高い軌道を生成することができ(障害物によらず)、全体的な性能を犠牲にすることなく、トレーニング中に衝突を減らすことができることを示す。
論文 参考訳(メタデータ) (2023-07-27T01:04:57Z) - DenseLight: Efficient Control for Large-scale Traffic Signals with Dense
Feedback [109.84667902348498]
交通信号制御(TSC)は、道路網における車両の平均走行時間を短縮することを目的としている。
従来のTSC手法は、深い強化学習を利用して制御ポリシーを探索する。
DenseLightは、不偏報酬関数を用いてポリシーの有効性をフィードバックする新しいRTLベースのTSC手法である。
論文 参考訳(メタデータ) (2023-06-13T05:58:57Z) - Adaptive Aggregation for Safety-Critical Control [3.1692938090731584]
安全クリティカル制御のためのアダプティブアグリゲーションフレームワークを提案する。
我々のアルゴリズムは、いくつかのベースラインと比較してデータ効率が良く、安全性違反が少ない。
論文 参考訳(メタデータ) (2023-02-07T16:53:33Z) - Evaluating Model-free Reinforcement Learning toward Safety-critical
Tasks [70.76757529955577]
本稿では、国家安全RLの観点から、この領域における先行研究を再考する。
安全最適化と安全予測を組み合わせた共同手法であるUnrolling Safety Layer (USL)を提案する。
この領域のさらなる研究を容易にするため、我々は関連するアルゴリズムを統一パイプラインで再現し、SafeRL-Kitに組み込む。
論文 参考訳(メタデータ) (2022-12-12T06:30:17Z) - Safe and Psychologically Pleasant Traffic Signal Control with
Reinforcement Learning using Action Masking [0.7614628596146599]
本稿では,設計上安全な行動空間を用いて,現実世界の交差点における安全性を確保する手法を提案する。
現実のデプロイメントにおけるもうひとつの課題は,道路ユーザのストレスを回避するためのコントロール行動を保証することだ。
論文 参考訳(メタデータ) (2022-06-21T05:53:23Z) - Network-level Safety Metrics for Overall Traffic Safety Assessment: A
Case Study [7.8191100993403495]
本稿では,道路インフラストラクチャセンサによる画像の処理による交通流の安全性評価のための,ネットワークレベルの新しい安全性指標について述べる。
安全性指標とクラッシュデータの統合解析により,代表的なネットワークレベルの安全性指標とクラッシュ頻度との洞察力のある時間的および空間的相関が明らかになった。
論文 参考訳(メタデータ) (2022-01-27T19:07:08Z) - Integrated Decision and Control at Multi-Lane Intersections with Mixed
Traffic Flow [6.233422723925688]
本稿では,混在交通流を伴う複雑な交差点を扱うための学習に基づくアルゴリズムを提案する。
まず、学習過程における緑と赤の異なる速度モデルについて検討し、有限状態マシンを用いて異なるモードの光変換を扱う。
次に, 車両, 信号機, 歩行者, 自転車にそれぞれ異なる種類の距離制約を設計し, 制約された最適制御問題をフォーミュレートする。
論文 参考訳(メタデータ) (2021-08-30T07:55:32Z) - Learning Interaction-aware Guidance Policies for Motion Planning in
Dense Traffic Scenarios [8.484564880157148]
本稿では,高密度交通シナリオにおける対話型モーションプランニングのための新しい枠組みを提案する。
我々は,他車両の協調性に関する国際的ガイダンスを提供するインタラクション対応政策であるDeep Reinforcement Learning (RL) を通じて学習することを提案する。
学習されたポリシーは、ローカル最適化ベースのプランナーを推論し、対話的な振る舞いで誘導し、他の車両が収まらない場合に安全を維持しながら、密集したトラフィックに積極的にマージする。
論文 参考訳(メタデータ) (2021-07-09T16:43:12Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - Learning to be Safe: Deep RL with a Safety Critic [72.00568333130391]
安全なRLへの自然な第一のアプローチは、ポリシーの動作に関する制約を手動で指定することである。
我々は,タスクと環境の1つのセットで安全であることを学習し,その学習した直観を用いて将来の行動を制限することを提案する。
論文 参考訳(メタデータ) (2020-10-27T20:53:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。