Fugu-MT 論文翻訳(概要): SafeLight: A Reinforcement Learning Method toward Collision-free Traffic Signal Control

論文の概要: SafeLight: A Reinforcement Learning Method toward Collision-free Traffic Signal Control

arxiv url: http://arxiv.org/abs/2211.10871v1
Date: Sun, 20 Nov 2022 05:09:12 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-22 18:19:20.158200
Title: SafeLight: A Reinforcement Learning Method toward Collision-free Traffic Signal Control
Title（参考訳）: SafeLight: 衝突のない交通信号制御のための強化学習手法
Authors: Wenlu Du, Junyi Ye, Jingyi Gu, Jing Li, Hua Wei, Guiling Wang
Abstract要約: アメリカの道路事故の4分の1は、信号のタイミングの問題により交差点で発生している。安全強化強化学習法(SafeLight)を提案する。本手法は交通の移動性を高めながら衝突を著しく低減することができる。
参考スコア（独自算出の注目度）: 5.862792724739738
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Traffic signal control is safety-critical for our daily life. Roughly one-quarter of road accidents in the U.S. happen at intersections due to problematic signal timing, urging the development of safety-oriented intersection control. However, existing studies on adaptive traffic signal control using reinforcement learning technologies have focused mainly on minimizing traffic delay but neglecting the potential exposure to unsafe conditions. We, for the first time, incorporate road safety standards as enforcement to ensure the safety of existing reinforcement learning methods, aiming toward operating intersections with zero collisions. We have proposed a safety-enhanced residual reinforcement learning method (SafeLight) and employed multiple optimization techniques, such as multi-objective loss function and reward shaping for better knowledge integration. Extensive experiments are conducted using both synthetic and real-world benchmark datasets. Results show that our method can significantly reduce collisions while increasing traffic mobility.
Abstract（参考訳）: 交通信号制御は日常生活にとって安全性に欠かせない。アメリカの道路事故の約4分の1は、信号のタイミングの問題により交差点で発生し、安全指向の交差点制御の開発を促している。しかし、強化学習技術を用いた適応的な交通信号制御に関する研究は、交通遅延の最小化に重点を置いている。我々は,道路安全基準を施行し,既存の強化学習手法の安全性を確保し,ゼロ衝突による交差点の運用を目指す。安全強化強化学習法(safelight)を提案し,多目的損失関数や報奨シェーピングといった複数の最適化手法を用いて知識統合の改善を行った。総合的な実験は、合成および実世界のベンチマークデータセットを用いて行われる。その結果,交通の移動性を高めながら衝突を著しく低減できることがわかった。

関連論文リスト

Advanced Longitudinal Control and Collision Avoidance for High-Risk Edge Cases in Autonomous Driving [0.0]
本稿では,緊急制動と適応巡航を統合した新しい長手方向制御・衝突回避アルゴリズムを提案する。シミュレーションされた高リスクシナリオでは、重任務車両を含む状況においても、このアルゴリズムは衝突を効果的に防止する。 3台の車両が減速する典型的な高速道路のシナリオでは、提案されたDRLアプローチは、標準の連邦高速道路管理局の速度概念をはるかに上回る99%の成功率を達成する。
論文参考訳（メタデータ） (2025-04-26T14:17:06Z)
A Conflicts-free, Speed-lossless KAN-based Reinforcement Learning Decision System for Interactive Driving in Roundabouts [17.434924472015812]
本稿では,ラウンドアバウンドにおける安全かつ効率的な運転行動を促進するための学習アルゴリズムを提案する。提案アルゴリズムは、複雑なマルチサイクルラウンドアバウトにおける安全かつ効率的な運転戦略を学習するために、深層Q-ラーニングネットワークを用いる。その結果,本システムは安定したトレーニングプロセスを維持しつつ,安全かつ効率的な運転を実現することができた。
論文参考訳（メタデータ） (2024-08-15T16:10:25Z)
Exploring the impact of traffic signal control and connected and automated vehicles on intersections safety: A deep reinforcement learning approach [2.681732331705502]
この研究は、DQN(Deep Q Network)を用いて、CAVとHuman Drive Vehicles(HDV)の交通信号と運転行動を制御する。これらの結果から,CAVとDQNを併用した交通信号制御による後方・横断競合の大幅な低減が示された。
論文参考訳（メタデータ） (2024-05-29T16:17:19Z)
RACER: Epistemic Risk-Sensitive RL Enables Fast Driving with Fewer Crashes [57.319845580050924]
本稿では,リスク感応制御と適応行動空間のカリキュラムを組み合わせた強化学習フレームワークを提案する。提案アルゴリズムは,現実世界のオフロード運転タスクに対して,高速なポリシーを学習可能であることを示す。
論文参考訳（メタデータ） (2024-05-07T23:32:36Z)
CAT: Closed-loop Adversarial Training for Safe End-to-End Driving [54.60865656161679]
Adversarial Training (CAT) は、自動運転車における安全なエンドツーエンド運転のためのフレームワークである。 Catは、安全クリティカルなシナリオでエージェントを訓練することで、運転エージェントの安全性を継続的に改善することを目的としている。猫は、訓練中のエージェントに対抗する敵シナリオを効果的に生成できる。
論文参考訳（メタデータ） (2023-10-19T02:49:31Z)
Evaluation of Safety Constraints in Autonomous Navigation with Deep Reinforcement Learning [62.997667081978825]
学習可能なナビゲーションポリシとして,セーフとアンセーフの2つを比較します。安全なポリシは、制約をアカウントに含めますが、もう一方はそうではありません。安全政策は、よりクリアランスの高い軌道を生成することができ(障害物によらず)、全体的な性能を犠牲にすることなく、トレーニング中に衝突を減らすことができることを示す。
論文参考訳（メタデータ） (2023-07-27T01:04:57Z)
DenseLight: Efficient Control for Large-scale Traffic Signals with Dense Feedback [109.84667902348498]
交通信号制御(TSC)は、道路網における車両の平均走行時間を短縮することを目的としている。従来のTSC手法は、深い強化学習を利用して制御ポリシーを探索する。 DenseLightは、不偏報酬関数を用いてポリシーの有効性をフィードバックする新しいRTLベースのTSC手法である。
論文参考訳（メタデータ） (2023-06-13T05:58:57Z)
Adaptive Aggregation for Safety-Critical Control [3.1692938090731584]
安全クリティカル制御のためのアダプティブアグリゲーションフレームワークを提案する。我々のアルゴリズムは、いくつかのベースラインと比較してデータ効率が良く、安全性違反が少ない。
論文参考訳（メタデータ） (2023-02-07T16:53:33Z)
Network-level Safety Metrics for Overall Traffic Safety Assessment: A Case Study [7.8191100993403495]
本稿では,道路インフラストラクチャセンサによる画像の処理による交通流の安全性評価のための,ネットワークレベルの新しい安全性指標について述べる。安全性指標とクラッシュデータの統合解析により,代表的なネットワークレベルの安全性指標とクラッシュ頻度との洞察力のある時間的および空間的相関が明らかになった。
論文参考訳（メタデータ） (2022-01-27T19:07:08Z)
Integrated Decision and Control at Multi-Lane Intersections with Mixed Traffic Flow [6.233422723925688]
本稿では,混在交通流を伴う複雑な交差点を扱うための学習に基づくアルゴリズムを提案する。まず、学習過程における緑と赤の異なる速度モデルについて検討し、有限状態マシンを用いて異なるモードの光変換を扱う。次に, 車両, 信号機, 歩行者, 自転車にそれぞれ異なる種類の距離制約を設計し, 制約された最適制御問題をフォーミュレートする。
論文参考訳（メタデータ） (2021-08-30T07:55:32Z)
End-to-End Intersection Handling using Multi-Agent Deep Reinforcement Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文参考訳（メタデータ） (2021-04-28T07:54:40Z)
Learning to be Safe: Deep RL with a Safety Critic [72.00568333130391]
安全なRLへの自然な第一のアプローチは、ポリシーの動作に関する制約を手動で指定することである。我々は,タスクと環境の1つのセットで安全であることを学習し,その学習した直観を用いて将来の行動を制限することを提案する。
論文参考訳（メタデータ） (2020-10-27T20:53:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。