Fugu-MT 論文翻訳(概要): Safe and Psychologically Pleasant Traffic Signal Control with Reinforcement Learning using Action Masking

論文の概要: Safe and Psychologically Pleasant Traffic Signal Control with Reinforcement Learning using Action Masking

arxiv url: http://arxiv.org/abs/2206.10122v1
Date: Tue, 21 Jun 2022 05:53:23 GMT
ステータス: 翻訳完了
システム内更新日: 2022-06-22 18:19:14.918072
Title: Safe and Psychologically Pleasant Traffic Signal Control with Reinforcement Learning using Action Masking
Title（参考訳）: 行動マスキングを用いた強化学習による安全・心理的な交通信号制御
Authors: Arthur M\"uller, Matthia Sabatelli
Abstract要約: 本稿では,設計上安全な行動空間を用いて,現実世界の交差点における安全性を確保する手法を提案する。現実のデプロイメントにおけるもうひとつの課題は,道路ユーザのストレスを回避するためのコントロール行動を保証することだ。
参考スコア（独自算出の注目度）: 0.7614628596146599
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Reinforcement learning (RL) for traffic signal control (TSC) has shown better performance in simulation for controlling the traffic flow of intersections than conventional approaches. However, due to several challenges, no RL-based TSC has been deployed in the field yet. One major challenge for real-world deployment is to ensure that all safety requirements are met at all times during operation. We present an approach to ensure safety in a real-world intersection by using an action space that is safe by design. The action space encompasses traffic phases, which represent the combination of non-conflicting signal colors of the intersection. Additionally, an action masking mechanism makes sure that only appropriate phase transitions are carried out. Another challenge for real-world deployment is to ensure a control behavior that avoids stress for road users. We demonstrate how to achieve this by incorporating domain knowledge through extending the action masking mechanism. We test and verify our approach in a realistic simulation scenario. By ensuring safety and psychologically pleasant control behavior, our approach drives development towards real-world deployment of RL for TSC.
Abstract（参考訳）: トラヒック信号制御(tsc)のための強化学習(rl)は,従来の手法よりも交差点のトラヒックフローを制御するシミュレーションの性能が向上している。しかし、いくつかの課題により、RTLベースのTSCがまだ現場に配備されていない。実際のデプロイメントにおける大きな課題のひとつは、すべての安全要件が運用中は常に満たされることを保証することです。本稿では,設計上安全な動作空間を用いて,実世界の交差点における安全を確保する手法を提案する。動作空間は、交差点の衝突しない信号色の組み合わせを表すトラヒックフェーズを含んでいる。さらに、アクションマスキング機構は、適切な位相遷移のみが行われることを保証する。現実のデプロイメントにおけるもうひとつの課題は,道路ユーザのストレスを回避するコントロール行動を保証することだ。我々は、アクションマスキング機構を拡張してドメイン知識を組み込むことで、これを実現する方法を実証する。私たちは現実的なシミュレーションシナリオでアプローチをテストし検証します。安全性と心理的に快適な制御行動を確保することにより,本手法はRTL for TSCの現実的な展開に向けた開発を促進する。

関連論文リスト

Designing Control Barrier Function via Probabilistic Enumeration for Safe Reinforcement Learning Navigation [55.02966123945644]
本稿では,ニューラルネットワーク検証技術を利用して制御障壁関数(CBF)とポリシー修正機構の設計を行う階層型制御フレームワークを提案する。提案手法は,安全なCBFベースの制御層を構築するために使用される,安全でない操作領域を特定するための確率的列挙に依存する。これらの実験は、効率的なナビゲーション動作を維持しながら、安全でない動作を補正する提案手法の能力を実証するものである。
論文参考訳（メタデータ） (2025-04-30T13:47:25Z)
Dynamic High-Order Control Barrier Functions with Diffuser for Safety-Critical Trajectory Planning at Signal-Free Intersections [9.041849642602626]
信号のない交差点を通る安全かつ効率的な軌道を計画することは、自動運転車にとって重要な課題である。本研究では,動的高次制御バリア関数(DHOCBF)と拡散モデル(DSC-Diffuser)を統合する安全クリティカルプランニング手法を提案する。動的環境における運転安全をより確実にするために,提案したDHOCBFフレームワークは周囲の車両の動きを考慮した動的調整を行う。
論文参考訳（メタデータ） (2024-11-29T11:57:00Z)
SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文参考訳（メタデータ） (2023-12-31T04:14:43Z)
CAT: Closed-loop Adversarial Training for Safe End-to-End Driving [54.60865656161679]
Adversarial Training (CAT) は、自動運転車における安全なエンドツーエンド運転のためのフレームワークである。 Catは、安全クリティカルなシナリオでエージェントを訓練することで、運転エージェントの安全性を継続的に改善することを目的としている。猫は、訓練中のエージェントに対抗する敵シナリオを効果的に生成できる。
論文参考訳（メタデータ） (2023-10-19T02:49:31Z)
DenseLight: Efficient Control for Large-scale Traffic Signals with Dense Feedback [109.84667902348498]
交通信号制御(TSC)は、道路網における車両の平均走行時間を短縮することを目的としている。従来のTSC手法は、深い強化学習を利用して制御ポリシーを探索する。 DenseLightは、不偏報酬関数を用いてポリシーの有効性をフィードバックする新しいRTLベースのTSC手法である。
論文参考訳（メタデータ） (2023-06-13T05:58:57Z)
Reinforcement Learning Approaches for Traffic Signal Control under Missing Data [5.896742981602458]
現実世界の都市では、センサーの欠如により交通状態の観察が欠如することがある。本稿では, 適応制御を実現するために, トラフィック状態をインプットし, 適応制御とRLエージェントの訓練を可能にするために, 状態と報酬の両方をインプットする2つの方法を提案する。
論文参考訳（メタデータ） (2023-04-21T03:26:33Z)
SafeLight: A Reinforcement Learning Method toward Collision-free Traffic Signal Control [5.862792724739738]
アメリカの道路事故の4分の1は、信号のタイミングの問題により交差点で発生している。安全強化強化学習法(SafeLight)を提案する。本手法は交通の移動性を高めながら衝突を著しく低減することができる。
論文参考訳（メタデータ） (2022-11-20T05:09:12Z)
Differentiable Control Barrier Functions for Vision-based End-to-End Autonomous Driving [100.57791628642624]
本稿では,視覚に基づくエンドツーエンド自動運転のための安全保証学習フレームワークを提案する。我々は、勾配降下によりエンドツーエンドに訓練された微分制御バリア関数(dCBF)を備えた学習システムを設計する。
論文参考訳（メタデータ） (2022-03-04T16:14:33Z)
Integrated Decision and Control at Multi-Lane Intersections with Mixed Traffic Flow [6.233422723925688]
本稿では,混在交通流を伴う複雑な交差点を扱うための学習に基づくアルゴリズムを提案する。まず、学習過程における緑と赤の異なる速度モデルについて検討し、有限状態マシンを用いて異なるモードの光変換を扱う。次に, 車両, 信号機, 歩行者, 自転車にそれぞれ異なる種類の距離制約を設計し, 制約された最適制御問題をフォーミュレートする。
論文参考訳（メタデータ） (2021-08-30T07:55:32Z)
End-to-End Intersection Handling using Multi-Agent Deep Reinforcement Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文参考訳（メタデータ） (2021-04-28T07:54:40Z)
MetaVIM: Meta Variationally Intrinsic Motivated Reinforcement Learning for Decentralized Traffic Signal Control [54.162449208797334]
交通信号制御は、交差点を横断する交通信号を調整し、地域や都市の交通効率を向上させることを目的としている。近年,交通信号制御に深部強化学習(RL)を適用し,各信号がエージェントとみなされる有望な性能を示した。本稿では,近隣情報を考慮した各交差点の分散化政策を潜時的に学習するメタ変動固有モチベーション(MetaVIM)RL法を提案する。
論文参考訳（メタデータ） (2021-01-04T03:06:08Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。