論文の概要: Uncertainty-Aware Counterfactual Traffic Signal Control with Predictive Safety and Starvation-Avoidance Constraints Using Vision-Based Sensing
- arxiv url: http://arxiv.org/abs/2602.07784v1
- Date: Sun, 08 Feb 2026 02:57:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:24.798653
- Title: Uncertainty-Aware Counterfactual Traffic Signal Control with Predictive Safety and Starvation-Avoidance Constraints Using Vision-Based Sensing
- Title(参考訳): 視覚的センシングを用いた予測安全と飢餓回避制約を考慮した不確実性を考慮した交通信号制御
- Authors: Jayawant Bodagala, Balaji Bodagala,
- Abstract要約: UCATSCは、交差点で信号制御をモデル化するモデルベースの信号制御システムである。
報酬形成を用いて安全性を予測する強化学習法とは異なり、UCATSCは安全性と飢餓防止に関する厳しい制約を予測し、強制する。
このシステムは、安全クリティカルなエラーを防止し、解釈可能な制御ポリシー出力を提供しながら、交通遅延と排出を改善するように設計されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Real-world deployment of adaptive traffic signal control, to date, remains limited due to the uncertainty associated with vision-based perception, implicit safety, and non-interpretable control policies learned and validated mainly in simulation. In this paper, we introduce UCATSC, a model-based traffic signal control system that models traffic signal control at an intersection using a stochastic decision process with constraints and under partial observability, taking into account the uncertainty associated with vision-based perception. Unlike reinforcement learning methods that learn to predict safety using reward shaping, UCATSC predicts and enforces hard constraints related to safety and starvation prevention during counterfactual rollouts in belief space. The system is designed to improve traffic delay and emission while preventing safety-critical errors and providing interpretable control policy outputs based on explicit models.
- Abstract(参考訳): 適応的な信号制御の現実的な展開は、視覚に基づく認識、暗黙の安全性、そして主にシミュレーションで学習、検証された非解釈不能な制御ポリシーに関連する不確実性により、現在もなお制限されている。
本稿では,制約付き確率的決定プロセスと部分可観測性を考慮した交差点における信号制御をモデル化するモデルベース交通信号制御システムUCATSCを紹介する。
報酬形成を用いて安全性を予測する強化学習法とは異なり、UCATSCは信念空間における反現実的なロールアウト時の安全と飢餓防止に関する厳しい制約を予測し、強制する。
このシステムは、安全クリティカルなエラーを防止し、明示的なモデルに基づいて解釈可能な制御ポリシー出力を提供しながら、交通遅延と排出を改善するように設計されている。
関連論文リスト
- Verification of Visual Controllers via Compositional Geometric Transformations [49.81690518952909]
到達可能な集合の外部近似を生成できる知覚ベースのコントローラのための新しい検証フレームワークを提案する。
提案手法の音質を理論的に保証し,ベンチマーク制御環境における有効性を示す。
論文 参考訳(メタデータ) (2025-07-06T20:22:58Z) - Safe Adaptive Cruise Control Under Perception Uncertainty: A Deep Ensemble and Conformal Tube Model Predictive Control Approach [5.740554452832947]
本稿では、不確実性を予測・定量化するために、コンフォーマル予測と統合されたディープニューラルネットワーク回帰器のディープアンサンブルについて考察する。
コンフォーマルチューブモデル予測制御を用いた適応型クルーズ制御装置は、確率論的安全性を確保するために設計されている。
高忠実度シミュレータによる評価は、速度トラッキングと安全な距離維持におけるアルゴリズムの有効性を示す。
論文 参考訳(メタデータ) (2024-12-05T01:01:53Z) - SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - Reinforcement Learning with Model Predictive Control for Highway Ramp Metering [14.389086937116582]
この研究は、交通フロー管理を強化するためのモデルベースと学習ベースの戦略の相乗効果について考察する。
制御問題は、適切なステージコスト関数を作成することにより、RLタスクとして定式化される。
RLアルゴリズムの関数近似として MPC 最適問題を利用する MPC ベースの RL アプローチを提案し,オンランプの効率的な制御について検討した。
論文 参考訳(メタデータ) (2023-11-15T09:50:54Z) - SafeLight: A Reinforcement Learning Method toward Collision-free Traffic
Signal Control [5.862792724739738]
アメリカの道路事故の4分の1は、信号のタイミングの問題により交差点で発生している。
安全強化強化学習法(SafeLight)を提案する。
本手法は交通の移動性を高めながら衝突を著しく低減することができる。
論文 参考訳(メタデータ) (2022-11-20T05:09:12Z) - Recursively Feasible Probabilistic Safe Online Learning with Control Barrier Functions [60.26921219698514]
CBFをベースとした安全クリティカルコントローラのモデル不確実性を考慮した再構成を提案する。
次に、結果の安全制御器のポイントワイズ実現可能性条件を示す。
これらの条件を利用して、イベントトリガーによるオンラインデータ収集戦略を考案する。
論文 参考訳(メタデータ) (2022-08-23T05:02:09Z) - Pointwise Feasibility of Gaussian Process-based Safety-Critical Control
under Model Uncertainty [77.18483084440182]
制御バリア関数(CBF)と制御リアプノフ関数(CLF)は、制御システムの安全性と安定性をそれぞれ強化するための一般的なツールである。
本稿では, CBF と CLF を用いた安全クリティカルコントローラにおいて, モデル不確実性に対処するためのガウスプロセス(GP)に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2021-06-13T23:08:49Z) - Guaranteeing Safety of Learned Perception Modules via Measurement-Robust
Control Barrier Functions [43.4346415363429]
制御理論と機械学習の技術を一体化して、安全を達成するコントローラを合成したいと考えている。
我々は,安全な制御入力を決定するツールとして,計測ロバスト制御バリア関数(MR-CBF)を定義した。
シミュレーションセグウェイシステムにおいて, MR-CBFが測定モデルの不確実性による安全性を実現するための有効性を示す。
論文 参考訳(メタデータ) (2020-10-30T00:19:01Z) - Model-Reference Reinforcement Learning for Collision-Free Tracking
Control of Autonomous Surface Vehicles [1.7033108359337459]
提案する制御アルゴリズムは,従来の制御手法と強化学習を組み合わせることで,制御精度と知性を向上させる。
強化学習により、全体トラッキングコントローラはモデルの不確実性を補償し、衝突回避を実現することができる。
論文 参考訳(メタデータ) (2020-08-17T12:15:15Z) - Reinforcement Learning for Safety-Critical Control under Model
Uncertainty, using Control Lyapunov Functions and Control Barrier Functions [96.63967125746747]
強化学習フレームワークは、CBFおよびCLF制約に存在するモデル不確実性を学ぶ。
RL-CBF-CLF-QPは、安全制約におけるモデル不確実性の問題に対処する。
論文 参考訳(メタデータ) (2020-04-16T10:51:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。