論文の概要: ROSA-RL: Uncertainty-Aware Roundabout Optimized Speed Advisory with Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2606.16558v1
- Date: Mon, 15 Jun 2026 11:00:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:34.4682
- Title: ROSA-RL: Uncertainty-Aware Roundabout Optimized Speed Advisory with Reinforcement Learning
- Title(参考訳): ROSA-RL:強化学習による不確かさを意識したスピードアドバイザリーの最適化
- Authors: Anna-Lena Schlamp, Jeremias Gerner, Klaus Bogenberger, Werner Huber, Stefanie Schmidtner,
- Abstract要約: ROSA-RL -- 強化学習による不確実性を考慮したラウンドアワード最適化スピードアドバイザリーを提案する。
これは、確率的衝突予測を通じて、混合交通における自動および人力車両の安全で効率的なラウンドアバウンドエントリを可能にする。
- 参考スコア(独自算出の注目度): 1.517795490799248
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Roundabouts challenge automated driving in mixed traffic, as heterogeneous and non-deterministic human behavior, unknown driving intentions, and high interaction complexity create uncertainty about whether the conflict zone will be blocked or available at the moment of entry. We present ROSA-RL -- uncertainty-aware Roundabout Optimized Speed Advisory with Reinforcement Learning. It enables safe and efficient roundabout entry for automated and human-driven vehicles in mixed traffic through probabilistic conflict forecasting. A Transformer-based model predicts conflict zone occupancy over a five-second horizon, capturing multi-agent interactions to anticipate upcoming conflicts and available gaps. The prediction outputs encode uncertainty in future motion and intent, and augment the state of a classical RL framework, enabling uncertainty-aware speed coordination. Evaluated in simulations grounded in real-world data, ROSA-RL can effectively handle uncertainty and outperform a comparable model-based baseline, closing the gap to an ideal setting assuming fully known occupancy while improving traffic efficiency and safety. The source code of this work is available under: github.com/urbanAIthi/ROSA-RL.
- Abstract(参考訳): 不均一で非決定論的な人間の振る舞い、未知の運転意図、高い相互作用の複雑さなど、混在する交通における自動運転に挑戦する。
ROSA-RL -- 強化学習による不確実性を考慮したラウンドアワード最適化スピードアドバイザリーを提案する。
これは、確率的衝突予測を通じて、混合交通における自動および人力車両の安全で効率的なラウンドアバウンドエントリを可能にする。
Transformerベースのモデルは、5秒の地平線上でのコンフリクトゾーンの占有を予測し、マルチエージェントインタラクションをキャプチャして、今後のコンフリクトと利用可能なギャップを予測します。
この予測は、将来の動きと意図の不確実性を符号化し、古典的なRLフレームワークの状態を増大させ、不確実性を認識した速度調整を可能にする。
実世界のデータに基づいて評価されたシミュレーションでは、ROSA-RLは不確実性を効果的に処理し、同等のモデルベースのベースラインを上回り、交通効率と安全性を改善しつつ、完全な占有率を前提とした理想的な設定にギャップを閉じることができる。
この作業のソースコードは、github.com/urbanAIthi/ROSA-RLで公開されている。
関連論文リスト
- RiskFlow: Fast and Faithful Safety-Critical Traffic Scenario Generation [17.00557757061364]
RiskFlowはクローズドループ安全クリティカルなマルチエージェントトラフィック生成フレームワークである。
将来の軌道生成を作用空間の輸送として定式化する。
競争力のある安全クリティカルな生成能力を維持しながら、リアリズムを継続的に改善する。
論文 参考訳(メタデータ) (2026-06-04T17:28:42Z) - Bridging Predictive Uncertainty and Safe Action: Sample-Conditioned Differentiable Planning for Autonomous Driving [46.91409391705346]
複雑でダイナミックでインタラクティブな運転環境は、自動運転に重大な課題をもたらす。
現在のシステムにおける基本的なボトルネックは、高度に表現力のある不確実性モデリングと解釈可能な安全な動き計画との切り離しである。
本稿では, このギャップを埋めるために, 拡散生成将来の軌道を最適化プロセスに明示的に組み込む, サンプル条件付き微分可能計画フレームワークを提案する。
論文 参考訳(メタデータ) (2026-06-02T08:10:02Z) - RAD-2: Scaling Reinforcement Learning in a Generator-Discriminator Framework [49.531001563853984]
RAD-2はクローズドループ計画のための統一されたジェネレータ・ディスクリミネーターフレームワークである。
様々な軌道候補を生成する一方、RL最適化判別器は、これらの候補を長期的な運転品質に応じて再現する。
強い拡散ベースのプランナーに比べて衝突速度を56%削減する。
論文 参考訳(メタデータ) (2026-04-16T17:59:44Z) - Biased-Attention Guided Risk Prediction for Safe Decision-Making at Unsignalized Intersections [0.42970700836450487]
本稿では, バイアスアテンション機構と統合された深層強化学習(DRL)意思決定フレームワークを提案する。
このフレームワークはSoft Actor-Critic (SAC)アルゴリズムに基づいている。
提案手法は交差点における交通効率と車両の安全性の両方を効果的に向上させる。
論文 参考訳(メタデータ) (2025-10-14T12:05:51Z) - A Conflicts-free, Speed-lossless KAN-based Reinforcement Learning Decision System for Interactive Driving in Roundabouts [16.714573474722282]
本稿では,様々な交通状況における安全かつ効率的な運転を促進する学習に基づくアルゴリズムを提案する。
KAN(Kolmogorov-Arnold Network)は、AVの環境理解を改善する。
実験結果から,提案システムは最先端の手法よりも一貫して優れていることがわかった。
論文 参考訳(メタデータ) (2024-08-15T16:10:25Z) - Edge-Assisted ML-Aided Uncertainty-Aware Vehicle Collision Avoidance at Urban Intersections [12.812518632907771]
都市横断路におけるプリエンプティブ衝突を検出する新しい枠組みを提案する。
5Gネットワークのマルチアクセスエッジコンピューティングプラットフォームを利用する。
論文 参考訳(メタデータ) (2024-04-22T18:45:40Z) - RACER: Rational Artificial Intelligence Car-following-model Enhanced by Reality [46.909086734963665]
本稿では,アダプティブ・クルーズ・コントロール(ACC)運転行動を予測する,最先端の深層学習車追従モデルであるRACERを紹介する。
従来のモデルとは異なり、RACERは実走行の重要な要素であるRDC(Rational Driving Constraints)を効果的に統合している。
RACERはアクセラレーション、ベロシティ、スペーシングといった主要なメトリクスを網羅し、ゼロ違反を登録する。
論文 参考訳(メタデータ) (2023-12-12T06:21:30Z) - A Multiplicative Value Function for Safe and Efficient Reinforcement
Learning [131.96501469927733]
本稿では,安全評論家と報酬評論家からなる新しい乗法値関数を持つモデルフリーRLアルゴリズムを提案する。
安全評論家は、制約違反の確率を予測し、制限のないリターンのみを見積もる報酬批評家を割引する。
安全制約を付加した古典的RLベンチマークや、画像を用いたロボットナビゲーションタスク、生のライダースキャンを観察する4つの環境において、本手法の評価を行った。
論文 参考訳(メタデータ) (2023-03-07T18:29:15Z) - Reinforcement Learning based Cyberattack Model for Adaptive Traffic
Signal Controller in Connected Transportation Systems [61.39400591328625]
接続輸送システムにおいて、適応交通信号制御装置(ATSC)は、車両から受信したリアルタイム車両軌跡データを利用して、グリーンタイムを規制する。
この無線接続されたATSCはサイバー攻撃面を増やし、その脆弱性を様々なサイバー攻撃モードに拡大する。
そのようなモードの1つは、攻撃者がネットワーク内で偽の車両を作成する「シビル」攻撃である。
RLエージェントは、シビル車噴射の最適速度を学習し、アプローチの混雑を生じさせるように訓練される
論文 参考訳(メタデータ) (2022-10-31T20:12:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。