論文の概要: Neurosymbolic Meta-Reinforcement Lookahead Learning Achieves Safe
Self-Driving in Non-Stationary Environments
- arxiv url: http://arxiv.org/abs/2309.02328v1
- Date: Tue, 5 Sep 2023 15:47:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-06 13:52:33.693846
- Title: Neurosymbolic Meta-Reinforcement Lookahead Learning Achieves Safe
Self-Driving in Non-Stationary Environments
- Title(参考訳): 非定常環境下での安全な自動運転を実現するニューロシンボリックメタ強化ルックアヘッド学習
- Authors: Haozhe Lei and Quanyan Zhu
- Abstract要約: 本研究では,emphNeurosymbolic Meta-Reinforcement Lookahead Learning(NUMERLA)に基づくルックアヘッドシンボリック制約を用いたオンラインメタ強化学習アルゴリズムを提案する。
実験により、NUMERLAはリアルタイム適応能力を持つ自動運転エージェントを推定し、非定常都市での人間と車両の相互作用シナリオ下での安全かつ自己適応運転を実現する。
- 参考スコア(独自算出の注目度): 17.39580032857777
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the area of learning-driven artificial intelligence advancement, the
integration of machine learning (ML) into self-driving (SD) technology stands
as an impressive engineering feat. Yet, in real-world applications outside the
confines of controlled laboratory scenarios, the deployment of self-driving
technology assumes a life-critical role, necessitating heightened attention
from researchers towards both safety and efficiency. To illustrate, when a
self-driving model encounters an unfamiliar environment in real-time execution,
the focus must not solely revolve around enhancing its anticipated performance;
equal consideration must be given to ensuring its execution or real-time
adaptation maintains a requisite level of safety. This study introduces an
algorithm for online meta-reinforcement learning, employing lookahead symbolic
constraints based on \emph{Neurosymbolic Meta-Reinforcement Lookahead Learning}
(NUMERLA). NUMERLA proposes a lookahead updating mechanism that harmonizes the
efficiency of online adaptations with the overarching goal of ensuring
long-term safety. Experimental results demonstrate NUMERLA confers the
self-driving agent with the capacity for real-time adaptability, leading to
safe and self-adaptive driving under non-stationary urban human-vehicle
interaction scenarios.
- Abstract(参考訳): 機械学習による人工知能の進歩の分野では、機械学習(ML)と自動運転(SD)技術の統合は素晴らしいエンジニアリングの偉業である。
しかし、制御された実験室のシナリオの範囲外の現実世界のアプリケーションでは、自動運転技術の展開は生命に重要な役割を担い、安全性と効率の両方に研究者の注意を向ける必要がある。
実時間実行において、自動運転モデルが不慣れな環境に遭遇した場合、期待する性能向上にのみ焦点をあてる必要はなく、その実行やリアルタイム適応が必要な安全性レベルを維持するためには、十分な考慮が必要となる。
本研究では,<emph{neurosymbolic meta-reinforcement lookahead learning} (numerla) に基づくルックアヘッドシンボリック制約を用いたオンラインメタ強化学習アルゴリズムを提案する。
NUMERLAは、オンライン適応の効率と長期的安全性を確保するという包括的な目標を調和させるルックアヘッド更新機構を提案する。
実験により、NUMERLAはリアルタイム適応能力を持つ自動運転エージェントを推定し、非定常都市での人間と車両の相互作用シナリオ下での安全かつ自己適応運転を実現する。
関連論文リスト
- SELFI: Autonomous Self-Improvement with Reinforcement Learning for
Social Navigation [58.98433356015055]
体験と対話し、改善する自己改善ロボットは、ロボットシステムの現実的な展開の鍵となる。
本研究では,オンラインロボット体験を活用したオンライン学習手法であるSELFIを提案する。
本研究では, 衝突回避の観点からの改善と, より社会的に順応する行動について報告する。
論文 参考訳(メタデータ) (2024-03-01T21:27:03Z) - Safe and Generalized end-to-end Autonomous Driving System with Reinforcement Learning and Demonstrations [15.853453814447471]
インテリジェントな運転システムは、現在の環境と車両状態に基づいて、適切な運転戦略を動的に定式化することができるべきである。
強化学習と模倣学習に基づく既存の手法は、安全性の低下、一般化の低さ、非効率サンプリングに悩まされている。
複雑・多種多様なシナリオを対象とした安全で汎用的なエンドツーエンド自動運転システムを提案する。
論文 参考訳(メタデータ) (2024-01-22T09:44:16Z) - RACER: Rational Artificial Intelligence Car-following-model Enhanced by
Reality [51.244807332133696]
本稿では,アダプティブ・クルーズ・コントロール(ACC)運転行動を予測する,最先端の深層学習車追従モデルであるRACERを紹介する。
従来のモデルとは異なり、RACERは実走行の重要な要素であるRDC(Rational Driving Constraints)を効果的に統合している。
RACERはアクセラレーション、ベロシティ、スペーシングといった主要なメトリクスを網羅し、ゼロ違反を登録する。
論文 参考訳(メタデータ) (2023-12-12T06:21:30Z) - Analyze Drivers' Intervention Behavior During Autonomous Driving -- A
VR-incorporated Approach [2.7532019227694344]
この研究は、自動運転車の運転に関わる人間のドライバーの介入行動を理解することに光を当てている。
仮想リアリティ(VR)と交通マイクロシミュレーションを統合する実験環境が実装された。
介入の確率、事故率などのパフォーマンス指標が定義され、リスクレベルを定量化し比較するために使用される。
論文 参考訳(メタデータ) (2023-12-04T06:36:57Z) - Deception Game: Closing the Safety-Learning Loop in Interactive Robot
Autonomy [7.915956857741506]
既存の安全手法は、ロボットが実行時に学習し適応する能力を無視することが多く、過度に保守的な行動を引き起こす。
本稿では,ロボットの進化する不確実性を明示的に考慮した安全制御ポリシを合成するための,新しいクローズドループパラダイムを提案する。
論文 参考訳(メタデータ) (2023-09-03T20:34:01Z) - Self-Aware Trajectory Prediction for Safe Autonomous Driving [9.868681330733764]
軌道予測は、自動運転ソフトウェアスタックの重要なコンポーネントの1つである。
本稿では,自己認識軌道予測手法を提案する。
提案手法は, 自己認識, メモリフットプリント, リアルタイム性能で良好に動作した。
論文 参考訳(メタデータ) (2023-05-16T03:53:23Z) - Evaluating Model-free Reinforcement Learning toward Safety-critical
Tasks [70.76757529955577]
本稿では、国家安全RLの観点から、この領域における先行研究を再考する。
安全最適化と安全予測を組み合わせた共同手法であるUnrolling Safety Layer (USL)を提案する。
この領域のさらなる研究を容易にするため、我々は関連するアルゴリズムを統一パイプラインで再現し、SafeRL-Kitに組み込む。
論文 参考訳(メタデータ) (2022-12-12T06:30:17Z) - Tackling Real-World Autonomous Driving using Deep Reinforcement Learning [63.3756530844707]
本研究では,加速と操舵角度を予測するニューラルネットワークを学習するモデルレスディープ強化学習プランナを提案する。
実際の自動運転車にシステムをデプロイするために、我々は小さなニューラルネットワークで表されるモジュールも開発する。
論文 参考訳(メタデータ) (2022-07-05T16:33:20Z) - Differentiable Control Barrier Functions for Vision-based End-to-End
Autonomous Driving [100.57791628642624]
本稿では,視覚に基づくエンドツーエンド自動運転のための安全保証学習フレームワークを提案する。
我々は、勾配降下によりエンドツーエンドに訓練された微分制御バリア関数(dCBF)を備えた学習システムを設計する。
論文 参考訳(メタデータ) (2022-03-04T16:14:33Z) - Transferable Deep Reinforcement Learning Framework for Autonomous
Vehicles with Joint Radar-Data Communications [69.24726496448713]
本稿では,AVの最適決定を支援するために,マルコフ決定プロセス(MDP)に基づくインテリジェントな最適化フレームワークを提案する。
そこで我々は,近年の深層強化学習技術を活用した効果的な学習アルゴリズムを開発し,AVの最適方針を見出す。
提案手法は,従来の深部強化学習手法と比較して,AVによる障害物ミス検出確率を最大67%削減することを示す。
論文 参考訳(メタデータ) (2021-05-28T08:45:37Z) - Safe Trajectory Planning Using Reinforcement Learning for Self Driving [21.500697097095408]
自動運転車の軌道計画段階におけるモデルフリー強化学習を提案する。
このアプローチにより、自動運転のタスクに必要な安全で汎用的で快適な方法で車を操作することができることを示す。
論文 参考訳(メタデータ) (2020-11-09T19:29:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。