Fugu-MT 論文翻訳(概要): Neurosymbolic Meta-Reinforcement Lookahead Learning Achieves Safe Self-Driving in Non-Stationary Environments

論文の概要: Neurosymbolic Meta-Reinforcement Lookahead Learning Achieves Safe Self-Driving in Non-Stationary Environments

arxiv url: http://arxiv.org/abs/2309.02328v1
Date: Tue, 5 Sep 2023 15:47:40 GMT
ステータス: 翻訳完了
システム内更新日: 2023-09-06 13:52:33.693846
Title: Neurosymbolic Meta-Reinforcement Lookahead Learning Achieves Safe Self-Driving in Non-Stationary Environments
Title（参考訳）: 非定常環境下での安全な自動運転を実現するニューロシンボリックメタ強化ルックアヘッド学習
Authors: Haozhe Lei and Quanyan Zhu
Abstract要約: 本研究では,emphNeurosymbolic Meta-Reinforcement Lookahead Learning(NUMERLA)に基づくルックアヘッドシンボリック制約を用いたオンラインメタ強化学習アルゴリズムを提案する。実験により、NUMERLAはリアルタイム適応能力を持つ自動運転エージェントを推定し、非定常都市での人間と車両の相互作用シナリオ下での安全かつ自己適応運転を実現する。
参考スコア（独自算出の注目度）: 17.39580032857777
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In the area of learning-driven artificial intelligence advancement, the integration of machine learning (ML) into self-driving (SD) technology stands as an impressive engineering feat. Yet, in real-world applications outside the confines of controlled laboratory scenarios, the deployment of self-driving technology assumes a life-critical role, necessitating heightened attention from researchers towards both safety and efficiency. To illustrate, when a self-driving model encounters an unfamiliar environment in real-time execution, the focus must not solely revolve around enhancing its anticipated performance; equal consideration must be given to ensuring its execution or real-time adaptation maintains a requisite level of safety. This study introduces an algorithm for online meta-reinforcement learning, employing lookahead symbolic constraints based on \emph{Neurosymbolic Meta-Reinforcement Lookahead Learning} (NUMERLA). NUMERLA proposes a lookahead updating mechanism that harmonizes the efficiency of online adaptations with the overarching goal of ensuring long-term safety. Experimental results demonstrate NUMERLA confers the self-driving agent with the capacity for real-time adaptability, leading to safe and self-adaptive driving under non-stationary urban human-vehicle interaction scenarios.
Abstract（参考訳）: 機械学習による人工知能の進歩の分野では、機械学習(ML)と自動運転(SD)技術の統合は素晴らしいエンジニアリングの偉業である。しかし、制御された実験室のシナリオの範囲外の現実世界のアプリケーションでは、自動運転技術の展開は生命に重要な役割を担い、安全性と効率の両方に研究者の注意を向ける必要がある。実時間実行において、自動運転モデルが不慣れな環境に遭遇した場合、期待する性能向上にのみ焦点をあてる必要はなく、その実行やリアルタイム適応が必要な安全性レベルを維持するためには、十分な考慮が必要となる。本研究では,<emph{neurosymbolic meta-reinforcement lookahead learning} (numerla) に基づくルックアヘッドシンボリック制約を用いたオンラインメタ強化学習アルゴリズムを提案する。 NUMERLAは、オンライン適応の効率と長期的安全性を確保するという包括的な目標を調和させるルックアヘッド更新機構を提案する。実験により、NUMERLAはリアルタイム適応能力を持つ自動運転エージェントを推定し、非定常都市での人間と車両の相互作用シナリオ下での安全かつ自己適応運転を実現する。

関連論文リスト

CurricuVLM: Towards Safe Autonomous Driving via Personalized Safety-Critical Curriculum Learning with Vision-Language Models [1.6612510324510592]
CurricuVLMは、自律運転エージェントのためのパーソナライズされたカリキュラム学習を可能にする新しいフレームワークである。我々のアプローチでは、エージェントの動作を分析し、パフォーマンスの弱点を特定し、動的に調整されたトレーニングシナリオを生成するために、視覚言語モデル(VLM)を利用する。 CurricuVLMは、通常のシナリオと安全クリティカルなシナリオの両方において、最先端のベースラインを上回っている。
論文参考訳（メタデータ） (2025-02-21T00:42:40Z)
TeLL-Drive: Enhancing Autonomous Driving with Teacher LLM-Guided Deep Reinforcement Learning [61.33599727106222]
TeLL-Driveは、Teacher LLMを統合して、注意に基づく学生DRLポリシーをガイドするハイブリッドフレームワークである。自己維持機構はDRLエージェントの探索とこれらの戦略を融合させ、政策収束を加速し、堅牢性を高める。
論文参考訳（メタデータ） (2025-02-03T14:22:03Z)
A Safe and Efficient Self-evolving Algorithm for Decision-making and Control of Autonomous Driving Systems [19.99282698119699]
自己進化型自動運転車は、現実世界の環境における未知のシナリオに対処することが期待されている。強化学習は最適な政策を学ぶことで自己進化できる。本稿では,ハイブリッドなメカニズム-経験-学習型拡張手法を提案する。
論文参考訳（メタデータ） (2024-08-22T08:05:03Z)
RACER: Epistemic Risk-Sensitive RL Enables Fast Driving with Fewer Crashes [57.319845580050924]
本稿では,リスク感応制御と適応行動空間のカリキュラムを組み合わせた強化学習フレームワークを提案する。提案アルゴリズムは,現実世界のオフロード運転タスクに対して,高速なポリシーを学習可能であることを示す。
論文参考訳（メタデータ） (2024-05-07T23:32:36Z)
RACER: Rational Artificial Intelligence Car-following-model Enhanced by Reality [51.244807332133696]
本稿では,アダプティブ・クルーズ・コントロール(ACC)運転行動を予測する,最先端の深層学習車追従モデルであるRACERを紹介する。従来のモデルとは異なり、RACERは実走行の重要な要素であるRDC(Rational Driving Constraints)を効果的に統合している。 RACERはアクセラレーション、ベロシティ、スペーシングといった主要なメトリクスを網羅し、ゼロ違反を登録する。
論文参考訳（メタデータ） (2023-12-12T06:21:30Z)
Analyze Drivers' Intervention Behavior During Autonomous Driving -- A VR-incorporated Approach [2.7532019227694344]
この研究は、自動運転車の運転に関わる人間のドライバーの介入行動を理解することに光を当てている。仮想リアリティ(VR)と交通マイクロシミュレーションを統合する実験環境が実装された。介入の確率、事故率などのパフォーマンス指標が定義され、リスクレベルを定量化し比較するために使用される。
論文参考訳（メタデータ） (2023-12-04T06:36:57Z)
Empowering Autonomous Driving with Large Language Models: A Safety Perspective [82.90376711290808]
本稿では,Large Language Models (LLM) の自律運転システムへの統合について検討する。 LLMは行動計画におけるインテリジェントな意思決定者であり、文脈的安全学習のための安全検証シールドを備えている。適応型LLM条件モデル予測制御(MPC)と状態機械を用いたLLM対応対話型行動計画スキームという,シミュレーション環境における2つの重要な研究について述べる。
論文参考訳（メタデータ） (2023-11-28T03:13:09Z)
Deception Game: Closing the Safety-Learning Loop in Interactive Robot Autonomy [7.915956857741506]
既存の安全手法は、ロボットが実行時に学習し適応する能力を無視することが多く、過度に保守的な行動を引き起こす。本稿では,ロボットの進化する不確実性を明示的に考慮した安全制御ポリシを合成するための,新しいクローズドループパラダイムを提案する。
論文参考訳（メタデータ） (2023-09-03T20:34:01Z)
Self-Aware Trajectory Prediction for Safe Autonomous Driving [9.868681330733764]
軌道予測は、自動運転ソフトウェアスタックの重要なコンポーネントの1つである。本稿では,自己認識軌道予測手法を提案する。提案手法は, 自己認識, メモリフットプリント, リアルタイム性能で良好に動作した。
論文参考訳（メタデータ） (2023-05-16T03:53:23Z)
Tackling Real-World Autonomous Driving using Deep Reinforcement Learning [63.3756530844707]
本研究では,加速と操舵角度を予測するニューラルネットワークを学習するモデルレスディープ強化学習プランナを提案する。実際の自動運転車にシステムをデプロイするために、我々は小さなニューラルネットワークで表されるモジュールも開発する。
論文参考訳（メタデータ） (2022-07-05T16:33:20Z)
Differentiable Control Barrier Functions for Vision-based End-to-End Autonomous Driving [100.57791628642624]
本稿では,視覚に基づくエンドツーエンド自動運転のための安全保証学習フレームワークを提案する。我々は、勾配降下によりエンドツーエンドに訓練された微分制御バリア関数(dCBF)を備えた学習システムを設計する。
論文参考訳（メタデータ） (2022-03-04T16:14:33Z)
Transferable Deep Reinforcement Learning Framework for Autonomous Vehicles with Joint Radar-Data Communications [69.24726496448713]
本稿では,AVの最適決定を支援するために,マルコフ決定プロセス(MDP)に基づくインテリジェントな最適化フレームワークを提案する。そこで我々は,近年の深層強化学習技術を活用した効果的な学習アルゴリズムを開発し,AVの最適方針を見出す。提案手法は,従来の深部強化学習手法と比較して,AVによる障害物ミス検出確率を最大67%削減することを示す。
論文参考訳（メタデータ） (2021-05-28T08:45:37Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。