論文の概要: Tackling Snow-Induced Challenges: Safe Autonomous Lane-Keeping with Robust Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2512.12987v1
- Date: Mon, 15 Dec 2025 05:23:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-16 17:54:56.541193
- Title: Tackling Snow-Induced Challenges: Safe Autonomous Lane-Keeping with Robust Reinforcement Learning
- Title(参考訳): 雪による挑戦に対処する:ロバスト強化学習による安全な自律レーンキーピング
- Authors: Amin Jalal Aghdasian, Farzaneh Abdollahi, Ali Kamali Iglie,
- Abstract要約: 本稿では,雪道環境下での自律走行車(AV)における車線維持システム(LKS)の2つの新しいアルゴリズムを提案する。
深層強化学習(DRL)を用いて不確実性とすべりの処理を行う。
Jetson Nanoをベースとした自動運転車の現実的な実験は、学習されたポリシーの実現可能性と安定性を確認している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper proposes two new algorithms for the lane keeping system (LKS) in autonomous vehicles (AVs) operating under snowy road conditions. These algorithms use deep reinforcement learning (DRL) to handle uncertainties and slippage. They include Action-Robust Recurrent Deep Deterministic Policy Gradient (AR-RDPG) and end-to-end Action-Robust convolutional neural network Attention Deterministic Policy Gradient (AR-CADPG), two action-robust approaches for decision-making. In the AR-RDPG method, within the perception layer, camera images are first denoised using multi-scale neural networks. Then, the centerline coefficients are extracted by a pre-trained deep convolutional neural network (DCNN). These coefficients, concatenated with the driving characteristics, are used as input to the control layer. The AR-CADPG method presents an end-to-end approach in which a convolutional neural network (CNN) and an attention mechanism are integrated within a DRL framework. Both methods are first trained in the CARLA simulator and validated under various snowy scenarios. Real-world experiments on a Jetson Nano-based autonomous vehicle confirm the feasibility and stability of the learned policies. Among the two models, the AR-CADPG approach demonstrates superior path-tracking accuracy and robustness, highlighting the effectiveness of combining temporal memory, adversarial resilience, and attention mechanisms in AVs.
- Abstract(参考訳): 本稿では,雪道環境下での自律走行車(AV)における車線維持システム(LKS)の2つの新しいアルゴリズムを提案する。
これらのアルゴリズムは深部強化学習(DRL)を用いて不確実性とすべりの処理を行う。
その中には、Action-Robust Recurrent Deep Deterministic Policy Gradient (AR-RDPG)と、エンドツーエンドのAction-Robust Convolutional Neural Network Attention Deterministic Policy Gradient (AR-CADPG)が含まれる。
AR-RDPG法では、認識層内のカメラ画像は、まずマルチスケールニューラルネットワークを用いて識別される。
そして、予め訓練された深部畳み込みニューラルネットワーク(DCNN)により中心線係数を抽出する。
これらの係数は、駆動特性と連結され、制御層への入力として使用される。
AR-CADPG法は、畳み込みニューラルネットワーク(CNN)と注意機構をDRLフレームワークに統合したエンドツーエンドアプローチを提案する。
どちらの手法もまずCARLAシミュレーターで訓練され、様々な雪のシナリオで検証される。
Jetson Nanoをベースとした自動運転車の現実的な実験は、学習されたポリシーの実現可能性と安定性を確認している。
2つのモデルの中で、AR-CADPGアプローチは経路追跡精度とロバスト性を向上し、時間記憶、対向レジリエンス、AVの注意機構を組み合わせる効果を強調している。
関連論文リスト
- Demystifying the Physics of Deep Reinforcement Learning-Based Autonomous Vehicle Decision-Making [6.243971093896272]
本稿では,ベースラインモデルとしてポリシー最適化に基づくDRLアルゴリズムを用い,オープンソースのAVシミュレーション環境にマルチヘッドアテンションフレームワークを付加する。
第1頭部の重みは隣接する車両の位置を符号化し、第2頭部は先頭車両のみに焦点を当てている。
論文 参考訳(メタデータ) (2024-03-18T02:59:13Z) - Partial End-to-end Reinforcement Learning for Robustness Against Modelling Error in Autonomous Racing [0.0]
本稿では、自動運転車における強化学習(RL)ソリューションの性能向上の問題に対処する。
計画タスクと制御タスクを分離する部分的なエンドツーエンドアルゴリズムを提案する。
従来の制御器のロバスト性を活用することにより,本アルゴリズムは標準のエンドツーエンドアルゴリズムよりもモデルミスマッチに対するロバスト性を向上する。
論文 参考訳(メタデータ) (2023-12-11T14:27:10Z) - ConCerNet: A Contrastive Learning Based Framework for Automated
Conservation Law Discovery and Trustworthy Dynamical System Prediction [82.81767856234956]
本稿では,DNNに基づく動的モデリングの信頼性を向上させるために,ConCerNetという新しい学習フレームワークを提案する。
本手法は, 座標誤差と保存量の両方において, ベースラインニューラルネットワークよりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2023-02-11T21:07:30Z) - Training and Evaluation of Deep Policies using Reinforcement Learning
and Generative Models [67.78935378952146]
GenRLはシーケンシャルな意思決定問題を解決するためのフレームワークである。
強化学習と潜在変数生成モデルの組み合わせを利用する。
最終方針訓練の性能に最も影響を与える生成モデルの特徴を実験的に決定する。
論文 参考訳(メタデータ) (2022-04-18T22:02:32Z) - Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。
軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。
NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文 参考訳(メタデータ) (2020-12-04T18:59:32Z) - Indirect and Direct Training of Spiking Neural Networks for End-to-End
Control of a Lane-Keeping Vehicle [12.137685936113384]
生物学的シナプス可塑性に基づくスパイクニューラルネットワーク(SNN)の構築は、高速でエネルギー効率のよい計算を実現するための有望な可能性を秘めている。
本稿では,車線維持車両におけるSNNの間接的および直接的エンドツーエンドのトレーニング手法について紹介する。
論文 参考訳(メタデータ) (2020-03-10T09:35:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。