Fugu-MT 論文翻訳(概要): Tackling Snow-Induced Challenges: Safe Autonomous Lane-Keeping with Robust Reinforcement Learning

論文の概要: Tackling Snow-Induced Challenges: Safe Autonomous Lane-Keeping with Robust Reinforcement Learning

arxiv url: http://arxiv.org/abs/2512.12987v1
Date: Mon, 15 Dec 2025 05:23:23 GMT
ステータス: 翻訳完了
システム内更新日: 2025-12-16 17:54:56.541193
Title: Tackling Snow-Induced Challenges: Safe Autonomous Lane-Keeping with Robust Reinforcement Learning
Title（参考訳）: 雪による挑戦に対処する:ロバスト強化学習による安全な自律レーンキーピング
Authors: Amin Jalal Aghdasian, Farzaneh Abdollahi, Ali Kamali Iglie,
Abstract要約: 本稿では,雪道環境下での自律走行車(AV)における車線維持システム(LKS)の2つの新しいアルゴリズムを提案する。深層強化学習(DRL)を用いて不確実性とすべりの処理を行う。 Jetson Nanoをベースとした自動運転車の現実的な実験は、学習されたポリシーの実現可能性と安定性を確認している。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This paper proposes two new algorithms for the lane keeping system (LKS) in autonomous vehicles (AVs) operating under snowy road conditions. These algorithms use deep reinforcement learning (DRL) to handle uncertainties and slippage. They include Action-Robust Recurrent Deep Deterministic Policy Gradient (AR-RDPG) and end-to-end Action-Robust convolutional neural network Attention Deterministic Policy Gradient (AR-CADPG), two action-robust approaches for decision-making. In the AR-RDPG method, within the perception layer, camera images are first denoised using multi-scale neural networks. Then, the centerline coefficients are extracted by a pre-trained deep convolutional neural network (DCNN). These coefficients, concatenated with the driving characteristics, are used as input to the control layer. The AR-CADPG method presents an end-to-end approach in which a convolutional neural network (CNN) and an attention mechanism are integrated within a DRL framework. Both methods are first trained in the CARLA simulator and validated under various snowy scenarios. Real-world experiments on a Jetson Nano-based autonomous vehicle confirm the feasibility and stability of the learned policies. Among the two models, the AR-CADPG approach demonstrates superior path-tracking accuracy and robustness, highlighting the effectiveness of combining temporal memory, adversarial resilience, and attention mechanisms in AVs.
Abstract（参考訳）: 本稿では,雪道環境下での自律走行車(AV)における車線維持システム(LKS)の2つの新しいアルゴリズムを提案する。これらのアルゴリズムは深部強化学習(DRL)を用いて不確実性とすべりの処理を行う。その中には、Action-Robust Recurrent Deep Deterministic Policy Gradient (AR-RDPG)と、エンドツーエンドのAction-Robust Convolutional Neural Network Attention Deterministic Policy Gradient (AR-CADPG)が含まれる。 AR-RDPG法では、認識層内のカメラ画像は、まずマルチスケールニューラルネットワークを用いて識別される。そして、予め訓練された深部畳み込みニューラルネットワーク(DCNN)により中心線係数を抽出する。これらの係数は、駆動特性と連結され、制御層への入力として使用される。 AR-CADPG法は、畳み込みニューラルネットワーク(CNN)と注意機構をDRLフレームワークに統合したエンドツーエンドアプローチを提案する。どちらの手法もまずCARLAシミュレーターで訓練され、様々な雪のシナリオで検証される。 Jetson Nanoをベースとした自動運転車の現実的な実験は、学習されたポリシーの実現可能性と安定性を確認している。 2つのモデルの中で、AR-CADPGアプローチは経路追跡精度とロバスト性を向上し、時間記憶、対向レジリエンス、AVの注意機構を組み合わせる効果を強調している。

関連論文リスト

Discrete Diffusion for Reflective Vision-Language-Action Models in Autonomous Driving [55.13109926181247]
離散拡散による安全な軌道生成のためのリフレクション機構を統合した学習ベースのフレームワークであるReflectDriveを紹介する。我々のアプローチの中心は、勾配のない反復的な自己補正を行う、安全を意識した反射機構である。本手法は目標条件付き軌道生成から始まり,マルチモーダル運転動作をモデル化する。
論文参考訳（メタデータ） (2025-09-24T13:35:15Z)
Demystifying the Physics of Deep Reinforcement Learning-Based Autonomous Vehicle Decision-Making [6.243971093896272]
本稿では,ベースラインモデルとしてポリシー最適化に基づくDRLアルゴリズムを用い,オープンソースのAVシミュレーション環境にマルチヘッドアテンションフレームワークを付加する。第1頭部の重みは隣接する車両の位置を符号化し、第2頭部は先頭車両のみに焦点を当てている。
論文参考訳（メタデータ） (2024-03-18T02:59:13Z)
An Efficient Learning-based Solver Comparable to Metaheuristics for the Capacitated Arc Routing Problem [67.92544792239086]
我々は,高度メタヒューリスティックスとのギャップを著しく狭めるため,NNベースの解法を導入する。まず,方向対応型注意モデル(DaAM)を提案する。第2に、教師付き事前学習を伴い、堅牢な初期方針を確立するための教師付き強化学習スキームを設計する。
論文参考訳（メタデータ） (2024-03-11T02:17:42Z)
Partial End-to-end Reinforcement Learning for Robustness Against Modelling Error in Autonomous Racing [0.0]
本稿では、自動運転車における強化学習(RL)ソリューションの性能向上の問題に対処する。計画タスクと制御タスクを分離する部分的なエンドツーエンドアルゴリズムを提案する。従来の制御器のロバスト性を活用することにより,本アルゴリズムは標準のエンドツーエンドアルゴリズムよりもモデルミスマッチに対するロバスト性を向上する。
論文参考訳（メタデータ） (2023-12-11T14:27:10Z)
Neural Network Algorithm for Intercepting Targets Moving Along Known Trajectories by a Dubins' Car [0.0]
時間最適制御問題として、Dubinsの車によって直線または円軌道に沿って移動する目標を迎撃する作業が定式化される。 Deep Deterministic Policy Gradientアルゴリズムに基づく教師なし学習のニューラルネットワーク手法を用いる。対象運動の所定のクラスに対するインターセプショントラジェクトリの合成にニューラルネットワーク法を用いることの有効性を示す。
論文参考訳（メタデータ） (2023-04-12T21:52:39Z)
ConCerNet: A Contrastive Learning Based Framework for Automated Conservation Law Discovery and Trustworthy Dynamical System Prediction [82.81767856234956]
本稿では,DNNに基づく動的モデリングの信頼性を向上させるために,ConCerNetという新しい学習フレームワークを提案する。本手法は, 座標誤差と保存量の両方において, ベースラインニューラルネットワークよりも一貫して優れていることを示す。
論文参考訳（メタデータ） (2023-02-11T21:07:30Z)
Training and Evaluation of Deep Policies using Reinforcement Learning and Generative Models [67.78935378952146]
GenRLはシーケンシャルな意思決定問題を解決するためのフレームワークである。強化学習と潜在変数生成モデルの組み合わせを利用する。最終方針訓練の性能に最も影響を与える生成モデルの特徴を実験的に決定する。
論文参考訳（メタデータ） (2022-04-18T22:02:32Z)
Monocular Vision-based Prediction of Cut-in Maneuvers with LSTM Networks [0.0]
本研究では,エゴレーンで発生する潜在的に危険なカットイン動作を予測する手法を提案する。我々は、1台の車載RGBカメラのみを使用するコンピュータビジョンベースのアプローチに従う。本アルゴリズムは,CNNに基づく車両検出・追跡ステップとLSTMに基づく操縦分類ステップから構成される。
論文参考訳（メタデータ） (2022-03-21T02:30:36Z)
Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。 NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文参考訳（メタデータ） (2020-12-04T18:59:32Z)
Risk-Averse MPC via Visual-Inertial Input and Recurrent Networks for Online Collision Avoidance [95.86944752753564]
本稿では,モデル予測制御(MPC)の定式化を拡張したオンライン経路計画アーキテクチャを提案する。我々のアルゴリズムは、状態推定の共分散を推論するリカレントニューラルネットワーク(RNN)とオブジェクト検出パイプラインを組み合わせる。本手法のロバスト性は, 複雑な四足歩行ロボットの力学で検証され, ほとんどのロボットプラットフォームに適用可能である。
論文参考訳（メタデータ） (2020-07-28T07:34:30Z)
Indirect and Direct Training of Spiking Neural Networks for End-to-End Control of a Lane-Keeping Vehicle [12.137685936113384]
生物学的シナプス可塑性に基づくスパイクニューラルネットワーク(SNN)の構築は、高速でエネルギー効率のよい計算を実現するための有望な可能性を秘めている。本稿では,車線維持車両におけるSNNの間接的および直接的エンドツーエンドのトレーニング手法について紹介する。
論文参考訳（メタデータ） (2020-03-10T09:35:46Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。