論文の概要: ParkingWorld: End-to-End Autonomous Parking Reinforcement Learning from Corrective Experience in 3DGS Simulation
- arxiv url: http://arxiv.org/abs/2605.25029v2
- Date: Tue, 26 May 2026 07:39:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.090056
- Title: ParkingWorld: End-to-End Autonomous Parking Reinforcement Learning from Corrective Experience in 3DGS Simulation
- Title(参考訳): パーキングワールド:3DGSシミュレーションにおける修正経験からのエンドツーエンドの自律駐車強化学習
- Authors: Zhengcheng Yu, Changze Li, Haoran Liu, Tong Qin,
- Abstract要約: 本稿では、終端自動駐車のためのループ内サンプル効率強化学習フレームワークを提案する。
実際のシーンの高忠実度デジタル再構成を可能にする3Dガウススプラッティング(3DGS)駐車シミュレーターで完全に訓練されている。
本手法は, 各種シナリオにおける駐車成功率, 運転効率, 安全性能の大幅な向上を実現する。
- 参考スコア(独自算出の注目度): 10.525967236174223
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous parking demands precise low-speed maneuvering within narrow, cluttered, and highly constrained environments, where vehicles must navigate tight spaces while avoiding static obstacles and complex geometric boundaries. Unlike imitation learning, which typically requires massive volumes of high-quality expert demonstrations to converge to a stable policy and often suffers from limited generalization to unseen scenarios, traditional reinforcement learning (RL) methods face persistent challenges including excessive training overhead, inefficient exploration, and even failure to learn viable parking strategies in challenging settings. To address these limitations, this paper presents a correction-in-the-loop sample-efficient reinforcement learning (CIL-SERL) framework for end-to-end autonomous parking, which is entirely trained in a photorealistic 3D Gaussian Splatting (3DGS) parking simulator that enables high-fidelity digital reconstruction of real-world scenes. Inspired by error-correction notebooks used in learning practice, we design a novel multi-level replay buffer mechanism. These buffers hierarchically organize and store standard RL rollouts, human corrective interventions, failed exploration trajectories, and rollback-based correction segments in separate yet interconnected memory regions, facilitating structured sampling and targeted learning during training. The proposed framework is systematically evaluated in both the 3DGS simulation environment and a physical vehicle platform. Extensive experimental results demonstrate that our method achieves substantial improvements in parking success rate, operational efficiency, and safety performance across diverse scenarios, validating the effectiveness and practical applicability of the proposed CIL-SERL-based end-to-end autonomous parking solution.
- Abstract(参考訳): 駐車場は狭い、散らばった、高度に制約された環境の中で正確な低速操作を必要としており、車両は静的な障害物や複雑な幾何学的境界を避けながら、狭い空間を移動しなければならない。
通常、安定した政策に収束するために大量の高品質な専門家デモを必要とする模倣学習とは異なり、従来の強化学習(RL)手法は過度の訓練のオーバーヘッド、非効率な探索、さらには挑戦的な環境で実行可能な駐車戦略の学習に失敗するといった永続的な課題に直面している。
これらの制約に対処するため,本論文では,現実のシーンを高忠実に再現可能な3次元ガウススプラッティング(3DGS)駐車シミュレータで完全に訓練された,エンドツーエンドの自律駐車のためのCIL-SERLフレームワークを提案する。
学習実践で使用される誤り訂正ノートに触発されて,我々は新しいマルチレベル再生バッファ機構を設計する。
これらのバッファは階層的に標準のRLロールアウト、人間の修正介入、探索軌道の失敗、ロールバックベースの修正セグメントを別々に相互接続したメモリ領域に配置し、構造化されたサンプリングとトレーニング中のターゲット学習を容易にする。
提案手法は3DGSシミュレーション環境と物理車両プラットフォームの両方において体系的に評価される。
CIL-SERLをベースとしたエンド・ツー・エンドの自律駐車ソリューションの有効性と実用性を検証し, 様々なシナリオにおける駐車成功率, 運転効率, 安全性能の大幅な向上を実証した。
関連論文リスト
- REAP: Reinforcement-Learning End-to-End Autonomous Parking with Gaussian Splatting Simulator for Real2Sim2Real Transfer [15.536851529885922]
本稿では,Reinforcement Learning End-to-end Autonomous Parking(REAP)を提案する。
REAPは、訓練効率と推論性能を改善するために、非対称強化学習フレームワークにSoft Actor-Critic(SAC)を使用している。
訓練された強化学習ネットワークが実世界のシナリオに直接移行できることを保証するため、我々はReal2Sim2Realシミュレータを構築した。
論文 参考訳(メタデータ) (2026-05-09T05:50:40Z) - SunnyParking: Multi-Shot Trajectory Generation and Motion State Awareness for Human-like Parking [24.480545421791234]
本研究では,空間軌跡と離散的な動き状態列を共同で予測することで,動き状態認識を実現する2重分岐E2Eアーキテクチャを提案する。
実験により, 複雑なマルチショット駐車シナリオにおいて, より頑健で人間的な軌道を生成することが実証された。
我々はCARLAシミュレータの新しいパーキングデータセットをオープンソース化した。
論文 参考訳(メタデータ) (2026-02-25T08:35:58Z) - Adapting Reinforcement Learning for Path Planning in Constrained Parking Scenarios [6.734318562862061]
駐車場におけるリアルタイム経路計画のためのDeep Reinforcement Learningフレームワークを提案する。
古典的なプランナーとは異なり、我々の解は理想的で構造化された知覚を必要としない。
テスト時には、ポリシーは各ステップで1つのフォワードパスを通じてアクションを生成します。
論文 参考訳(メタデータ) (2026-01-30T04:35:49Z) - Scaling Rough Terrain Locomotion with Automatic Curriculum Reinforcement Learning [16.89722808439415]
学習進歩に基づく自動カリキュラム強化学習フレームワークを提案する。
エージェントの学習進捗をオンラインで推定し、タスクサンプリング分布を適応的に調整する。
タスク空間上の難易度分布を事前に知ることなく、自動カリキュラム生成を可能にする。
論文 参考訳(メタデータ) (2026-01-24T11:54:16Z) - A Curriculum-Based Deep Reinforcement Learning Framework for the Electric Vehicle Routing Problem [0.4666493857924357]
EVRPTW(Electric Vehicle routing problem with Time Window)は、持続可能なロジスティクスにおいて複雑な最適化問題である。
この不安定性を解決するために,カリキュラムベースの深層強化学習(CB-DRL)フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-21T14:42:33Z) - Optimization-Guided Diffusion for Interactive Scene Generation [52.23368750264419]
本稿では,拡散型サンプリングにおける構造的一貫性と相互作用認識を実現するための,最適化誘導型トレーニングフリーフレームワークであるOMEGAを提案する。
OMEGAは生成リアリズム,一貫性,可制御性を向上し,身体的および行動学的に有効なシーンの比率を増大させることを示す。
当社のアプローチでは,3秒未満の時間対コリションで,より近いコリジョンフレームを5ドル(約5,500円)で生成することも可能だ。
論文 参考訳(メタデータ) (2025-12-08T15:56:18Z) - A General Infrastructure and Workflow for Quadrotor Deep Reinforcement Learning and Reality Deployment [48.90852123901697]
本稿では, エンドツーエンドの深層強化学習(DRL)ポリシーを四元数へシームレスに移行できるプラットフォームを提案する。
本プラットフォームは, ホバリング, 動的障害物回避, 軌道追尾, 気球打上げ, 未知環境における計画など, 多様な環境を提供する。
論文 参考訳(メタデータ) (2025-04-21T14:25:23Z) - RAD: Training an End-to-End Driving Policy via Large-Scale 3DGS-based Reinforcement Learning [54.52545900359868]
3DGSをベースとしたエンドツーエンド自動運転のためのクローズドループ強化学習フレームワークRADを提案する。
安全性を高めるため、我々は、安全クリティカルな事象に効果的に対応し、現実世界の因果関係を理解するために、政策の指針となる特別報酬を設計する。
IL法と比較して、RADは閉ループのほとんどの測定値において、特に3倍の衝突速度を示す。
論文 参考訳(メタデータ) (2025-02-18T18:59:21Z) - ReGentS: Real-World Safety-Critical Driving Scenario Generation Made Stable [88.08120417169971]
機械学習に基づく自律運転システムは、現実世界のデータでは稀な安全クリティカルなシナリオで課題に直面していることが多い。
この研究は、軌道最適化によって複雑な現実世界の通常のシナリオを変更することによって、安全クリティカルな運転シナリオを生成することを検討する。
提案手法は、頑健なプランナーの訓練には役に立たない非現実的な発散軌道と避けられない衝突シナリオに対処する。
論文 参考訳(メタデータ) (2024-09-12T08:26:33Z) - Differentiable Control Barrier Functions for Vision-based End-to-End
Autonomous Driving [100.57791628642624]
本稿では,視覚に基づくエンドツーエンド自動運転のための安全保証学習フレームワークを提案する。
我々は、勾配降下によりエンドツーエンドに訓練された微分制御バリア関数(dCBF)を備えた学習システムを設計する。
論文 参考訳(メタデータ) (2022-03-04T16:14:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。