論文の概要: SunnyParking: Multi-Shot Trajectory Generation and Motion State Awareness for Human-like Parking
- arxiv url: http://arxiv.org/abs/2602.21682v1
- Date: Wed, 25 Feb 2026 08:35:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.70129
- Title: SunnyParking: Multi-Shot Trajectory Generation and Motion State Awareness for Human-like Parking
- Title(参考訳): SunnyParking: パーキングのためのマルチショット軌道生成と動作状態認識
- Authors: Jishu Miao, Han Chen, Jiankun Zhai, Qi Liu, Tsubasa Hirakawa, Takayoshi Yamashita, Hironobu Fujiyoshi,
- Abstract要約: 本研究では,空間軌跡と離散的な動き状態列を共同で予測することで,動き状態認識を実現する2重分岐E2Eアーキテクチャを提案する。
実験により, 複雑なマルチショット駐車シナリオにおいて, より頑健で人間的な軌道を生成することが実証された。
我々はCARLAシミュレータの新しいパーキングデータセットをオープンソース化した。
- 参考スコア(独自算出の注目度): 24.480545421791234
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous parking fundamentally differs from on-road driving due to its frequent direction changes and complex maneuvering requirements. However, existing End-to-End (E2E) planning methods often simplify the parking task into a geometric path regression problem, neglecting explicit modeling of the vehicle's kinematic state. This "dimensionality deficiency" easily leads to physically infeasible trajectories and deviates from real human driving behavior, particularly at critical gear-shift points in multi-shot parking scenarios. In this paper, we propose SunnyParking, a novel dual-branch E2E architecture that achieves motion state awareness by jointly predicting spatial trajectories and discrete motion state sequences (e.g., forward/reverse). Additionally, we introduce a Fourier feature-based representation of target parking slots to overcome the resolution limitations of traditional bird's-eye view (BEV) approaches, enabling high-precision target interactions. Experimental results demonstrate that our framework generates more robust and human-like trajectories in complex multi-shot parking scenarios, while significantly improving gear-shift point localization accuracy compared to state-of-the-art methods. We open-source a new parking dataset of the CARLA simulator, specifically designed to evaluate full prediction capabilities under complex maneuvers.
- Abstract(参考訳): 自動駐車は、道路上での運転と基本的に異なるのは、方向の変更や複雑な操作の要求が頻繁であるからである。
しかしながら、既存のEnd-to-End(E2E)計画手法は、しばしば駐車タスクを幾何学的経路回帰問題に単純化し、車両の運動状態の明示的なモデリングを無視する。
この「次元不足」は、物理的に実現不可能な軌跡を容易に導き出し、実際の人間の運転行動から逸脱する。
本稿では,空間軌道と離散的な動き状態列(例えば,前方/逆)を共同で予測することで,動き状態の認識を実現する新しいデュアルブランチE2EアーキテクチャであるSunnyParkingを提案する。
さらに、従来の鳥眼ビュー(BEV)アプローチの解像度制限を克服するために、Fourier機能に基づく目標駐車スロットの表現を導入し、高精度なターゲットインタラクションを可能にした。
実験により, 複雑な多発駐車シナリオにおいて, より頑健で人間的な軌道を生成するとともに, 歯車シフト点位置決め精度を最先端の手法と比較して有意に向上した。
我々はCARLAシミュレータの新しいパーキングデータセットをオープンソース化した。
関連論文リスト
- Optimization-Guided Diffusion for Interactive Scene Generation [52.23368750264419]
本稿では,拡散型サンプリングにおける構造的一貫性と相互作用認識を実現するための,最適化誘導型トレーニングフリーフレームワークであるOMEGAを提案する。
OMEGAは生成リアリズム,一貫性,可制御性を向上し,身体的および行動学的に有効なシーンの比率を増大させることを示す。
当社のアプローチでは,3秒未満の時間対コリションで,より近いコリジョンフレームを5ドル(約5,500円)で生成することも可能だ。
論文 参考訳(メタデータ) (2025-12-08T15:56:18Z) - Parking Availability Prediction via Fusing Multi-Source Data with A Self-Supervised Learning Enhanced Spatio-Temporal Inverted Transformer [6.779236767393988]
本研究では,SST-iTransformerを用いた交通需要特性の抽出・統合手法を提案する。
中国・成都の現実世界のデータを用いた実験では、SST-iTransformerがディープラーニングモデルより優れていることが示されている。
論文 参考訳(メタデータ) (2025-09-04T16:22:29Z) - ParkFormer: A Transformer-Based Parking Policy with Goal Embedding and Pedestrian-Aware Control [8.713707183974304]
自動駐車のためのトランスフォーマーベースのエンドツーエンドフレームワークは、専門家によるデモンストレーションから学ぶ。
ネットワークは、入力されたサラウンドビューカメライメージ、ゴールポイント表現、エゴ車両の動き、および歩行者軌道として捉えている。
実験の結果, 平均位置誤差は0.21m, 方位誤差は0.41度, 96.57%であった。
論文 参考訳(メタデータ) (2025-06-20T09:14:09Z) - ParkDiffusion: Heterogeneous Multi-Agent Multi-Modal Trajectory Prediction for Automated Parking using Diffusion Models [6.58562706945347]
ParkDiffusionは、自動駐車シナリオにおける車両と歩行者の両方の軌道を予測する新しいアプローチである。
ParkDiffusionは拡散モデルを用いて、将来の軌道の固有の不確実性と多モード性を捉える。
我々は,Dragon Lake ParkingデータセットとIntersections DroneデータセットのParkDiffusionを評価する。
論文 参考訳(メタデータ) (2025-05-01T15:16:59Z) - TransParking: A Dual-Decoder Transformer Framework with Soft Localization for End-to-End Automatic Parking [2.209921757303168]
本稿では,専門的軌跡を用いて訓練したエンドツーエンド自動駐車のための視覚ベーストランスフォーマーモデルを提案する。
実験結果から, モデルの誤差は50%程度減少していることがわかった。
論文 参考訳(メタデータ) (2025-03-08T05:41:24Z) - DriveTransformer: Unified Transformer for Scalable End-to-End Autonomous Driving [62.62464518137153]
DriveTransformerは、スケールアップを簡単にするためのシンプルなE2E-ADフレームワークである。
タスク・セルフ・アテンション、センサー・クロス・アテンション、時間的クロス・アテンションという3つの統合された操作で構成されている。
シミュレーションされたクローズドループベンチマークBench2Driveと、FPSの高い実世界のオープンループベンチマークnuScenesの両方で、最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-03-07T11:41:18Z) - DiFSD: Ego-Centric Fully Sparse Paradigm with Uncertainty Denoising and Iterative Refinement for Efficient End-to-End Self-Driving [55.53171248839489]
我々は、エンドツーエンドの自動運転のためのエゴ中心の完全スパースパラダイムであるDiFSDを提案する。
特に、DiFSDは主にスパース知覚、階層的相互作用、反復的な運動プランナーから構成される。
nuScenesとBench2Driveデータセットで実施された実験は、DiFSDの優れた計画性能と優れた効率を実証している。
論文 参考訳(メタデータ) (2024-09-15T15:55:24Z) - Monocular BEV Perception of Road Scenes via Front-to-Top View Projection [57.19891435386843]
本稿では,鳥の目視で道路配置と車両占有率によって形成された局所地図を再構築する新しい枠組みを提案する。
我々のモデルは1つのGPU上で25FPSで動作し、リアルタイムパノラマHDマップの再構築に有効である。
論文 参考訳(メタデータ) (2022-11-15T13:52:41Z) - Multi-Modal Fusion Transformer for End-to-End Autonomous Driving [59.60483620730437]
画像表現とLiDAR表現を注目で統合する,新しいマルチモードフュージョントランスフォーマであるTransFuserを提案する。
本手法は, 衝突を76%低減しつつ, 最先端駆動性能を実現する。
論文 参考訳(メタデータ) (2021-04-19T11:48:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。