論文の概要: ParkFormer: A Transformer-Based Parking Policy with Goal Embedding and Pedestrian-Aware Control
- arxiv url: http://arxiv.org/abs/2506.16856v1
- Date: Fri, 20 Jun 2025 09:14:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-23 19:00:05.400381
- Title: ParkFormer: A Transformer-Based Parking Policy with Goal Embedding and Pedestrian-Aware Control
- Title(参考訳): ParkFormer: ゴール埋め込みと歩行者対応制御を備えたトランスフォーマーベースのパーキングポリシー
- Authors: Jun Fu, Bin Tian, Haonan Chen, Shi Meng, Tingting Yao,
- Abstract要約: 自動駐車のためのトランスフォーマーベースのエンドツーエンドフレームワークは、専門家によるデモンストレーションから学ぶ。
ネットワークは、入力されたサラウンドビューカメライメージ、ゴールポイント表現、エゴ車両の動き、および歩行者軌道として捉えている。
実験の結果, 平均位置誤差は0.21m, 方位誤差は0.41度, 96.57%であった。
- 参考スコア(独自算出の注目度): 8.713707183974304
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous parking plays a vital role in intelligent vehicle systems, particularly in constrained urban environments where high-precision control is required. While traditional rule-based parking systems struggle with environmental uncertainties and lack adaptability in crowded or dynamic scenes, human drivers demonstrate the ability to park intuitively without explicit modeling. Inspired by this observation, we propose a Transformer-based end-to-end framework for autonomous parking that learns from expert demonstrations. The network takes as input surround-view camera images, goal-point representations, ego vehicle motion, and pedestrian trajectories. It outputs discrete control sequences including throttle, braking, steering, and gear selection. A novel cross-attention module integrates BEV features with target points, and a GRU-based pedestrian predictor enhances safety by modeling dynamic obstacles. We validate our method on the CARLA 0.9.14 simulator in both vertical and parallel parking scenarios. Experiments show our model achieves a high success rate of 96.57\%, with average positional and orientation errors of 0.21 meters and 0.41 degrees, respectively. The ablation studies further demonstrate the effectiveness of key modules such as pedestrian prediction and goal-point attention fusion. The code and dataset will be released at: https://github.com/little-snail-f/ParkFormer.
- Abstract(参考訳): 自律駐車は、特に高精度制御が必要な都市環境において、インテリジェントな車両システムにおいて重要な役割を担っている。
従来のルールに基づく駐車システムは、混み合ったシーンや動的なシーンにおいて、環境の不確実性と適応性の欠如に悩まされているが、人間のドライバーは明示的なモデリングなしで直感的に駐車できる能力を示している。
この観察に触発されて,専門家による実証から学ぶ自動駐車のためのトランスフォーマーに基づくエンドツーエンドフレームワークを提案する。
このネットワークは、入力されたサラウンドビューカメライメージ、ゴールポイント表現、エゴ車両の動き、および歩行者軌道として機能する。
スロットル、ブレーキ、ステアリング、ギア選択などの個別制御シーケンスを出力する。
新しいクロスアテンションモジュールはBEV機能を目標点と統合し、GRUベースの歩行者予測器は動的障害物をモデル化して安全性を高める。
我々はCARLA 0.9.14シミュレータ上で垂直および平行駐車のシナリオで本手法を検証する。
実験の結果, 平均位置誤差は0.21m, 方位誤差は0.41°であり, 96.57\%と高い成功率を示した。
アブレーション研究は、歩行者予測やゴールポイントアテンション融合といった重要なモジュールの有効性をさらに示している。
コードとデータセットは、https://github.com/little-snail-f/ParkFormerでリリースされる。
関連論文リスト
- ParkDiffusion: Heterogeneous Multi-Agent Multi-Modal Trajectory Prediction for Automated Parking using Diffusion Models [6.58562706945347]
ParkDiffusionは、自動駐車シナリオにおける車両と歩行者の両方の軌道を予測する新しいアプローチである。
ParkDiffusionは拡散モデルを用いて、将来の軌道の固有の不確実性と多モード性を捉える。
我々は,Dragon Lake ParkingデータセットとIntersections DroneデータセットのParkDiffusionを評価する。
論文 参考訳(メタデータ) (2025-05-01T15:16:59Z) - GPD-1: Generative Pre-training for Driving [77.06803277735132]
本稿では,これらすべてのタスクを実現するために,GPD-1(Generative Pre-Training for Driving)モデルを提案する。
それぞれのシーンをエゴ、エージェント、マップトークンで表現し、統一トークン生成問題として自律運転を定式化する。
GPD-1は、シーン生成、交通シミュレーション、クローズドループシミュレーション、マップ予測、モーションプランニングなど、微調整なしで様々なタスクに適応する。
論文 参考訳(メタデータ) (2024-12-11T18:59:51Z) - Planning with Adaptive World Models for Autonomous Driving [50.4439896514353]
マルチエージェントインタラクションをキャプチャする実世界のモーションプランニングベンチマークであるnuPlanを提案する。
我々は、グラフ畳み込みニューラルネットワーク(GCNN)であるBehaviorNetを用いて、このようなユニークな振る舞いをモデル化することを学ぶ。
また、モデル予測制御(MPC)ベースのプランナであるAdaptiveDriverについても紹介する。
論文 参考訳(メタデータ) (2024-06-15T18:53:45Z) - Online Calibration of a Single-Track Ground Vehicle Dynamics Model by Tight Fusion with Visual-Inertial Odometry [8.165828311550152]
視覚的慣性眼圧計(VIO)を用いた車輪付き地上車両の単トラックダイナミックスモデルに厳密に融合する新しいアプローチST-VIOを提案する。
提案手法は,将来的な制御入力における前方予測の精度を向上させるために,動的モデルをオンラインで校正し,適応する。
論文 参考訳(メタデータ) (2023-09-20T08:50:30Z) - Robust Autonomous Vehicle Pursuit without Expert Steering Labels [41.168074206046164]
車両追尾用エゴ車両の左右方向と縦方向の動作制御の学習法を提案する。
制御される車両は事前に定義された経路を持たず、安全距離を維持しながら目標車両を追尾するように反応的に適応する。
我々は、CARLAシミュレーターを用いて、幅広い地形における我々のアプローチを広範囲に検証した。
論文 参考訳(メタデータ) (2023-08-16T14:09:39Z) - Motion Planning and Control for Multi Vehicle Autonomous Racing at High
Speeds [100.61456258283245]
本稿では,自律走行のための多層移動計画と制御アーキテクチャを提案する。
提案手法はダララのAV-21レースカーに適用され、楕円形のレーストラックで25$m/s2$まで加速試験された。
論文 参考訳(メタデータ) (2022-07-22T15:16:54Z) - Control-Aware Prediction Objectives for Autonomous Driving [78.19515972466063]
本研究では,制御に対する予測の下流効果を評価するための制御認識予測目標(CAPOs)を提案する。
本稿では,エージェント間の注意モデルを用いた重み付けと,予測軌跡を接地真実軌跡に交換する際の制御変動に基づく重み付けの2つの方法を提案する。
論文 参考訳(メタデータ) (2022-04-28T07:37:21Z) - Detecting 32 Pedestrian Attributes for Autonomous Vehicles [103.87351701138554]
本稿では、歩行者を共同で検出し、32の歩行者属性を認識するという課題に対処する。
本稿では,複合フィールドフレームワークを用いたマルチタスク学習(MTL)モデルを提案する。
競合検出と属性認識の結果と,より安定したMTLトレーニングを示す。
論文 参考訳(メタデータ) (2020-12-04T15:10:12Z) - BayesRace: Learning to race autonomously using prior experience [20.64931380046805]
本稿では,自律走行のためのモデルベース計画制御フレームワークを提案する。
本手法は,車載センサ計測から学習することで,シミュレーションベースコントローラ設計によるギャップを軽減する。
論文 参考訳(メタデータ) (2020-05-10T19:15:06Z) - ParkPredict: Motion and Intent Prediction of Vehicles in Parking Lots [65.33650222396078]
我々は、駐車場環境を開発し、人間の駐車操作のデータセットを収集する。
本稿では,多モード長短期記憶(LSTM)予測モデルと畳み込みニューラルネットワークLSTM(CNN-LSTM)を物理ベースの拡張カルマンフィルタ(EKF)ベースラインと比較する。
以上の結果から,1) 意図をよく推定できる(LSTMとCNN-LSTMモデルによる約85% のトップ1精度と100% トップ3精度),2) 運転者の意図する駐車場所の知識が駐車軌跡の予測に大きく影響すること,3) 環境の意味的表現について考察した。
論文 参考訳(メタデータ) (2020-04-21T20:46:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。