論文の概要: TransParking: A Dual-Decoder Transformer Framework with Soft Localization for End-to-End Automatic Parking
- arxiv url: http://arxiv.org/abs/2503.06071v1
- Date: Sat, 08 Mar 2025 05:41:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-11 15:49:28.956413
- Title: TransParking: A Dual-Decoder Transformer Framework with Soft Localization for End-to-End Automatic Parking
- Title(参考訳): TransParking: エンドツーエンド自動パーキングのためのソフトローカライゼーションを備えたデュアルデコーダトランスフォーマーフレームワーク
- Authors: Hangyu Du, Chee-Meng Chew,
- Abstract要約: 本稿では,専門的軌跡を用いて訓練したエンドツーエンド自動駐車のための視覚ベーストランスフォーマーモデルを提案する。
実験結果から, モデルの誤差は50%程度減少していることがわかった。
- 参考スコア(独自算出の注目度): 2.209921757303168
- License:
- Abstract: In recent years, fully differentiable end-to-end autonomous driving systems have become a research hotspot in the field of intelligent transportation. Among various research directions, automatic parking is particularly critical as it aims to enable precise vehicle parking in complex environments. In this paper, we present a purely vision-based transformer model for end-to-end automatic parking, trained using expert trajectories. Given camera-captured data as input, the proposed model directly outputs future trajectory coordinates. Experimental results demonstrate that the various errors of our model have decreased by approximately 50% in comparison with the current state-of-the-art end-to-end trajectory prediction algorithm of the same type. Our approach thus provides an effective solution for fully differentiable automatic parking.
- Abstract(参考訳): 近年では、完全差別化可能なエンドツーエンドの自動運転システムがインテリジェント交通分野のホットスポットとして研究されている。
様々な研究の方向性の中で、複雑な環境で正確な車両駐車を可能にすることを目的として、自動駐車が特に重要である。
本稿では,専門的軌跡を用いて訓練したエンドツーエンド自動駐車のための純粋視覚に基づくトランスフォーマーモデルを提案する。
カメラが捉えたデータを入力として、提案モデルは将来の軌跡座標を直接出力する。
実験結果から,本モデルにおける種々の誤差は,現在最先端の軌跡予測アルゴリズムと比較して約50%減少していることがわかった。
そこで本手法は,完全微分可能な自動駐車のための効果的なソリューションを提供する。
関連論文リスト
- Spatial Temporal Attention based Target Vehicle Trajectory Prediction for Internet of Vehicles [4.1268583353286]
本研究は、車両軌道予測ターゲット(VTPred)の時空間注意に基づく手法を提案する。
車両軌道を向き付けられたグラフにマッピングし、その後、グラフ注意ネットワーク(GAT)を介して空間特性を抽出する。
トランスフォーマー技術は、シーケンスから時間的特徴を得るために使われ、正確な軌道予測をもたらす。
論文 参考訳(メタデータ) (2025-01-01T16:37:24Z) - DiFSD: Ego-Centric Fully Sparse Paradigm with Uncertainty Denoising and Iterative Refinement for Efficient End-to-End Self-Driving [55.53171248839489]
我々は、エンドツーエンドの自動運転のためのエゴ中心の完全スパースパラダイムであるDiFSDを提案する。
特に、DiFSDは主にスパース知覚、階層的相互作用、反復的な運動プランナーから構成される。
nuScenesとBench2Driveデータセットで実施された実験は、DiFSDの優れた計画性能と優れた効率を実証している。
論文 参考訳(メタデータ) (2024-09-15T15:55:24Z) - ParkingE2E: Camera-based End-to-end Parking Network, from Images to Planning [7.034120265476802]
伝統的な駐車アルゴリズムは通常ルールベースのスキームを使って実装される。
ニューラルネットワークベースの手法はルールベースの手法よりも直感的で汎用性が高い傾向にある。
本稿では,人間の運転軌跡を模倣して,RGB画像から経路計画までのエンド・ツー・エンド・プランニングを行うために模倣学習を用いる。
提案手法は4つの現実世界のガレージで平均87.8%のパーキング成功率を達成した。
論文 参考訳(メタデータ) (2024-08-04T15:20:39Z) - Automated Parking Planning with Vision-Based BEV Approach [10.936433798200907]
本稿では,A*アルゴリズムに基づく自動駐車アルゴリズムの改良,車両運動モデルの統合,機能最適化,双方向探索,ベジエ曲線最適化を提案する。
従来のアルゴリズムと比較して、より困難な衝突リスクテストケースで計算時間を短縮し、快適なメトリクスのパフォーマンスを向上させる。
論文 参考訳(メタデータ) (2024-05-24T15:26:09Z) - Leverage Multi-source Traffic Demand Data Fusion with Transformer Model for Urban Parking Prediction [4.672121078249809]
本研究では,空間時間深層学習とマルチソースデータ融合を組み合わせた駐車予測フレームワークを提案する。
このフレームワークは、時空間深層学習モデルとしてのTransformerに基づいている。
実世界の実証データを用いて,提案手法の有効性を検証した。
論文 参考訳(メタデータ) (2024-05-02T07:28:27Z) - AIDE: An Automatic Data Engine for Object Detection in Autonomous Driving [68.73885845181242]
本稿では,問題を自動的に識別し,データを効率よくキュレートし,自動ラベル付けによりモデルを改善する自動データエンジン(AIDE)を提案する。
さらに,AVデータセットのオープンワールド検出のためのベンチマークを構築し,様々な学習パラダイムを包括的に評価し,提案手法の優れた性能を低コストで実証する。
論文 参考訳(メタデータ) (2024-03-26T04:27:56Z) - Automated Automotive Radar Calibration With Intelligent Vehicles [73.15674960230625]
本稿では,自動車用レーダセンサの自動校正手法を提案する。
本手法では, 車両の外部改造を必要とせず, 自動走行車から得られる位置情報を利用する。
実地試験場からのデータを評価した結果,インフラセンサを自動で正確に校正できることが判明した。
論文 参考訳(メタデータ) (2023-06-23T07:01:10Z) - Exploring Contextual Representation and Multi-Modality for End-to-End
Autonomous Driving [58.879758550901364]
最近の知覚システムは、センサー融合による空間理解を高めるが、しばしば完全な環境コンテキストを欠いている。
我々は,3台のカメラを統合し,人間の視野をエミュレートするフレームワークを導入し,トップダウンのバードアイビューセマンティックデータと組み合わせて文脈表現を強化する。
提案手法は, オープンループ設定において0.67mの変位誤差を達成し, nuScenesデータセットでは6.9%の精度で現在の手法を上回っている。
論文 参考訳(メタデータ) (2022-10-13T05:56:20Z) - ParkPredict+: Multimodal Intent and Motion Prediction for Vehicles in
Parking Lots with CNN and Transformer [11.287187018907284]
本稿では,駐車場における人間駆動車両の多目的意図と軌道予測について述べる。
CNNとTransformerネットワークで設計したモデルを用いて,時間空間的・文脈的な情報を軌跡履歴や鳥の視線意味画像から抽出する。
提案手法は,任意のモードを許容しながら,既存のモデルよりも精度が高い。
さらに,駐車場において,高解像度でリッチな交通シナリオを備えた最初の一般人運転データセットを提示する。
論文 参考訳(メタデータ) (2022-04-17T01:54:25Z) - Model-based Decision Making with Imagination for Autonomous Parking [50.41076449007115]
提案アルゴリズムは,駐車前に結果を予測するための想像モデル,高速探索ランダムツリー(RRT)の改良,経路平滑化モジュールの3つの部分から構成される。
われわれのアルゴリズムは、実際のキネマティックな車両モデルに基づいており、実際の自動運転車にアルゴリズムを適用するのにより適している。
アルゴリズムの有効性を評価するため,3つの異なる駐車シナリオにおいて,従来のRTとアルゴリズムを比較した。
論文 参考訳(メタデータ) (2021-08-25T18:24:34Z) - ParkPredict: Motion and Intent Prediction of Vehicles in Parking Lots [65.33650222396078]
我々は、駐車場環境を開発し、人間の駐車操作のデータセットを収集する。
本稿では,多モード長短期記憶(LSTM)予測モデルと畳み込みニューラルネットワークLSTM(CNN-LSTM)を物理ベースの拡張カルマンフィルタ(EKF)ベースラインと比較する。
以上の結果から,1) 意図をよく推定できる(LSTMとCNN-LSTMモデルによる約85% のトップ1精度と100% トップ3精度),2) 運転者の意図する駐車場所の知識が駐車軌跡の予測に大きく影響すること,3) 環境の意味的表現について考察した。
論文 参考訳(メタデータ) (2020-04-21T20:46:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。