論文の概要: Dino-Diffusion Modular Designs Bridge the Cross-Domain Gap in Autonomous Parking
- arxiv url: http://arxiv.org/abs/2510.20335v1
- Date: Thu, 23 Oct 2025 08:35:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:17.622331
- Title: Dino-Diffusion Modular Designs Bridge the Cross-Domain Gap in Autonomous Parking
- Title(参考訳): 自律駐車におけるクロスドメインギャップを橋渡しする2次元拡散モジュール設計
- Authors: Zixuan Wu, Hengyuan Zhang, Ting-Hsuan Chen, Yuliang Guo, David Paz, Xinyu Huang, Liu Ren,
- Abstract要約: ディノ・ディフュージョン・パーキング(Dino-Diffusion Parking、DDP)は、ドメインに依存しない自動駐車パイプラインである。
私たちは、通常の設定でCARLAでパイプラインをトレーニングし、ゼロショット方式でより敵対的な設定に転送します。
本モデルでは,全テストアウト・オブ・ディストリビューション(OOD)シナリオにおいて,駐車成功率を90%以上達成している。
- 参考スコア(独自算出の注目度): 26.674757642181106
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Parking is a critical pillar of driving safety. While recent end-to-end (E2E) approaches have achieved promising in-domain results, robustness under domain shifts (e.g., weather and lighting changes) remains a key challenge. Rather than relying on additional data, in this paper, we propose Dino-Diffusion Parking (DDP), a domain-agnostic autonomous parking pipeline that integrates visual foundation models with diffusion-based planning to enable generalized perception and robust motion planning under distribution shifts. We train our pipeline in CARLA at regular setting and transfer it to more adversarial settings in a zero-shot fashion. Our model consistently achieves a parking success rate above 90% across all tested out-of-distribution (OOD) scenarios, with ablation studies confirming that both the network architecture and algorithmic design significantly enhance cross-domain performance over existing baselines. Furthermore, testing in a 3D Gaussian splatting (3DGS) environment reconstructed from a real-world parking lot demonstrates promising sim-to-real transfer.
- Abstract(参考訳): 駐車は運転安全の重要な柱である。
最近のエンドツーエンド(E2E)アプローチはドメイン内の有望な結果を達成したが、ドメインシフト(天気や照明の変更など)による堅牢性は依然として重要な課題である。
本稿では,DDP(Dino-Diffusion Parking)を提案する。DDP(Dino-Diffusion Parking)は,視覚基盤モデルと拡散型計画を統合し,分散シフト下での認知とロバストな動作計画を可能にする。
私たちは、通常の設定でCARLAでパイプラインをトレーニングし、ゼロショット方式でより敵対的な設定に転送します。
提案モデルでは,全テストアウト・オブ・ディストリビューション(OOD)シナリオにおけるパーキング成功率を90%以上連続的に達成し,ネットワークアーキテクチャとアルゴリズム設計の両方が既存のベースラインよりもクロスドメイン性能を大幅に向上させることを確認した。
さらに、現実世界の駐車場から再構築された3Dガウススプラッティング(3DGS)環境におけるテストは、シム・トゥ・リアル・トランスファーの有望さを示す。
関連論文リスト
- Cross-Modal Reconstruction Pretraining for Ramp Flow Prediction at Highway Interchanges [30.274689865122056]
STDAEは、クロスモーダルな再構築事前トレーニングを利用する2段階のフレームワークである。
STDAE-GWNETは13の最先端ベースラインを一貫して上回っている。
このことは、検出器の不足を克服する効果と、様々な予測パイプラインに対するプラグアンドプレイの可能性を示す。
論文 参考訳(メタデータ) (2025-10-03T15:26:56Z) - Advancing Real-World Parking Slot Detection with Large-Scale Dataset and Semi-Supervised Baseline [65.25540269603553]
本研究では,駐車環境を包括的に観察するサラウンドビューカメラを用いた駐車スロット検出に焦点を当てた。
まず,大規模駐車スロット検出データセット(CRPS-D)を構築した。
SS-PSDと呼ばれる駐車スロット検出のための半教師付きベースラインを開発し、ラベルのないデータを活用することにより、さらなる性能向上を図る。
論文 参考訳(メタデータ) (2025-09-16T14:50:19Z) - Parking Availability Prediction via Fusing Multi-Source Data with A Self-Supervised Learning Enhanced Spatio-Temporal Inverted Transformer [6.779236767393988]
本研究では,SST-iTransformerを用いた交通需要特性の抽出・統合手法を提案する。
中国・成都の現実世界のデータを用いた実験では、SST-iTransformerがディープラーニングモデルより優れていることが示されている。
論文 参考訳(メタデータ) (2025-09-04T16:22:29Z) - ParkDiffusion: Heterogeneous Multi-Agent Multi-Modal Trajectory Prediction for Automated Parking using Diffusion Models [6.58562706945347]
ParkDiffusionは、自動駐車シナリオにおける車両と歩行者の両方の軌道を予測する新しいアプローチである。
ParkDiffusionは拡散モデルを用いて、将来の軌道の固有の不確実性と多モード性を捉える。
我々は,Dragon Lake ParkingデータセットとIntersections DroneデータセットのParkDiffusionを評価する。
論文 参考訳(メタデータ) (2025-05-01T15:16:59Z) - DriveTransformer: Unified Transformer for Scalable End-to-End Autonomous Driving [62.62464518137153]
DriveTransformerは、スケールアップを簡単にするためのシンプルなE2E-ADフレームワークである。
タスク・セルフ・アテンション、センサー・クロス・アテンション、時間的クロス・アテンションという3つの統合された操作で構成されている。
シミュレーションされたクローズドループベンチマークBench2Driveと、FPSの高い実世界のオープンループベンチマークnuScenesの両方で、最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-03-07T11:41:18Z) - Towards Intelligent Transportation with Pedestrians and Vehicles In-the-Loop: A Surveillance Video-Assisted Federated Digital Twin Framework [62.47416496137193]
本稿では,歩行者や車いすによるITSを支援するための監視ビデオ支援型デジタルツイン(SV-FDT)フレームワークを提案する。
i)複数のソースからトラフィック監視ビデオを収集するエンドレイヤ、(ii)セマンティックセグメンテーションに基づく視覚理解、ツインエージェントベースのインタラクションモデリング、およびローカルデジタルツインシステム(LDTS)をローカルで作成するエッジレイヤ、(iii)異なるリージョンにわたるLDTSを統合してグローバルDTモデルをリアルタイムで構築するクラウドレイヤの3層で構成されている。
論文 参考訳(メタデータ) (2025-03-06T07:36:06Z) - DiFSD: Ego-Centric Fully Sparse Paradigm with Uncertainty Denoising and Iterative Refinement for Efficient End-to-End Self-Driving [55.53171248839489]
我々は、エンドツーエンドの自動運転のためのエゴ中心の完全スパースパラダイムであるDiFSDを提案する。
特に、DiFSDは主にスパース知覚、階層的相互作用、反復的な運動プランナーから構成される。
nuScenesとBench2Driveデータセットで実施された実験は、DiFSDの優れた計画性能と優れた効率を実証している。
論文 参考訳(メタデータ) (2024-09-15T15:55:24Z) - LiDAR-based Panoptic Segmentation via Dynamic Shifting Network [56.71765153629892]
LiDARベースのパノプティカルセグメンテーションは、オブジェクトとシーンを統一的に解析することを目的としている。
本稿では,ポイントクラウド領域における効果的な単視分割フレームワークとして機能する動的シフトネットワーク(DS-Net)を提案する。
提案するDS-Netは,現在の最先端手法よりも優れた精度を実現する。
論文 参考訳(メタデータ) (2020-11-24T08:44:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。