論文の概要: AID4AD: Aerial Image Data for Automated Driving Perception
- arxiv url: http://arxiv.org/abs/2508.02140v1
- Date: Mon, 04 Aug 2025 07:38:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-05 18:25:22.228392
- Title: AID4AD: Aerial Image Data for Automated Driving Perception
- Title(参考訳): AID4AD:自動走行知覚のための航空画像データ
- Authors: Daniel Lengerer, Mathias Pechinger, Klaus Bogenberger, Carsten Markgraf,
- Abstract要約: AID4ADは、局所座標系に正確に整合した高解像度の空中画像でnuScenesを増強するデータセットである。
航空画像は, 地図構築精度が15~23%向上し, 軌道予測性能が2%向上したことを示す。
その結果,自動走行車システムにおける環境コンテキストのスケーラブルで適応可能な源として,航空画像の可能性を浮き彫りにした。
- 参考スコア(独自算出の注目度): 1.5749416770494704
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This work investigates the integration of spatially aligned aerial imagery into perception tasks for automated vehicles (AVs). As a central contribution, we present AID4AD, a publicly available dataset that augments the nuScenes dataset with high-resolution aerial imagery precisely aligned to its local coordinate system. The alignment is performed using SLAM-based point cloud maps provided by nuScenes, establishing a direct link between aerial data and nuScenes local coordinate system. To ensure spatial fidelity, we propose an alignment workflow that corrects for localization and projection distortions. A manual quality control process further refines the dataset by identifying a set of high-quality alignments, which we publish as ground truth to support future research on automated registration. We demonstrate the practical value of AID4AD in two representative tasks: in online map construction, aerial imagery serves as a complementary input that improves the mapping process; in motion prediction, it functions as a structured environmental representation that replaces high-definition maps. Experiments show that aerial imagery leads to a 15-23% improvement in map construction accuracy and a 2% gain in trajectory prediction performance. These results highlight the potential of aerial imagery as a scalable and adaptable source of environmental context in automated vehicle systems, particularly in scenarios where high-definition maps are unavailable, outdated, or costly to maintain. AID4AD, along with evaluation code and pretrained models, is publicly released to foster further research in this direction: https://github.com/DriverlessMobility/AID4AD.
- Abstract(参考訳): 本研究では,自動走行車(AV)の認識タスクに空間的に整列した空中画像の統合について検討する。
中心的なコントリビューションとして、我々は、nuScenesデータセットを局所座標系に正確に整合した高解像度の空中画像で拡張する、公開データセットであるAID4ADを提示する。
このアライメントは、nuScenesが提供するSLAMベースのポイントクラウドマップを使用して行われ、空中データとnuScenesローカル座標系との直接リンクを確立する。
空間的忠実性を確保するために,局所化と投影歪みを補正するアライメントワークフローを提案する。
手動品質管理プロセスは、高品質なアライメントのセットを特定してデータセットをさらに洗練させ、自動登録に関する将来の研究を支援するために、基礎的な真実として公開する。
オンライン地図構築においては、航空画像はマッピングプロセスを改善する補完的な入力として機能し、動き予測では高解像度地図を置き換える構造的環境表現として機能する。
実験により、航空画像は地図構築精度が15~23%向上し、軌道予測性能が2%向上することが示された。
これらの結果は、特に高解像度マップが利用できない場合、時代遅れである場合、またはメンテナンスにコストがかかる場合において、航空画像が自動車両システムにおけるスケーラブルで適応可能な環境コンテキストの源としての可能性を強調している。
AID4ADは、評価コードと事前訓練されたモデルとともに、この方向性に関するさらなる研究を促進するために、公開された。
関連論文リスト
- Adapting Vehicle Detectors for Aerial Imagery to Unseen Domains with Weak Supervision [46.87579355047397]
本稿では,高品質な空中画像とそのラベルを生成AIで合成する手法を提案する。
私たちの重要な貢献は、多段階のマルチモーダルな知識伝達フレームワークの開発です。
論文 参考訳(メタデータ) (2025-07-28T16:38:06Z) - Neural Semantic Map-Learning for Autonomous Vehicles [85.8425492858912]
本稿では,道路環境のコヒーレントな地図を作成するために,車両群から収集した局所部分写像を中心インスタンスに融合するマッピングシステムを提案する。
本手法は,シーン特異的なニューラルサイン距離場を用いて,雑音と不完全局所部分写像を併用する。
我々は,記憶効率の高いスパース機能グリッドを活用して大規模にスケールし,シーン再構築における不確実性をモデル化するための信頼スコアを導入する。
論文 参考訳(メタデータ) (2024-10-10T10:10:03Z) - Radio Map Prediction from Aerial Images and Application to Coverage Optimization [46.870065000932016]
畳み込みニューラルネットワークを用いた経路損失無線マップの予測に着目する。
既存の無線地図データセットに対して開発された最先端モデルがこの課題に効果的に適応できることを示す。
UNetDCNと呼ばれる新しいモデルを導入し、複雑さを低減した最先端モデルと比較して、同等以上の性能を実現した。
論文 参考訳(メタデータ) (2024-10-07T09:19:20Z) - TK-Planes: Tiered K-Planes with High Dimensional Feature Vectors for Dynamic UAV-based Scenes [58.180556221044235]
本研究では,無人航空機(UAV)の認識における合成データと実世界データとの領域ギャップを埋める新しい手法を提案する。
私たちの定式化は、小さな動く物体や人間の行動からなる動的なシーンのために設計されています。
我々は,Okutama ActionやUG2など,挑戦的なデータセットの性能を評価する。
論文 参考訳(メタデータ) (2024-05-04T21:55:33Z) - Uncertainty-aware Vision-based Metric Cross-view Geolocalization [25.87104194833264]
地上画像と空中画像を用いて車両のポーズの確率分布を予測するエンド・ツー・エンドの微分モデルを提案する。
テストエリアからの地上データや空中データなしでも、最先端の技術を大きなマージンで改善する。
論文 参考訳(メタデータ) (2022-11-22T10:23:20Z) - Towards Scale Consistent Monocular Visual Odometry by Learning from the
Virtual World [83.36195426897768]
仮想データから絶対スケールを取得するための新しいフレームワークであるVRVOを提案する。
まず、モノクロ実画像とステレオ仮想データの両方を用いて、スケール対応の異種ネットワークをトレーニングする。
結果として生じるスケール一貫性の相違は、直接VOシステムと統合される。
論文 参考訳(メタデータ) (2022-03-11T01:51:54Z) - Continuous Self-Localization on Aerial Images Using Visual and Lidar
Sensors [25.87104194833264]
本研究では,車両のセンサ情報を未確認対象領域の航空画像に登録することにより,屋外環境におけるジオトラッキング手法を提案する。
我々は、地上および空中画像から視覚的特徴を抽出するために、計量学習環境でモデルを訓練する。
本手法は,視認不可能な正光の自己局在化のために,エンド・ツー・エンドの微分可能なモデルでオンボードカメラを利用する最初の方法である。
論文 参考訳(メタデータ) (2022-03-07T12:25:44Z) - Real-time Geo-localization Using Satellite Imagery and Topography for
Unmanned Aerial Vehicles [18.71806336611299]
本稿では,UAV上の軽量組込みシステムにおいて,シーン変更と実用性に信頼性のあるフレームワークを提案する。
このフレームワークは、オフラインデータベースの準備とオンライン推論の2つのステージで構成されている。
2つの異なるUAVプラットフォーム上でのイメージベースローカライゼーションのフィールド実験を行い、その結果を検証した。
論文 参考訳(メタデータ) (2021-08-07T01:47:19Z) - Radar-based Dynamic Occupancy Grid Mapping and Object Detection [55.74894405714851]
近年、古典的占有グリッドマップのアプローチが動的占有グリッドマップに拡張されている。
本稿では,従来のアプローチのさらなる発展について述べる。
複数のレーダセンサのデータを融合し、グリッドベースの物体追跡・マッピング手法を適用する。
論文 参考訳(メタデータ) (2020-08-09T09:26:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。