論文の概要: BMD-45: A Large-Scale CCTV Vehicle Detection Dataset for Urban Traffic in Developing Cities
- arxiv url: http://arxiv.org/abs/2604.24419v1
- Date: Mon, 27 Apr 2026 12:49:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:08.006266
- Title: BMD-45: A Large-Scale CCTV Vehicle Detection Dataset for Urban Traffic in Developing Cities
- Title(参考訳): BMD-45:都市開発における都市交通のための大規模CCTV車両検出データセット
- Authors: Akash Sharma, Chinmay Mhatre, Sankalp Gawali, Ruthvik Bokkasam, Brij Sharma, Vishwajeet Pattanaik, Punit Rathore, Raghu Krishnapuram, Vijay Gopal Kovvali, Anirban Chakraborty, Yogesh Simmhan,
- Abstract要約: CCTVの固定カメラからの車両検出は、インテリジェントトランスポーテーションシステムにとって重要である。
既存のベンチマークは主に、エゴ中心の運転視点や制御された航空ビューから捉えた比較的均質で高度に組織化された交通パターンを特徴としている。
BMD-45は、480Kのバウンディングボックスからなる大規模データセットで、3.6K以上のSafe City CCTVカメラから撮影された45K画像に注釈を付けている。
UA-DETRACで微調整されたモデルでは33.6%のmAP@0.50:0.95しか達成できないが、ドメイン上でのトレーニングでは83.8%であった。
- 参考スコア(独自算出の注目度): 5.530813453311619
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Robust vehicle detection from fixed CCTV cameras is critical for Intelligent Transportation Systems. Yet existing benchmarks predominantly feature relatively homogeneous, highly organized traffic patterns captured from ego-centric driving perspectives or controlled aerial views. This regional and sensor view bias creates a significant gap. Models trained on datasets such as UA-DETRAC and COCO struggle to generalize to the dense, heterogeneous, disorganized traffic conditions observed in rapidly developing urban centers in emerging economies. To address this limitation, we introduce BMD-45, a large-scale dataset comprising 480K bounding boxes annotated over 45K images captured from over 3.6K operational Safe City CCTV cameras. BMD-45 contains 14 fine-grained vehicle categories, including region-specific modes such as auto-rickshaws and tempo travellers, which are not present in existing benchmarks. The dataset captures real-world deployment challenges, including extreme viewpoint variation, occlusion, and vehicle density . We establish comprehensive baselines using state-of-the-art detectors and reveal a striking domain gap: models fine-tuned on UA-DETRAC achieve only 33.6% mAP@0.50:0.95, compared to 83.8% when trained in-domain on BMD-45, representing a 2.5x improvement that persists even when accounting for novel vehicle classes. This performance gap underscores the critical need for geographically diverse traffic benchmarks and establishes BMD-45 as a baseline for developing robust perception systems in underrepresented urban environments worldwide. The dataset is available at: https://huggingface.co/datasets/iisc-aim/BMD-45.
- Abstract(参考訳): CCTVの固定カメラからのロバストな車両検出は、インテリジェントトランスポーテーションシステムにとって重要である。
しかし、既存のベンチマークは主に、エゴ中心の運転視点や制御された空中視点から捉えた比較的均質で、高度に組織化された交通パターンを特徴としている。
この地域的およびセンサー的ビューバイアスは、大きなギャップを生み出します。
UA-DETRACやCOCOといったデータセットで訓練されたモデルは、新興国で急速に発展している都市の中心で観測される密集的で異質で非組織的な交通条件に一般化するために苦労している。
この制限に対処するため,3.6K以上のSafe City CCTVカメラから取得した45K以上の画像に注釈を付けた480Kのバウンディングボックスからなる大規模データセットであるBMD-45を導入する。
BMD-45には14の細かな車種が含まれており、例えばオートリカーやテンポトラベラーのような地域固有のモードは既存のベンチマークには存在しない。
このデータセットは、極端な視点の変化、閉塞、車両密度など、現実世界のデプロイメントの課題をキャプチャする。
UA-DETRACで微調整されたモデルでは33.6% mAP@0.50:0.95しか達成できないが、BMD-45でトレーニングされたドメインでは83.8%に留まり、新しい車種を考慮しても2.5倍の改善が持続する。
この性能差は、地理的に多様な交通指標の必要性を浮き彫りにし、世界規模で表現されていない都市環境において、堅牢な認識システムを開発するためのベースラインとしてBMD-45を確立している。
データセットは以下の通りである。 https://huggingface.co/datasets/iisc-aim/BMD-45。
関連論文リスト
- HetroD: A High-Fidelity Drone Dataset and Benchmark for Autonomous Driving in Heterogeneous Traffic [49.31491001465465]
HetroDは、異種環境で自律走行システムを開発するためのデータセットとベンチマークである。
HetroDは、VRU(vulner- able road users)が支配する現実の異種交通のナビゲーティングにおける重要な課題をターゲットにしている。
論文 参考訳(メタデータ) (2026-02-03T12:12:47Z) - Evaluating YOLO Architectures: Implications for Real-Time Vehicle Detection in Urban Environments of Bangladesh [0.0]
非バングラデシュのデータセットで訓練された車両検知システムは、バングラデシュのユニークな道路環境において、地元の車両のタイプを正確に識別するのに苦労している。
本研究は、29の異なる車両クラスを特徴とするカスタムデータセット上で、6つのYOLOモデル変異を評価した。
論文 参考訳(メタデータ) (2025-09-06T09:11:44Z) - AGC-Drive: A Large-Scale Dataset for Real-World Aerial-Ground Collaboration in Driving Scenarios [68.84774511206797]
AGC-DriveはAerial-Ground Cooperativeの3D知覚のための最初の大規模実世界のデータセットである。
AGC-Driveには350のシーンがあり、それぞれ約100のフレームと13のオブジェクトカテゴリをカバーする完全な注釈付き3Dバウンディングボックスがある。
車両間協調認識と車両間協調認識の2つの3次元タスクのベンチマークを提供する。
論文 参考訳(メタデータ) (2025-06-19T14:48:43Z) - VME: A Satellite Imagery Dataset and Benchmark for Detecting Vehicles in the Middle East and Beyond [9.576056095537563]
衛星画像における車両検出は、交通管理、都市計画、災害対応に不可欠である。
現在のモデルは、特に地域によって、現実世界の多様性に苦しむ。
我々は、中東諸国の高解像度衛星画像において、車両検出のために明確に設計された、中東における車両(VME)データセットを提示する。
論文 参考訳(メタデータ) (2025-05-28T13:34:05Z) - Advanced computer vision for extracting georeferenced vehicle trajectories from drone imagery [4.387337528923525]
本稿では,高高度ドローン画像からジオレファレンス車両軌跡を抽出する枠組みを提案する。
研究は韓国のソンド国際事業地区で行われた。
論文 参考訳(メタデータ) (2024-11-04T14:49:01Z) - RoboSense: Large-scale Dataset and Benchmark for Egocentric Robot Perception and Navigation in Crowded and Unstructured Environments [62.5830455357187]
我々は3種類のセンサー(Camera, LiDAR, Fisheye)をベースとした自我中心型マルチセンサデータ収集プラットフォームを構築した。
大規模なマルチモーダルデータセットであるRoboSenseは、エゴセントリックなロボット知覚を促進するために構築されている。
論文 参考訳(メタデータ) (2024-08-28T03:17:40Z) - BoMuDANet: Unsupervised Adaptation for Visual Scene Understanding in
Unstructured Driving Environments [54.22535063244038]
非構造交通環境における視覚的シーン理解のための教師なし適応手法を提案する。
本手法は,車,トラック,二輪車,三輪車,歩行者からなる密集・異種交通を伴う非構造現実シナリオを対象としたものである。
論文 参考訳(メタデータ) (2020-09-22T08:25:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。