論文の概要: MicroVision: An Open Dataset and Benchmark Models for Detecting Vulnerable Road Users and Micromobility Vehicles
- arxiv url: http://arxiv.org/abs/2603.18192v1
- Date: Wed, 18 Mar 2026 18:40:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-20 17:19:05.806829
- Title: MicroVision: An Open Dataset and Benchmark Models for Detecting Vulnerable Road Users and Micromobility Vehicles
- Title(参考訳): MicroVision: 脆弱性のある道路ユーザとマイクロモビリティ車両を検出するためのオープンデータセットとベンチマークモデル
- Authors: Alexander Rasch, Rahul Rajendra Pai,
- Abstract要約: このデータセットは、8000以上の匿名化フルHDイメージと30,000以上の慎重に注釈付けされたVRUとMMVで構成されている。
データセットとともに、最先端アーキテクチャに基づく最初のベンチマークオブジェクト検出モデルを提供します。
データセットとモデルはトラフィックの安全性をサポートし、異なるVRUとMMVを区別したり、監視システムがマイクロモビリティの使用を識別するのに役立つ。
- 参考スコア(独自算出の注目度): 47.428743285568174
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Micromobility is a growing mode of transportation, raising new challenges for traffic safety and planning due to increased interactions in areas where vulnerable road users (VRUs) share the infrastructure with micromobility, including parked micromobility vehicles (MMVs). Approaches to support traffic safety and planning increasingly rely on detecting road users in images -- a computer-vision task relying heavily on the quality of the images to train on. However, existing open image datasets for training such models lack focus and diversity in VRUs and MMVs, for instance, by categorizing both pedestrians and MMV riders as "person", or by not including new MMVs like e-scooters. Furthermore, datasets are often captured from a car perspective and lack data from areas where only VRUs travel (sidewalks, cycle paths). To help close this gap, we introduce the MicroVision dataset: an open image dataset and annotations for training and evaluating models for detecting the most common VRUs (pedestrians, cyclists, e-scooterists) and stationary MMVs (bicycles, e-scooters), from a VRU perspective. The dataset, recorded in Gothenburg (Sweden), consists of more than 8,000 anonymized, full-HD images with more than 30,000 carefully annotated VRUs and MMVs, captured over an entire year and part of almost 2,000 unique interaction scenes. Along with the dataset, we provide first benchmark object-detection models based on state-of-the-art architectures, which achieved a mean average precision of up to 0.723 on an unseen test set. The dataset and model can support traffic safety to distinguish between different VRUs and MMVs, or help monitoring systems identify the use of micromobility. The dataset and model weights can be accessed at https://doi.org/10.71870/eepz-jd52.
- Abstract(参考訳): マイクロモビリティ(Micromobility)は、交通の安全と計画のための新たな課題を提起し、脆弱な道路利用者(VRU)がマイクロモビリティー(MMV)を含むマイクロモビリティーのインフラを共有している地域での相互作用の増加に起因している。
交通の安全と計画を支援するアプローチは、画像中の道路利用者の検出にますます依存している。
しかし、そのようなモデルをトレーニングするための既存のオープンイメージデータセットは、例えば歩行者とMMVライダーの両方を「個人」に分類したり、eスクータのような新しいMMVを含まないことで、VRUやMMVの焦点と多様性を欠いている。
さらに、データセットは車の観点からキャプチャされることが多く、VRUのみを走行する領域(サイドウォーク、サイクルパス)のデータを欠いている。
このギャップを埋めるために、私たちはMicroVisionデータセットを紹介します:VRUの観点から最も一般的なVRU(歩行者、サイクリスト、eスクータリスト)と静止MMV(自転車、eスクータ)を検出するためのトレーニングと評価のためのオープンイメージデータセットとアノテーション。
Gothenburg(Sweden)に記録されているこのデータセットは、8000枚以上の匿名化されたフルHD画像と、3万枚以上の慎重に注釈付けされたVRUとMVで構成されており、一年間にわたって、2,000枚近いユニークなインタラクションシーンの一部となっている。
データセットとともに、最先端アーキテクチャに基づく最初のベンチマークオブジェクト検出モデルを提供し、未知のテストセットで平均0.723の精度を達成した。
データセットとモデルはトラフィックの安全性をサポートし、異なるVRUとMMVを区別したり、監視システムがマイクロモビリティの使用を識別するのに役立つ。
データセットとモデルウェイトはhttps://doi.org/10.71870/eepz-jd52でアクセスできる。
関連論文リスト
- HetroD: A High-Fidelity Drone Dataset and Benchmark for Autonomous Driving in Heterogeneous Traffic [49.31491001465465]
HetroDは、異種環境で自律走行システムを開発するためのデータセットとベンチマークである。
HetroDは、VRU(vulner- able road users)が支配する現実の異種交通のナビゲーティングにおける重要な課題をターゲットにしている。
論文 参考訳(メタデータ) (2026-02-03T12:12:47Z) - BikeActions: An Open Platform and Benchmark for Cyclist-Centric VRU Action Recognition [0.2339805471804333]
FUSE-Bikeは、その種の最初の完全にオープンな認識プラットフォームである。
BikeActionsは5つのアクションクラスにわたる852の注釈付きサンプルからなる、新しいマルチモーダルデータセットである。
我々は、公開されたデータ分割に基づいて、最先端のグラフ畳み込みとトランスフォーマーベースのモデルを評価することで、厳密なベンチマークを確立する。
論文 参考訳(メタデータ) (2026-01-15T15:47:46Z) - OnSiteVRU: A High-Resolution Trajectory Dataset for High-Density Vulnerable Road Users [41.63444034391952]
本研究は,交差点,道路セグメント,都市村など,様々なシナリオをカバーするOnSiteVRUデータセットを開発した。
データセットは、自動車、電動自転車、人力自転車の軌道データを提供し、約17,429の軌道を0.04秒精度で収集する。
その結果、VRU_DataはVRU密度とシーンカバレッジの点で従来のデータセットよりも優れており、VRUの行動特性をより包括的に表現できることがわかった。
論文 参考訳(メタデータ) (2025-03-30T08:44:55Z) - Leveraging Driver Field-of-View for Multimodal Ego-Trajectory Prediction [69.29802752614677]
RouteFormerは、GPSデータ、環境コンテキスト、運転者の視野を組み合わせた新しいエゴ軌道予測ネットワークである。
データ不足に対処し、多様性を高めるために、同期運転場と視線データに富んだ都市運転シナリオのデータセットであるGEMを導入する。
論文 参考訳(メタデータ) (2023-12-13T23:06:30Z) - SKoPe3D: A Synthetic Dataset for Vehicle Keypoint Perception in 3D from
Traffic Monitoring Cameras [26.457695296042903]
道路側から見たユニークな合成車両キーポイントデータセットであるSKoPe3Dを提案する。
SKoPe3Dには150万以上の車両インスタンスと490万のキーポイントがある。
実験では、データセットの適用性と、合成データと実世界のデータ間の知識伝達の可能性を強調した。
論文 参考訳(メタデータ) (2023-09-04T02:57:30Z) - Street-View Image Generation from a Bird's-Eye View Layout [95.36869800896335]
近年,Bird's-Eye View (BEV) の知覚が注目されている。
自動運転のためのデータ駆動シミュレーションは、最近の研究の焦点となっている。
本稿では,現実的かつ空間的に一貫した周辺画像を合成する条件生成モデルであるBEVGenを提案する。
論文 参考訳(メタデータ) (2023-01-11T18:39:34Z) - VehicleNet: Learning Robust Visual Representation for Vehicle
Re-identification [116.1587709521173]
我々は,4つのパブリックな車両データセットを活用することで,大規模車両データセット(VabyNet)を構築することを提案する。
VehicleNetからより堅牢な視覚表現を学習するための、シンプルで効果的な2段階プログレッシブアプローチを設計する。
AICity Challengeのプライベートテストセットにおいて,最先端の精度86.07%mAPを実現した。
論文 参考訳(メタデータ) (2020-04-14T05:06:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。