論文の概要: A global dataset of continuous urban dashcam driving
- arxiv url: http://arxiv.org/abs/2604.01044v1
- Date: Wed, 01 Apr 2026 15:52:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-02 16:44:32.071093
- Title: A global dataset of continuous urban dashcam driving
- Title(参考訳): 連続型都市ダッシュカム運転のグローバルデータセット
- Authors: Md Shadab Alam, Olena Bazilinska, Pavlo Bazilinskyy,
- Abstract要約: CROWDは、通常の、微小なスケール、時間的に連続した、未編集の、フロント対面の都市ダッシュカムセグメントの、手動でキュレートされたデータセットである。
このリリースには、20,275.56時間 (42,032ビデオ) にまたがる51,753のセグメンテーション記録が含まれており、238か国に7,103の名前を冠している。
- 参考スコア(独自算出の注目度): 0.34757790689654594
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce CROWD (City Road Observations With Dashcams), a manually curated dataset of ordinary, minute scale, temporally contiguous, unedited, front facing urban dashcam segments screened and segmented from publicly available YouTube videos. CROWD is designed to support cross-domain robustness and interaction analysis by prioritising routine driving and explicitly excluding crashes, crash aftermath, and other edited or incident-focused content. The release contains 51,753 segment records spanning 20,275.56 hours (42,032 videos), covering 7,103 named inhabited places in 238 countries and territories across all six inhabited continents (Africa, Asia, Europe, North America, South America and Oceania), with segment level manual labels for time of day (day or night) and vehicle type. To lower the barrier for benchmarking, we provide per-segment CSV files of machine-generated detections for all 80 MS-COCO classes produced with YOLOv11x, together with segment-local multi-object tracks (BoT-SORT); e.g. person, bicycle, motorcycle, car, bus, truck, traffic light, stop sign, etc. CROWD is distributed as video identifiers with segment boundaries and derived annotations, enabling reproducible research without redistributing the underlying videos.
- Abstract(参考訳): CROWD (City Road Observations With Dashcams) は、通常の、微小なスケール、時間的に連続した、編集されていない、正面に面した都市ダッシュカムのセグメントを、公開しているYouTubeビデオからプレビューし、セグメント化した、手動でキュレートしたデータセットである。
CROWDは、定期運転を優先し、クラッシュ、クラッシュの余波、その他の編集やインシデントに焦点を当てたコンテンツを明示的に排除することで、ドメイン間の堅牢性と相互作用の分析をサポートするように設計されている。
このリリースには、20,275.56時間 (42,032ビデオ) にまたがる51,753のセグメンテーション記録が含まれており、そのうち7,103件は238か国に居住し、6つの大陸(アフリカ、アジア、ヨーロッパ、北アメリカ、南アメリカ、オセアニア)にまたがる7,103件の名前を冠している。
ベンチマークの障壁を低くするため, YOLOv11xで生成した80のMS-COCOクラスに対して, セグメントローカルな多目的トラック(BoT-SORT)とともに, マシン生成によるCSVファイルを生成する。
CROWDはセグメント境界と派生アノテーションを持つビデオ識別子として配布され、ビデオを再配布することなく再現可能な研究を可能にする。
関連論文リスト
- Road Obstacle Video Segmentation [71.92123495914892]
連続フレームのセグメンテーションマップは強く相関しているため,道路・障害物のセグメンテーションタスクは本質的に時間的であることを示す。
提案手法は、長距離ビデオシーケンスのための道路障害物ビデオセグメント化における最先端技術を確立している。
論文 参考訳(メタデータ) (2025-09-16T15:34:43Z) - RoundaboutHD: High-Resolution Real-World Urban Environment Benchmark for Multi-Camera Vehicle Tracking [2.1947594726633324]
RoundaboutHDは高解像度のマルチカメラ車両追跡ベンチマークデータセットである。
時間的一貫性のあるビデオ映像と、課題の強化を提供する。
車両検出、単一カメラ追跡、画像に基づく車両再識別、マルチカメラ追跡のためのベースライン結果を提供する。
論文 参考訳(メタデータ) (2025-07-11T16:30:27Z) - AGC-Drive: A Large-Scale Dataset for Real-World Aerial-Ground Collaboration in Driving Scenarios [68.84774511206797]
AGC-DriveはAerial-Ground Cooperativeの3D知覚のための最初の大規模実世界のデータセットである。
AGC-Driveには350のシーンがあり、それぞれ約100のフレームと13のオブジェクトカテゴリをカバーする完全な注釈付き3Dバウンディングボックスがある。
車両間協調認識と車両間協調認識の2つの3次元タスクのベンチマークを提供する。
論文 参考訳(メタデータ) (2025-06-19T14:48:43Z) - OpenLKA: An Open Dataset of Lane Keeping Assist from Recent Car Models under Real-world Driving Conditions [20.715128998923852]
Lane Keeping Assist (LKA) は現代の車両で広く採用されているが、実際の性能はプロプライエタリなシステムと限られたデータアクセスのために未探索のままである。
本稿では,LKA評価と改善のためのオープンかつ大規模データセットOpenLKAを提案する。
論文 参考訳(メタデータ) (2025-05-14T02:53:50Z) - Video Individual Counting for Moving Drones [51.429771128144964]
ビデオ・パーソナライズ・カウンティング(VIC)は、インテリジェント・ビデオ監視の重要性から注目を集めている。
以前のデータセットは、比較的まばらな個人で固定または稀に動くカメラでキャプチャされ、混雑したシーンでの高度に異なるビューと時間の評価を制限する。
これらの問題に対処するために、私たちはMovingDroneCrowdデータセットを導入しました。
論文 参考訳(メタデータ) (2025-03-12T07:09:33Z) - DAVE: Diverse Atomic Visual Elements Dataset with High Representation of Vulnerable Road Users in Complex and Unpredictable Environments [60.69159598130235]
Vulnerable Road Users (VRU) の高表現による認識手法の評価を目的とした新しいデータセット DAVE を提案する。
DAVEは16種類のアクターカテゴリー(動物、人間、車など)と16種類のアクションタイプ(カットイン、ジグザグ運動、Uターンなど、複雑で稀なケース)を手動でアノテートしたデータセットである。
実験の結果,既存の手法はDAVEで評価すると性能の劣化に悩まされ,将来的なビデオ認識研究のメリットを浮き彫りにしていることがわかった。
論文 参考訳(メタデータ) (2024-12-28T06:13:44Z) - The 8th AI City Challenge [57.25825945041515]
2024年版では5トラックが収録され、47か国と地域の726チームから前例のない関心を集めた。
このチャレンジでは、2つのリーダーボードを使ってメソッドを展示し、参加者は新しいベンチマークを設定した。
論文 参考訳(メタデータ) (2024-04-15T03:12:17Z) - The Interstate-24 3D Dataset: a new benchmark for 3D multi-camera
vehicle tracking [4.799822253865053]
本研究は,道路交通カメラの重なり合う都市州間高速道路に沿って記録された新しい映像データセットを提示し,交通監視状況下でのマルチカメラ3Dオブジェクト追跡を可能にする。
データは、少なくとも16台のカメラのビデオを含む3つのシーンから解放され、合計で57分である。
877,000個の3Dバウンディングボックスと対応するオブジェクトトラックレットは、各カメラの視野に対して完全に正確に注釈付けされ、各シーンごとに空間的かつ時間的に連続した車両軌跡セットに結合される。
論文 参考訳(メタデータ) (2023-08-28T18:43:33Z) - Argoverse 2: Next Generation Datasets for Self-Driving Perception and
Forecasting [64.7364925689825]
Argoverse 2(AV2)は、自動運転分野の研究の知覚と予測のための3つのデータセットの集合である。
Lidarデータセットには、ラベルなしのLidar点雲とマップ整列ポーズの2万のシーケンスが含まれている。
Motion Forecastingデータセットには、各ローカルシーンにおける自動運転車と他のアクター間の興味深い、挑戦的なインタラクションのために採掘された25万のシナリオが含まれている。
論文 参考訳(メタデータ) (2023-01-02T00:36:22Z) - Synthehicle: Multi-Vehicle Multi-Camera Tracking in Virtual Cities [4.4855664250147465]
複数の車両の追跡とセグメンテーションのための大規模な合成データセットを複数重なり合うカメラビューと非重なり合うカメラビューで提示する。
データセットは17時間のラベル付きビデオ素材で構成され、64の異なる日、雨、夜のシーンで340台のカメラから記録されている。
論文 参考訳(メタデータ) (2022-08-30T11:36:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。