論文の概要: Car-1000: A New Large Scale Fine-Grained Visual Categorization Dataset
- arxiv url: http://arxiv.org/abs/2503.12385v1
- Date: Sun, 16 Mar 2025 07:14:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-18 12:31:09.492115
- Title: Car-1000: A New Large Scale Fine-Grained Visual Categorization Dataset
- Title(参考訳): Car-1000: 大規模細粒度視覚分類データセット
- Authors: Yutao Hu, Sen Li, Jincheng Yan, Wenqi Shao, Xiaoyan Luo,
- Abstract要約: 本稿では,多種多様な自動車モデルの細粒度視覚分類に特化して設計された大規模データセットであるCar-1000を紹介する。
カー1000は165の異なる自動車メーカーの車両を包含しており、1000種類の異なる車種にまたがっている。
我々は、Car-1000データセット上でいくつかの最先端FGVC手法を再現し、この分野の研究のための新しいベンチマークを確立した。
- 参考スコア(独自算出の注目度): 18.259833816531277
- License:
- Abstract: Fine-grained visual categorization (FGVC) is a challenging but significant task in computer vision, which aims to recognize different sub-categories of birds, cars, airplanes, etc. Among them, recognizing models of different cars has significant application value in autonomous driving, traffic surveillance and scene understanding, which has received considerable attention in the past few years. However, Stanford-Car, the most widely used fine-grained dataset for car recognition, only has 196 different categories and only includes vehicle models produced earlier than 2013. Due to the rapid advancements in the automotive industry during recent years, the appearances of various car models have become increasingly intricate and sophisticated. Consequently, the previous Stanford-Car dataset fails to capture this evolving landscape and cannot satisfy the requirements of automotive industry. To address these challenges, in our paper, we introduce Car-1000, a large-scale dataset designed specifically for fine-grained visual categorization of diverse car models. Car-1000 encompasses vehicles from 165 different automakers, spanning a wide range of 1000 distinct car models. Additionally, we have reproduced several state-of-the-art FGVC methods on the Car-1000 dataset, establishing a new benchmark for research in this field. We hope that our work will offer a fresh perspective for future FGVC researchers. Our dataset is available at https://github.com/toggle1995/Car-1000.
- Abstract(参考訳): 細粒度視覚分類(FGVC)は、鳥、車、飛行機などの様々なサブカテゴリを認識することを目的として、コンピュータビジョンにおいて難しいが重要な課題である。
中でも、異なる車のモデルを認識することは、自動運転、交通監視、シーン理解において重要な応用価値を持ち、ここ数年でかなりの注目を集めてきた。
しかし、最も広く使われている自動車認識用の細粒度データセットであるStanford-Carには196のカテゴリーしかなく、2013年以前に製造された車種しか含まれていない。
近年の自動車産業の急速な発展により、様々な車種が複雑で洗練されつつある。
その結果、以前のスタンフォード・カーのデータセットは、この発展途上の風景を捉えず、自動車産業の要求を満たすことができない。
これらの課題に対処するために,本論文では,多種多様な自動車モデルのきめ細かな視覚的分類に特化して設計された大規模データセットであるCar-1000を紹介する。
カー1000は165の異なる自動車メーカーの車両を包含しており、1000種類の異なる車種にまたがっている。
さらに、我々はCar-1000データセット上でいくつかの最先端FGVC手法を再現し、この分野の研究のための新しいベンチマークを確立した。
今後のFGVC研究者に新たな視点を提供することを期待しています。
データセットはhttps://github.com/toggle1995/Car-1000で公開されています。
関連論文リスト
- Veri-Car: Towards Open-world Vehicle Information Retrieval [1.993319040918735]
本稿では,この課題を支援するための情報検索統合手法であるVeri-Carを提案する。
教師付き学習技術を利用して、車のメイク、タイプ、モデル、年、色、ナンバープレートを正確に識別する。
このアプローチはまた、新しい車モデルやバリエーションが頻繁に現れるような、オープンワールドの問題を扱うという課題にも対処する。
論文 参考訳(メタデータ) (2024-11-11T10:56:40Z) - DreamCar: Leveraging Car-specific Prior for in-the-wild 3D Car Reconstruction [29.095687643972784]
自動運転産業は通常、プロのアーティストを雇って、精巧な3D自動車を作っている。
自動車の画像を含むデータセットはすでに多数存在するので、これらのデータセットから高品質な3Dカーモデルを再構築することに重点を置いています。
1枚の画像であっても、高品質な3D車を再構成できるDreamCarという新しい手法を提案する。
論文 参考訳(メタデータ) (2024-07-24T04:13:43Z) - AIDE: An Automatic Data Engine for Object Detection in Autonomous Driving [68.73885845181242]
本稿では,問題を自動的に識別し,データを効率よくキュレートし,自動ラベル付けによりモデルを改善する自動データエンジン(AIDE)を提案する。
さらに,AVデータセットのオープンワールド検出のためのベンチマークを構築し,様々な学習パラダイムを包括的に評価し,提案手法の優れた性能を低コストで実証する。
論文 参考訳(メタデータ) (2024-03-26T04:27:56Z) - A Large-Scale Car Parts (LSCP) Dataset for Lightweight Fine-Grained
Detection [0.23020018305241333]
本稿では,12種類の自動車部品を検出するため,84,162枚の画像からなる大規模できめ細かな自動車データセットを提案する。
手動アノテーションの負担を軽減するため,新しい半教師付き自動ラベリング手法を提案する。
また,ゼロショットラベリングにおけるグラウンディングDINOアプローチの限界についても検討する。
論文 参考訳(メタデータ) (2023-11-20T13:30:42Z) - GP22: A Car Styling Dataset for Automotive Designers [7.6702700993064115]
GP22は自動車デザイナーによって定義された自動車のスタイリング機能で構成されている。
データセットには、37のブランドと10の自動車セグメントから1480の車のサイドプロフィールイメージが含まれている。
論文 参考訳(メタデータ) (2022-07-05T01:39:34Z) - AutoFormer: Searching Transformers for Visual Recognition [97.60915598958968]
本稿では,視覚トランスフォーマー検索専用のワンショットアーキテクチャ検索フレームワークであるAutoFormerを提案する。
AutoFormerは、スーパーネットトレーニング中に同じレイヤ内の異なるブロックの重みを絡み合わせる。
我々は、AutoFormer-tiny/small/baseが5.7M/22.9M/53.7Mパラメータを持つImageNetで74.7%/81.7%/82.4%のトップ-1精度を達成したことを示す。
論文 参考訳(メタデータ) (2021-07-01T17:59:30Z) - SODA10M: Towards Large-Scale Object Detection Benchmark for Autonomous
Driving [94.11868795445798]
我々は,SODA10Mという名の自律走行用大規模物体検出ベンチマークをリリースし,1000万枚の未ラベル画像と6つの代表対象カテゴリをラベル付けした20K画像を含む。
多様性を向上させるために、画像は32の異なる都市で、1フレームあたり10秒毎に異なる気象条件、期間、場所のシーンで収集される。
我々は、既存の教師付き最先端検出モデル、一般的な自己監督型および半教師付きアプローチ、および将来のモデルの開発方法に関するいくつかの知見について、広範な実験と詳細な分析を行った。
論文 参考訳(メタデータ) (2021-06-21T13:55:57Z) - One Million Scenes for Autonomous Driving: ONCE Dataset [91.94189514073354]
自律運転シナリオにおける3次元物体検出のためのONCEデータセットを提案する。
データは、利用可能な最大の3D自動運転データセットよりも20倍長い144時間の運転時間から選択される。
我々はONCEデータセット上で、様々な自己教師的・半教師的手法を再現し、評価する。
論文 参考訳(メタデータ) (2021-06-21T12:28:08Z) - VehicleNet: Learning Robust Visual Representation for Vehicle
Re-identification [116.1587709521173]
我々は,4つのパブリックな車両データセットを活用することで,大規模車両データセット(VabyNet)を構築することを提案する。
VehicleNetからより堅牢な視覚表現を学習するための、シンプルで効果的な2段階プログレッシブアプローチを設計する。
AICity Challengeのプライベートテストセットにおいて,最先端の精度86.07%mAPを実現した。
論文 参考訳(メタデータ) (2020-04-14T05:06:38Z) - The Devil is in the Details: Self-Supervised Attention for Vehicle
Re-Identification [75.3310894042132]
車両識別のための自己監督的注意(SAVER)は、車両固有の識別特徴を効果的に学習するための新しいアプローチである。
我々は,SAVERがVeRi, VehicleID, Vehicle-1M, VERI-Wildのデータセットに挑戦する際の最先端性を改善することを示す。
論文 参考訳(メタデータ) (2020-04-14T02:24:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。