論文の概要: A Fine-Grained Vehicle Detection (FGVD) Dataset for Unconstrained Roads
- arxiv url: http://arxiv.org/abs/2212.14569v1
- Date: Fri, 30 Dec 2022 06:50:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-02 16:59:14.923927
- Title: A Fine-Grained Vehicle Detection (FGVD) Dataset for Unconstrained Roads
- Title(参考訳): 未拘束道路用細粒度車両検出(FGVD)データセット
- Authors: Prafful Kumar Khoba, Chirag Parikh, Rohit Saluja, Ravi Kiran
Sarvadevabhatla, C. V. Jawahar
- Abstract要約: 本研究では,自動車に搭載された移動カメラから捉えた,野生におけるファイングラインド車両検出データセットについて紹介する。
シーンイメージは5502枚あり、3レベル階層に整理された複数の車両の210個の細粒度ラベルがある。
以前の分類データセットには、さまざまな種類の車も含まれていたが、FGVDデータセットでは、二輪車、オートリックショー、トラックを分類するための新しいクラスラベルが導入されている。
- 参考スコア(独自算出の注目度): 29.09167268252761
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The previous fine-grained datasets mainly focus on classification and are
often captured in a controlled setup, with the camera focusing on the objects.
We introduce the first Fine-Grained Vehicle Detection (FGVD) dataset in the
wild, captured from a moving camera mounted on a car. It contains 5502 scene
images with 210 unique fine-grained labels of multiple vehicle types organized
in a three-level hierarchy. While previous classification datasets also include
makes for different kinds of cars, the FGVD dataset introduces new class labels
for categorizing two-wheelers, autorickshaws, and trucks. The FGVD dataset is
challenging as it has vehicles in complex traffic scenarios with intra-class
and inter-class variations in types, scale, pose, occlusion, and lighting
conditions. The current object detectors like yolov5 and faster RCNN perform
poorly on our dataset due to a lack of hierarchical modeling. Along with
providing baseline results for existing object detectors on FGVD Dataset, we
also present the results of a combination of an existing detector and the
recent Hierarchical Residual Network (HRN) classifier for the FGVD task.
Finally, we show that FGVD vehicle images are the most challenging to classify
among the fine-grained datasets.
- Abstract(参考訳): 以前のきめ細かいデータセットは主に分類に焦点を当てており、しばしばコントロールされた設定でキャプチャされ、カメラはオブジェクトにフォーカスする。
車両に搭載された移動カメラから捉えた,野生初の細粒度車両検出(fgvd)データセットを紹介する。
シーンイメージは5502枚あり、3レベル階層に整理された複数の車両の210個の細粒度ラベルがある。
以前の分類データセットには、さまざまな種類の車も含まれていたが、FGVDデータセットでは、二輪車、オートリックショー、トラックを分類するための新しいクラスラベルが導入されている。
FGVDデータセットは、タイプ、スケール、ポーズ、オクルージョン、照明条件のクラス内およびクラス間のバリエーションを持つ複雑な交通シナリオにおいて、車両が存在するため、難しい。
現在のyolov5やfaster rcnnのようなオブジェクト検出器は、階層的モデリングが欠如しているため、データセットでパフォーマンスが悪くなります。
FGVDデータセット上に既存のオブジェクト検出器のベースライン結果を提供するとともに、FGVDタスクのための既存の検出器と最近の階層残留ネットワーク(HRN)分類器の組み合わせの結果も提示する。
最後に,fgvd車両画像は細粒度データセットの分類が最も困難であることを示す。
関連論文リスト
- Argoverse 2: Next Generation Datasets for Self-Driving Perception and
Forecasting [64.7364925689825]
Argoverse 2(AV2)は、自動運転分野の研究の知覚と予測のための3つのデータセットの集合である。
Lidarデータセットには、ラベルなしのLidar点雲とマップ整列ポーズの2万のシーケンスが含まれている。
Motion Forecastingデータセットには、各ローカルシーンにおける自動運転車と他のアクター間の興味深い、挑戦的なインタラクションのために採掘された25万のシナリオが含まれている。
論文 参考訳(メタデータ) (2023-01-02T00:36:22Z) - Weakly Supervised Training of Monocular 3D Object Detectors Using Wide
Baseline Multi-view Traffic Camera Data [19.63193201107591]
交差点における車両の7DoF予測は,道路利用者間の潜在的な衝突を評価する上で重要な課題である。
交通監視カメラ用3次元物体検出装置の微調整を弱教師付きで行う手法を開発した。
提案手法は,自動運転車のデータセット上で最上位のモノクル3Dオブジェクト検出器と同等の精度で車両の7DoFの予測精度を推定する。
論文 参考訳(メタデータ) (2021-10-21T08:26:48Z) - Know Your Surroundings: Panoramic Multi-Object Tracking by Multimodality
Collaboration [56.01625477187448]
MMPAT(MultiModality PAnoramic Multi-object Tracking framework)を提案する。
2次元パノラマ画像と3次元点雲を入力とし、マルチモーダルデータを用いて目標軌道を推定する。
提案手法は,検出タスクと追跡タスクの両方においてMMPATが最高性能を達成するJRDBデータセット上で評価する。
論文 参考訳(メタデータ) (2021-05-31T03:16:38Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - TICaM: A Time-of-flight In-car Cabin Monitoring Dataset [10.845284058153837]
TICaMは、単一の広角深度カメラを使用して車両内部の監視のための飛行中キャビンモニタリングデータセットです。
運転中の動作の総括的リストを記録し,マルチモーダルなラベル付き画像を提供する。
実際の記録に加えて,同種の画像とアノテーションを用いた車内キャビン画像の合成データセットを提供する。
論文 参考訳(メタデータ) (2021-03-22T10:48:45Z) - TJU-DHD: A Diverse High-Resolution Dataset for Object Detection [48.94731638729273]
大規模でリッチな多様性と高解像度のデータセットは、よりよいオブジェクト検出方法を開発する上で重要な役割を果たす。
私たちは多種多様な高解像度データセット(TJU-DHD)を構築します。
データセットには115,354枚の高解像度画像と709,330個のラベル付きオブジェクトが含まれており、スケールと外観に大きな違いがある。
論文 参考訳(メタデータ) (2020-11-18T09:32:24Z) - Perceiving Traffic from Aerial Images [86.994032967469]
本研究では,空中画像中の物体を検出するために,バタフライ検出器と呼ばれる物体検出手法を提案する。
UAVDT(UAVDT)とVisDrone 2019(VisDrone 2019)の2つのUAVデータセット上でButterfly Detectorを評価し、従来の最先端の手法よりも高速に動作し、かつリアルタイムに動作可能であることを示す。
論文 参考訳(メタデータ) (2020-09-16T11:37:43Z) - Vehicle Detection of Multi-source Remote Sensing Data Using Active
Fine-tuning Network [26.08837467340853]
提案するMs-AFtフレームワークは,移動学習,セグメンテーション,アクティブな分類を,自動ラベリングと検出のための統合されたフレームワークに統合する。
提案したMs-AFtは、未ラベルのデータセットから車両のトレーニングセットを最初に生成するために、微調整ネットワークを使用している。
2つのオープンISPRSベンチマークデータセットで実施された大規模な実験結果は、車両検出のための提案されたMs-AFtの優位性と有効性を示している。
論文 参考訳(メタデータ) (2020-07-16T17:46:46Z) - EAGLE: Large-scale Vehicle Detection Dataset in Real-World Scenarios
using Aerial Imagery [3.8902657229395894]
航空画像における物体方向情報を用いた多種多様な車両検出のための大規模データセットを提案する。
様々なカメラセンサー、解像度、飛行高度、天候、照明、ヘイズ、シャドウ、時間、都市、国、オクルージョン、カメラアングルを備えた、さまざまな現実世界の状況からなる高解像度の空中画像が特徴である。
215,986のインスタンスに4つのポイントと向きで定義された向き付きバウンディングボックスがアノテートされており、このタスクでこれまでで最大のデータセットとなっている。
また、ヘイズやシャドウ除去の研究や、超高解像度やインペイントの応用も支援している。
論文 参考訳(メタデータ) (2020-07-12T23:00:30Z) - VehicleNet: Learning Robust Visual Representation for Vehicle
Re-identification [116.1587709521173]
我々は,4つのパブリックな車両データセットを活用することで,大規模車両データセット(VabyNet)を構築することを提案する。
VehicleNetからより堅牢な視覚表現を学習するための、シンプルで効果的な2段階プログレッシブアプローチを設計する。
AICity Challengeのプライベートテストセットにおいて,最先端の精度86.07%mAPを実現した。
論文 参考訳(メタデータ) (2020-04-14T05:06:38Z) - Towards Accurate Vehicle Behaviour Classification With Multi-Relational
Graph Convolutional Networks [22.022759283770377]
モノクロ画像やビデオから車両の挙動を理解するパイプラインを提案する。
このような符号化の時間シーケンスをリカレントネットワークに供給し、車両の挙動をラベル付けする。
提案するフレームワークは,多様なデータセットに対して,さまざまな車両動作を高い忠実度に分類することができる。
論文 参考訳(メタデータ) (2020-02-03T14:34:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。