論文の概要: Exploration of an End-to-End Automatic Number-plate Recognition neural
network for Indian datasets
- arxiv url: http://arxiv.org/abs/2207.06657v1
- Date: Thu, 14 Jul 2022 05:05:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-16 03:59:28.468509
- Title: Exploration of an End-to-End Automatic Number-plate Recognition neural
network for Indian datasets
- Title(参考訳): インドデータセットのためのエンドツーエンド自動ナンバープレート認識ニューラルネットワークの探索
- Authors: Sai Sirisha Nadiminti, Pranav Kant Gaur, Abhilash Bhardwaj
- Abstract要約: 我々は現在、1.5k画像からなる拡張データセットと、このデータセットをインド条件のためのANPRソリューションの開発に向けて拡張するスケーラブルで再現可能な手順を公開している。
本研究は,インド数プレートの極端な多様性と,CCPDデータセットに対する分布の差異から,CCPDの著者らが提供したモデルの直接再利用可能性の障害について報告する。
LP検出では、インドのデータセットと中国のデータセットの特徴を一致させた後、42.86%の改善が観察された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Indian vehicle number plates have wide variety in terms of size, font, script
and shape. Development of Automatic Number Plate Recognition (ANPR) solutions
is therefore challenging, necessitating a diverse dataset to serve as a
collection of examples. However, a comprehensive dataset of Indian scenario is
missing, thereby, hampering the progress towards publicly available and
reproducible ANPR solutions. Many countries have invested efforts to develop
comprehensive ANPR datasets like Chinese City Parking Dataset (CCPD) for China
and Application-oriented License Plate (AOLP) dataset for US. In this work, we
release an expanding dataset presently consisting of 1.5k images and a scalable
and reproducible procedure of enhancing this dataset towards development of
ANPR solution for Indian conditions. We have leveraged this dataset to explore
an End-to-End (E2E) ANPR architecture for Indian scenario which was originally
proposed for Chinese Vehicle number-plate recognition based on the CCPD
dataset. As we customized the architecture for our dataset, we came across
insights, which we have discussed in this paper. We report the hindrances in
direct reusability of the model provided by the authors of CCPD because of the
extreme diversity in Indian number plates and differences in distribution with
respect to the CCPD dataset. An improvement of 42.86% was observed in LP
detection after aligning the characteristics of Indian dataset with Chinese
dataset. In this work, we have also compared the performance of the E2E
number-plate detection model with YOLOv5 model, pre-trained on COCO dataset and
fine-tuned on Indian vehicle images. Given that the number Indian vehicle
images used for fine-tuning the detection module and yolov5 were same, we
concluded that it is more sample efficient to develop an ANPR solution for
Indian conditions based on COCO dataset rather than CCPD dataset.
- Abstract(参考訳): インドの車両番号プレートはサイズ、フォント、文字、形状の点で多種多様である。
したがって、ANPR(Automatic Number Plate Recognition)ソリューションの開発は困難であり、多様なデータセットがサンプルのコレクションとして必要とされる。
しかし、インドのシナリオの包括的なデータセットが欠落しており、公開され再現可能なANPRソリューションへの進捗を妨げている。
多くの国は、中国向けの中国シティパーキングデータセット(CCPD)や米国向けのアプリケーション指向ライセンスプレート(AOLP)データセットといった、包括的なANPRデータセットの開発に投資している。
本研究では,現在1.5k画像からなる拡張データセットと,インド条件のための anpr ソリューションの開発に向けて,このデータセットを拡張するスケーラブルで再現可能な手順をリリースする。
我々は、このデータセットを活用して、CCPDデータセットに基づいた中国車両ナンバープレート認識のために提案されたインドのシナリオのためのEnd-to-End(E2E)ANPRアーキテクチャを探索した。
データセットのアーキテクチャをカスタマイズしたので、この論文で論じてきた洞察に遭遇しました。
本研究は,インド数プレートの極端な多様性と,CCPDデータセットに対する分布の差異から,CCPD作成者が提供するモデルの直接再利用可能性の障害について報告する。
lp検出では、インドデータセットの特徴と中国データセットを一致させた後、42.86%の改善が見られた。
本研究では,E2Eナンバープレート検出モデルとYOLOv5モデルを比較し,COCOデータセットで事前学習し,インドの車両画像で微調整した。
検出モジュールとyolov5の微調整に使用されるインドの車両画像の数を考慮すれば,ccpdデータセットではなく,cocoデータセットに基づくインド条件のanprソリューションを開発する方が,より効率的なサンプルであることがわかった。
関連論文リスト
- RedPajama: an Open Dataset for Training Large Language Models [80.74772646989423]
我々は、オープンソースの言語モデルを前進させるために対処しなければならない3つの中核的なデータ関連課題を特定します。
例えば、(1)データキュレーションプロセス、(2)大量の高品質データへのアクセス、(3)データセットキュレーションと分析のためのアーティファクトとメタデータの可用性などである。
LLaMAトレーニングデータセットのオープンレプリケーションであるRedPajama-V1と、生の未フィルタリングテキストデータと品質信号とメタデータからなる巨大なWeb専用データセットであるRedPajama-V2をリリースする。
論文 参考訳(メタデータ) (2024-11-19T09:35:28Z) - UniTraj: A Unified Framework for Scalable Vehicle Trajectory Prediction [93.77809355002591]
さまざまなデータセット、モデル、評価基準を統一する包括的なフレームワークであるUniTrajを紹介する。
我々は広範な実験を行い、他のデータセットに転送するとモデルの性能が大幅に低下することがわかった。
これらの知見を説明するために,データセットの特徴に関する洞察を提供する。
論文 参考訳(メタデータ) (2024-03-22T10:36:50Z) - ANNA: A Deep Learning Based Dataset in Heterogeneous Traffic for
Autonomous Vehicles [2.932123507260722]
本研究ではバングラデシュの視点で、特定されていない車両を含むカスタムビルドデータセットについて論じる。
IOU(Intersection Over Union)メトリックを用いたモデルの評価により,データセットの妥当性チェックを行った。
その結果、バングラデシュのトラフィックに関するKITTIまたはCOCOデータセットでトレーニングされたモデルよりも、カスタムデータセットでトレーニングされたモデルの方が正確で効率的であることが判明した。
論文 参考訳(メタデータ) (2024-01-21T01:14:04Z) - D2 Pruning: Message Passing for Balancing Diversity and Difficulty in
Data Pruning [70.98091101459421]
コアセット選択は、トレーニングデータのサブセットを選択して、このサブセット(コアセットとも呼ばれる)でトレーニングされたモデルのパフォーマンスを最大化する。
コアセット選択のために,このデータセットグラフ上で前後のメッセージパッシングを利用する新しいプルーニングアルゴリズムD2プルーニングを提案する。
その結果、D2プルーニングは従来の最先端手法よりもコアセット選択を向上し、最大70%のプルーニングレートが得られた。
論文 参考訳(メタデータ) (2023-10-11T23:01:29Z) - IDD-3D: Indian Driving Dataset for 3D Unstructured Road Scenes [79.18349050238413]
デプロイ可能なディープラーニングアーキテクチャの準備とトレーニングには、さまざまなトラフィックシナリオに適したモデルが必要である。
インドなどいくつかの発展途上国で見られる非構造的で複雑な運転レイアウトは、これらのモデルに挑戦している。
我々は、複数のカメラと12kの注釈付き駆動LiDARフレームを備えたLiDARセンサーのマルチモーダルデータからなる新しいデータセットIDD-3Dを構築した。
論文 参考訳(メタデータ) (2022-10-23T23:03:17Z) - A scalable pipeline for COVID-19: the case study of Germany, Czechia and
Poland [7.753854979677439]
複数のデータソースからデータセットを統合するために,運用データストア(ODS)を構築した。
ODSは、ドイツ、チェコ、ポーランドの新型コロナウイルス(COVID-19)データを保管するだけでなく、他の地域も保存するために構築されている。
データは、バージョン管理されたArimaHoltモデルとその他の分析を使用して予測をサポートし、意思決定をサポートするだけでなく、リスク電卓やアプリもサポートする。
論文 参考訳(メタデータ) (2022-08-27T05:14:01Z) - On the data requirements of probing [20.965328323152608]
本稿では,データセットの探索に必要なデータサンプル数を推定する新しい手法を提案する。
我々のフレームワークは、ニューラルネットワークNLPモデルの診断のために、探索データセットを体系的に構築するのに役立つ。
論文 参考訳(メタデータ) (2022-02-25T16:27:06Z) - Indian Licence Plate Dataset in the wild [0.5156484100374058]
本稿では,意味的セグメンテーションを用いて数値プレート検出を行うベンチマークモデルを提案する。
本稿では,第1段目がプレートの局所化のための2段階のアプローチを提案し,第2段目は収穫したプレート画像からテキストを読み取る手法を提案する。
我々は、ベンチマークオブジェクト検出とセマンティックセグメンテーションモデルをテストし、第2段階では、lprnetベースのOCRを使用した。
論文 参考訳(メタデータ) (2021-11-11T05:04:10Z) - Unsupervised Domain Adaptive Learning via Synthetic Data for Person
Re-identification [101.1886788396803]
人物再識別(re-ID)は、ビデオ監視に広く応用されているため、ますます注目を集めている。
残念なことに、主流のディープラーニング手法では、モデルをトレーニングするために大量のラベル付きデータが必要です。
本稿では,コンピュータゲーム内で合成されたre-IDサンプルを自動的に生成するデータコレクタを開発し,同時にアノテートするデータラベラを構築した。
論文 参考訳(メタデータ) (2021-09-12T15:51:41Z) - Comparing Test Sets with Item Response Theory [53.755064720563]
我々は,18の事前学習トランスフォーマーモデルから予測した29のデータセットを個別のテスト例で評価した。
Quoref、HellaSwag、MC-TACOは最先端のモデルを区別するのに最適である。
また、QAMRやSQuAD2.0のようなQAデータセットに使用されるスパン選択タスク形式は、強いモデルと弱いモデルとの差別化に有効である。
論文 参考訳(メタデータ) (2021-06-01T22:33:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。