論文の概要: Open data for Moroccan license plates for OCR applications : data
collection, labeling, and model construction
- arxiv url: http://arxiv.org/abs/2104.08244v1
- Date: Fri, 16 Apr 2021 17:26:46 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-19 14:46:18.334480
- Title: Open data for Moroccan license plates for OCR applications : data
collection, labeling, and model construction
- Title(参考訳): ocrアプリケーションのためのモロッコライセンスプレートのオープンデータ : データ収集、ラベリング、モデル構築
- Authors: Abdelkrim Alahyane and Mohamed El Fakir and Saad Benjelloun and Ikram
Chairi
- Abstract要約: モロッコで撮影された循環プレートのラベル付きオープンデータセットを,車,トラック,オートバイなどさまざまな種類の車両について紹介する。
このデータは手動で収集され、705のユニークで異なる画像で構成されている。
データは、データ拡張技術を使用して、さまざまなマシンの傾きとAIアプリケーション用の数千の画像を備えたトレーニングセットを作成することができます。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Significant number of researches have been developed recently around
intelligent system for traffic management, especially, OCR based license plate
recognition, as it is considered as a main step for any automatic traffic
management system. Good quality data sets are increasingly needed and produced
by the research community to improve the performance of those algorithms.
Furthermore, a special need of data is noted for countries having special
characters on their licence plates, like Morocco, where Arabic Alphabet is
used. In this work, we present a labeled open data set of circulation plates
taken in Morocco, for different type of vehicles, namely cars, trucks and
motorcycles. This data was collected manually and consists of 705 unique and
different images. Furthermore this data was labeled for plate segmentation and
for matriculation number OCR. Also, As we show in this paper, the data can be
enriched using data augmentation techniques to create training sets with few
thousands of images for different machine leaning and AI applications. We
present and compare a set of models built on this data. Also, we publish this
data as an open access data to encourage innovation and applications in the
field of OCR and image processing for traffic control and other applications
for transportation and heterogeneous vehicle management.
- Abstract(参考訳): 近年,交通管理のためのインテリジェントシステム,特にOCRベースのナンバープレート認識に関する重要な研究が数多く行われている。
良質なデータセットは、これらのアルゴリズムの性能を改善するために、研究コミュニティによってますます必要とされています。
さらに、アラビア語アルファベットを使用するモロッコなど、ライセンスプレートに特別な文字を持つ国では、特別なデータの必要性が指摘されている。
本研究では,モロッコで撮影された循環プレートのラベル付きオープンデータセットを,車,トラック,オートバイなどさまざまな種類の車両について紹介する。
このデータは手動で収集され、705のユニークで異なる画像で構成されている。
さらに、このデータは、プレートセグメンテーションと成熟数OCRにラベル付けされた。
また、本論文で示すように、データ拡張技術を用いて、異なるマシン傾きやaiアプリケーションのための数千の画像を含むトレーニングセットを作成することができる。
このデータに基づいて構築されたモデルセットを提示し,比較する。
また,このデータをオープンアクセスデータとして公開し,交通制御や交通・異種車両管理等におけるocrや画像処理の分野におけるイノベーションと応用を促進する。
関連論文リスト
- ROAD-Waymo: Action Awareness at Scale for Autonomous Driving [17.531603453254434]
ROAD-Waymoは、道路シーンにおけるエージェント、アクション、位置、イベント検出の技術の開発とベンチマークのための広範なデータセットである。
既存のデータセット(および複数の都市を含む)よりもかなり大きく、より困難なものには、198kの注釈付きビデオフレーム、54kのエージェントチューブ、3.9Mのバウンディングボックス、合計12.4Mのラベルがある。
論文 参考訳(メタデータ) (2024-11-03T20:46:50Z) - Enabling Intelligent Traffic Systems: A Deep Learning Method for Accurate Arabic License Plate Recognition [0.0]
本稿では,エジプト自動車ナンバープレート認識(EVLPR)のための新しい2段階フレームワークを提案する。
第1段では、画像処理技術を用いてライセンスプレートを確実にローカライズし、第2段では、アラビア文字認識のためのカスタム設計のディープラーニングモデルを使用する。
提案システムは,既存手法を超越した多種多様なデータセットにおいて,99.3%の精度を実現する。
論文 参考訳(メタデータ) (2024-08-06T02:27:54Z) - Cross-domain Few-shot In-context Learning for Enhancing Traffic Sign Recognition [49.20086587208214]
交通信号認識の強化を目的としたMLLMに基づくドメイン間数ショットインコンテキスト学習手法を提案する。
記述テキストを使用することで、テンプレートと実際の交通標識のドメイン間差を低減することができる。
提案手法は,大規模交通標識画像やラベルを必要とせず,単純かつ均一なテキスト表示のみを必要とする。
論文 参考訳(メタデータ) (2024-07-08T10:51:03Z) - Global License Plate Dataset [0.6216023343793144]
データセットは、74カ国から収集されたさまざまなサンプルを含む500万枚以上の画像で構成されている。
データセットの統計分析を含み、ベースラインの効率的かつ正確なモデルを提供します。
GLPDは、モデル開発とライセンスプレート認識のための微調整のための主要なベンチマークデータセットになることを目標としている。
論文 参考訳(メタデータ) (2024-03-22T13:01:24Z) - Data-Free Sketch-Based Image Retrieval [56.96186184599313]
本研究では,事前学習された単一モダリティ分類モデルを用いて,学習データにアクセスせずに検索のためのクロスモーダルな距離空間を学習するData-Free (DF)-SBIRを提案する。
本稿では、写真やスケッチの分類を行うために、独立して訓練されたモデルからの知識を活用できるDF-SBIRの方法論を提案する。
また、トレーニングデータを必要としないデータ依存アプローチと競合するmAPを実現する。
論文 参考訳(メタデータ) (2023-03-14T10:34:07Z) - IDD-3D: Indian Driving Dataset for 3D Unstructured Road Scenes [79.18349050238413]
デプロイ可能なディープラーニングアーキテクチャの準備とトレーニングには、さまざまなトラフィックシナリオに適したモデルが必要である。
インドなどいくつかの発展途上国で見られる非構造的で複雑な運転レイアウトは、これらのモデルに挑戦している。
我々は、複数のカメラと12kの注釈付き駆動LiDARフレームを備えたLiDARセンサーのマルチモーダルデータからなる新しいデータセットIDD-3Dを構築した。
論文 参考訳(メタデータ) (2022-10-23T23:03:17Z) - CI-AVSR: A Cantonese Audio-Visual Speech Dataset for In-car Command
Recognition [91.33781557979819]
新しいデータセットであるCantonese In-car Audio-Visual Speech Recognition (CI-AVSR)を導入する。
カントン語話者30人が記録した200の車載コマンドの4,984サンプル(8.3時間)で構成されている。
当社のデータセットのクリーンバージョンと拡張バージョンの両方について、詳細な統計情報を提供しています。
論文 参考訳(メタデータ) (2022-01-11T06:32:12Z) - Robust Semi-supervised Federated Learning for Images Automatic
Recognition in Internet of Drones [57.468730437381076]
プライバシー保護型UAV画像認識のための半教師付きフェデレートラーニング(SSFL)フレームワークを提案する。
異なるカメラモジュールを使用したUAVによって収集されたローカルデータの数、特徴、分布には大きな違いがある。
本稿では,クライアントがトレーニングに参加する頻度,すなわちFedFreqアグリゲーションルールに基づくアグリゲーションルールを提案する。
論文 参考訳(メタデータ) (2022-01-03T16:49:33Z) - On the Cross-dataset Generalization in License Plate Recognition [1.8514314381314887]
12のOCRモデルのクロスデータセット一般化を実証的に評価するために,従来の分割対1データセットアウトの実験的なセットアップを提案する。
その結果、ALPRコンテキストにおけるアプローチを評価するために、従来の分割プロトコルの制限に光を当てた。
論文 参考訳(メタデータ) (2022-01-02T00:56:09Z) - DVM-CAR: A large-scale automotive dataset for visual marketing research
and applications [18.981047097354786]
自動車産業は、センサーからビッグデータ分析、人工知能に至るまで、技術、アプリケーション、サービスによって変革されている。
製品美学への関心は高まっているが、幅広い変数や情報をカバーする大規模なデータセットは存在しない。
私たちのデータセットには、899台の車モデルから14万枚の画像と、対応する車のモデル仕様と、英国市場での10年以上にわたる販売情報が含まれています。
論文 参考訳(メタデータ) (2021-08-10T12:48:58Z) - A Robust Attentional Framework for License Plate Recognition in the Wild [95.7296788722492]
本稿では,ライセンスプレート認識のための堅牢なフレームワークを提案する。
ナンバープレート画像生成のためのCycleGANモデルと、プレート認識のための精巧な設計された画像系列ネットワークで構成されている。
われわれは、中国本土31州から1200枚の画像を含む新しいライセンスプレートデータセット「CLPD」をリリースした。
論文 参考訳(メタデータ) (2020-06-06T17:11:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。