論文の概要: An advanced combination of semi-supervised Normalizing Flow & Yolo
(YoloNF) to detect and recognize vehicle license plates
- arxiv url: http://arxiv.org/abs/2207.10777v1
- Date: Thu, 21 Jul 2022 22:22:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-25 12:32:59.679425
- Title: An advanced combination of semi-supervised Normalizing Flow & Yolo
(YoloNF) to detect and recognize vehicle license plates
- Title(参考訳): 車両ナンバープレートの検出と認識のための半教師付き正規化フローとヨーロ(YoloNF)の高度な組み合わせ
- Authors: Khalid Oublal and Xinyi Dai
- Abstract要約: 本稿では、最先端のYOLOオブジェクト検出器と正規化フローに基づく、堅牢で効率的なALPRシステムを提案する。
まず、YOLOを用いた2段階ネットワークと正規化フローベースモデルを用いて、ライセンスプレート(LP)を検出し、数字とアラビア文字でLPを認識する。
- 参考スコア(独自算出の注目度): 1.5208105446192792
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Fully Automatic License Plate Recognition (ALPR) has been a frequent research
topic due to several practical applications. However, many of the current
solutions are still not robust enough in real situations, commonly depending on
many constraints. This paper presents a robust and efficient ALPR system based
on the state-of-the-art YOLO object detector and Normalizing flows. The model
uses two new strategies. Firstly, a two-stage network using YOLO and a
normalization flow-based model for normalization to detect Licenses Plates (LP)
and recognize the LP with numbers and Arabic characters. Secondly, Multi-scale
image transformations are implemented to provide a solution to the problem of
the YOLO cropped LP detection including significant background noise.
Furthermore, extensive experiments are led on a new dataset with realistic
scenarios, we introduce a larger public annotated dataset collected from
Moroccan plates. We demonstrate that our proposed model can learn on a small
number of samples free of single or multiple characters. The dataset will also
be made publicly available to encourage further studies and research on plate
detection and recognition.
- Abstract(参考訳): 完全自動ライセンスプレート認識(alpr)は、いくつかの実用的な応用のために頻繁に研究されている。
しかし、現在のソリューションの多くは、多くの場合多くの制約に依存するが、実際の状況では十分に堅牢ではない。
本稿では、最先端のYOLOオブジェクト検出器と正規化フローに基づく、堅牢で効率的なALPRシステムを提案する。
モデルは2つの新しい戦略を使用する。
まず、YOLOを用いた2段階ネットワークと正規化フローベースモデルを用いて、ライセンスプレート(LP)を検出し、数字とアラビア文字でLPを認識する。
第二に, 背景雑音を含むヨロクロッピングlp検出問題に対する解法として, マルチスケール画像変換を実装した。
さらに,現実的なシナリオを持つデータセットを大規模に実験し,モロッコプレートから収集したより大規模な公開アノテーション付きデータセットを導入する。
提案モデルでは,1文字または複数文字を含まない少数のサンプルで学習できることを実証する。
データセットも公開され、プレートの検出と認識に関するさらなる研究と研究が奨励される。
関連論文リスト
- LARA: A Light and Anti-overfitting Retraining Approach for Unsupervised
Time Series Anomaly Detection [49.52429991848581]
深部変分自動エンコーダに基づく時系列異常検出手法(VAE)のための光・反オーバーフィット学習手法(LARA)を提案する。
本研究の目的は,1) 再学習過程を凸問題として定式化し, 過度に収束できること,2) 履歴データを保存せずに活用するルミネートブロックを設計すること,3) 潜在ベクトルと再構成データの微調整を行うと, 線形形成が基底真実と微調整されたブロックとの誤りを最小に調整できることを数学的に証明することである。
論文 参考訳(メタデータ) (2023-10-09T12:36:16Z) - Leveraging Model Fusion for Improved License Plate Recognition [3.049664973023939]
複数のモデルを使用すると、特定のデータセット/シナリオのサブパーパフォーマンスが低下する。
実験には幅広いデータセットが含まれており、イントラおよびクロスデータセットのセットアップにおいて、融合アプローチの実質的な利点が明らかにされている。
認識タスクが余分な時間で許容できるアプリケーションの場合、効果的な戦略は4-6モデルを組み合わせることである。
論文 参考訳(メタデータ) (2023-09-08T13:55:16Z) - Generalized Few-Shot 3D Object Detection of LiDAR Point Cloud for
Autonomous Driving [91.39625612027386]
我々は,一般的な(ベース)オブジェクトに対して大量のトレーニングデータを持つが,レア(ノーベル)クラスに対してはごく少数のデータしか持たない,一般化された数発の3Dオブジェクト検出という新しいタスクを提案する。
具体的には、画像と点雲の奥行きの違いを分析し、3D LiDARデータセットにおける少数ショット設定の実践的原理を示す。
この課題を解決するために,既存の3次元検出モデルを拡張し,一般的なオブジェクトと稀なオブジェクトの両方を認識するためのインクリメンタルな微調整手法を提案する。
論文 参考訳(メタデータ) (2023-02-08T07:11:36Z) - A lightweight and accurate YOLO-like network for small target detection
in Aerial Imagery [94.78943497436492]
小型ターゲット検出のためのシンプルで高速で効率的なネットワークであるYOLO-Sを提案する。
YOLO-SはDarknet20をベースとした小さな特徴抽出器と、バイパスと連結の両方を通じて接続をスキップする。
YOLO-Sはパラメータサイズが87%減少し、約半分のFLOPがYOLOv3となり、低消費電力の産業用アプリケーションに実用化された。
論文 参考訳(メタデータ) (2022-04-05T16:29:49Z) - Logit Normalization for Long-tail Object Detection [32.18963619434191]
歪んだ分布を示す現実世界のデータは、既存の物体検出器に深刻な課題をもたらす。
バッチ正規化と同様な方法で検出器の分類されたロジットを自己校正する手法であるLogit Normalization(LogN)を提案する。
一般的に、当社のLogNは、トレーニングとチューニングの不要(つまり、追加のトレーニングとチューニングのプロセスを必要としない)、モデルとラベルの分布に依存しない、そしてプラグインとプレイである。
論文 参考訳(メタデータ) (2022-03-31T13:28:51Z) - End-to-End High Accuracy License Plate Recognition Based on Depthwise
Separable Convolution Networks [0.0]
ライセンスプレート認識のための新しいセグメンテーションフリーフレームワークを提案し,NP-ALPRデータセットを導入した。
提案するネットワークモデルは,最新のディープラーニング手法と最先端のアイデアと,新しいネットワークアーキテクチャのメリットで構成されている。
提案手法の有効性を3つの異なるデータセットで評価し,99%以上,70fps以上の認識精度を示した。
論文 参考訳(メタデータ) (2022-02-21T14:45:03Z) - On the Cross-dataset Generalization in License Plate Recognition [1.8514314381314887]
12のOCRモデルのクロスデータセット一般化を実証的に評価するために,従来の分割対1データセットアウトの実験的なセットアップを提案する。
その結果、ALPRコンテキストにおけるアプローチを評価するために、従来の分割プロトコルの制限に光を当てた。
論文 参考訳(メタデータ) (2022-01-02T00:56:09Z) - Unsupervised Noisy Tracklet Person Re-identification [100.85530419892333]
本稿では,非照合トラックレットデータから識別的人物再識別モデルを訓練できる選択的トラックレット学習(STL)手法を提案する。
これにより、カメラビュー全体で人物の画像/トラックレットの真のマッチングペアを完全にラベル付けする面倒でコストのかかるプロセスが回避されます。
提案手法は生トラックレットの任意のノイズデータに対して特に頑健であるため,制約のない追跡データから識別モデル学習にスケーラブルである。
論文 参考訳(メタデータ) (2021-01-16T07:31:00Z) - MOCCA: Multi-Layer One-Class ClassificAtion for Anomaly Detection [16.914663209964697]
我々は,Multi-Layer One-Class Classification (MOCCA) と呼ばれる異常検出問題に対するディープラーニングアプローチを提案する。
異なる深さで抽出された情報を利用して異常なデータインスタンスを検出することで、ディープニューラルネットワークのピースワイズ的性質を明示的に活用します。
本稿では,本手法が文献で利用可能な最先端手法と比較して優れた性能を示す。
論文 参考訳(メタデータ) (2020-12-09T08:32:56Z) - Unsupervised Anomaly Detection with Adversarial Mirrored AutoEncoders [51.691585766702744]
本稿では,識別器のミラー化ワッサースタイン損失を利用して,よりセマンティックレベルの再構築を行う逆自動エンコーダの変種を提案する。
我々は,再建基準の代替として,異常スコアの代替尺度を提案した。
提案手法は,OOD検出ベンチマークにおける異常検出の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2020-03-24T08:26:58Z) - Solving Missing-Annotation Object Detection with Background
Recalibration Loss [49.42997894751021]
本稿では,新しい,かつ困難な検出シナリオに焦点を当てる。 真のオブジェクト/インスタンスの大部分は,データセットにラベル付けされていない。
従来, ソフトサンプリングを用いて, 正の例と重なり合うRoIsの勾配を再重み付けする手法が提案されてきた。
本稿では、予め定義されたIoU閾値と入力画像に基づいて損失信号を自動的に校正できる、バックグラウンド校正損失(BRL)と呼ばれる優れた解を提案する。
論文 参考訳(メタデータ) (2020-02-12T23:11:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。