論文の概要: Disentangled Generation Network for Enlarged License Plate Recognition
and A Unified Dataset
- arxiv url: http://arxiv.org/abs/2206.00859v2
- Date: Thu, 25 May 2023 14:03:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-27 00:15:33.653954
- Title: Disentangled Generation Network for Enlarged License Plate Recognition
and A Unified Dataset
- Title(参考訳): 拡大ライセンスプレート認識のための異方性生成ネットワークと統一データセット
- Authors: Chenglong Li, Xiaobin Yang, Guohao Wang, Aihua Zheng, Chang Tan,
Ruoran Jia, and Jin Tang
- Abstract要約: 本稿では,DGNetに基づくタスクレベル・アンタングル生成フレームワークを提案する。
本研究ではまず,拡張されたナンバープレート認識問題に対処し,9342の画像を含むデータセットをコントリビュートする。
- 参考スコア(独自算出の注目度): 28.191709384269444
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: License plate recognition plays a critical role in many practical
applications, but license plates of large vehicles are difficult to be
recognized due to the factors of low resolution, contamination, low
illumination, and occlusion, to name a few. To overcome the above factors, the
transportation management department generally introduces the enlarged license
plate behind the rear of a vehicle. However, enlarged license plates have high
diversity as they are non-standard in position, size, and style. Furthermore,
the background regions contain a variety of noisy information which greatly
disturbs the recognition of license plate characters. Existing works have not
studied this challenging problem. In this work, we first address the enlarged
license plate recognition problem and contribute a dataset containing 9342
images, which cover most of the challenges of real scenes. However, the created
data are still insufficient to train deep methods of enlarged license plate
recognition, and building large-scale training data is very time-consuming and
high labor cost. To handle this problem, we propose a novel task-level
disentanglement generation framework based on the Disentangled Generation
Network (DGNet), which disentangles the generation into the text generation and
background generation in an end-to-end manner to effectively ensure diversity
and integrity, for robust enlarged license plate recognition. Extensive
experiments on the created dataset are conducted, and we demonstrate the
effectiveness of the proposed approach in three representative text recognition
frameworks.
- Abstract(参考訳): ライセンスプレートの認識は多くの実用化において重要な役割を担っているが、大型車両のライセンスプレートは、低分解能、汚染、低照度、閉塞などの要因により認識が困難である。
上記の要因を克服するため、運送管理部門は一般的に車両後部に拡大したナンバープレートを導入する。
しかし、拡大されたライセンスプレートは、位置、サイズ、スタイルが非標準であるため、多様性が高い。
さらに、背景領域には、ナンバープレート文字の認識を著しく乱す様々なノイズ情報が含まれている。
現存する研究は、この困難な問題を研究していない。
本研究では,まず,拡大したライセンスプレート認識問題に対処し,9342枚の画像を含むデータセットを作成し,実際のシーンの課題のほとんどをカバーする。
しかし、作成したデータでは、ライセンスプレートを広く認識する深い方法の訓練にはまだ不十分であり、大規模なトレーニングデータの構築は非常に時間がかかり、高い労働コストがかかる。
そこで本研究では,テキスト生成と背景生成をエンドツーエンドに切り離し,多様性と整合性を効果的に確保し,堅牢な拡張ライセンスプレート認識を実現するための,DGNet(Disentangled Generation Network)に基づくタスクレベル・アンタングル生成フレームワークを提案する。
作成したデータセットに対する大規模な実験を行い,提案手法の有効性を3つの代表的なテキスト認識フレームワークで示す。
関連論文リスト
- EnTruth: Enhancing the Traceability of Unauthorized Dataset Usage in Text-to-image Diffusion Models with Minimal and Robust Alterations [73.94175015918059]
本稿では、未承認のデータセット使用のトレーサビリティを高める新しいアプローチであるEnTruthを紹介する。
テンプレートの暗記を戦略的に取り入れることで、EnTruthは不正なモデルの特定の振る舞いを侵害の証拠として引き起こすことができる。
本手法は, 暗記の正当性を調査し, 著作権保護に利用し, 呪いを祝福する最初の方法である。
論文 参考訳(メタデータ) (2024-06-20T02:02:44Z) - A Dataset and Model for Realistic License Plate Deblurring [17.52035404373648]
ライセンスプレートブラ(LPBlur)と呼ばれる,最初の大規模ナンバープレートデブロアリングデータセットについて紹介する。
そこで我々は,ライセンスプレート・デブロアリングに対処するために,LPDGAN (L License Plate Deblurring Generative Adversarial Network) を提案する。
提案手法は,現実的なナンバープレートのデブロアリングシナリオにおいて,他の最先端の動作デブロアリング手法よりも優れる。
論文 参考訳(メタデータ) (2024-04-21T14:36:57Z) - Using Super-Resolution Imaging for Recognition of Low-Resolution Blurred License Plates: A Comparative Study of Real-ESRGAN, A-ESRGAN, and StarSRGAN [0.0]
本研究は主に、Real-ESRGAN、A-ESRGAN、StarSRGANの3つの超解像モデルを微調整する。
異なる超解像モデルを比較することにより、この課題に最も適したモデルを見つけることが期待されている。
論文 参考訳(メタデータ) (2024-03-20T03:42:15Z) - Indian Commercial Truck License Plate Detection and Recognition for
Weighbridge Automation [0.0]
本稿では,商用トラックナンバープレートのデータベースと,リアルタイムオブジェクト検出における最先端モデルの利用について述べる。
提案したライセンスプレートデータセットのアルゴリズム実装において,95.82%の精度を達成した。
論文 参考訳(メタデータ) (2022-11-23T18:28:12Z) - End-to-End High Accuracy License Plate Recognition Based on Depthwise
Separable Convolution Networks [0.0]
ライセンスプレート認識のための新しいセグメンテーションフリーフレームワークを提案し,NP-ALPRデータセットを導入した。
提案するネットワークモデルは,最新のディープラーニング手法と最先端のアイデアと,新しいネットワークアーキテクチャのメリットで構成されている。
提案手法の有効性を3つの異なるデータセットで評価し,99%以上,70fps以上の認識精度を示した。
論文 参考訳(メタデータ) (2022-02-21T14:45:03Z) - Towards Real-World Prohibited Item Detection: A Large-Scale X-ray
Benchmark [53.9819155669618]
本稿では,PIDrayと命名された大規模データセットについて述べる。
大量の努力を払って、私たちのデータセットには、高品質な注釈付きセグメンテーションマスクとバウンディングボックスを備えた47,677ドルのX線画像に、禁止アイテムの12ドルカテゴリが含まれています。
提案手法は最先端の手法に対して,特に故意に隠された項目を検出するために好適に機能する。
論文 参考訳(メタデータ) (2021-08-16T11:14:16Z) - Unsupervised Pre-training for Person Re-identification [90.98552221699508]
大規模無ラベル人物再識別(Re-ID)データセットLUPersonを提案する。
学習者のRe-ID特徴表現の一般化能力を向上させるために,教師なし事前学習を初めて行おうとする。
論文 参考訳(メタデータ) (2020-12-07T14:48:26Z) - Generalized Iris Presentation Attack Detection Algorithm under
Cross-Database Settings [63.90855798947425]
プレゼンテーションアタックは、バイオメトリックなモダリティの大部分に大きな課題をもたらす。
本稿では,汎用的な深層学習に基づくプレゼンテーション攻撃検出ネットワークであるMVANetを提案する。
これはハイブリッドアルゴリズムの単純さと成功、あるいは複数の検出ネットワークの融合にインスパイアされている。
論文 参考訳(メタデータ) (2020-10-25T22:42:27Z) - A Robust Attentional Framework for License Plate Recognition in the Wild [95.7296788722492]
本稿では,ライセンスプレート認識のための堅牢なフレームワークを提案する。
ナンバープレート画像生成のためのCycleGANモデルと、プレート認識のための精巧な設計された画像系列ネットワークで構成されている。
われわれは、中国本土31州から1200枚の画像を含む新しいライセンスプレートデータセット「CLPD」をリリースした。
論文 参考訳(メタデータ) (2020-06-06T17:11:52Z) - The Devil is in the Details: Self-Supervised Attention for Vehicle
Re-Identification [75.3310894042132]
車両識別のための自己監督的注意(SAVER)は、車両固有の識別特徴を効果的に学習するための新しいアプローチである。
我々は,SAVERがVeRi, VehicleID, Vehicle-1M, VERI-Wildのデータセットに挑戦する際の最先端性を改善することを示す。
論文 参考訳(メタデータ) (2020-04-14T02:24:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。