論文の概要: Disentangled Generation Network for Enlarged License Plate Recognition
and A Unified Dataset
- arxiv url: http://arxiv.org/abs/2206.00859v1
- Date: Thu, 2 Jun 2022 03:26:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-04 00:15:45.529089
- Title: Disentangled Generation Network for Enlarged License Plate Recognition
and A Unified Dataset
- Title(参考訳): 拡大ライセンスプレート認識のための異方性生成ネットワークと統一データセット
- Authors: Chenglong Li, Xiaobin Yang, Guohao Wang, Aihua Zheng, Chang Tan,
Ruoran Jia, and Jin Tang
- Abstract要約: 本稿では,DGNetに基づくタスクレベル・アンタングル生成フレームワークを提案する。
本研究ではまず,拡張されたナンバープレート認識問題に対処し,9342の画像を含むデータセットをコントリビュートする。
- 参考スコア(独自算出の注目度): 28.191709384269444
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: License plate recognition plays a critical role in many practical
applications, but license plates of large vehicles are difficult to be
recognized due to the factors of low resolution, contamination, low
illumination, and occlusion, to name a few. To overcome the above factors, the
transportation management department generally introduces the enlarged license
plate behind the rear of a vehicle. However, enlarged license plates have high
diversity as they are non-standard in position, size, and style. Furthermore,
the background regions contain a variety of noisy information which greatly
disturbs the recognition of license plate characters. Existing works have not
studied this challenging problem. In this work, we first address the enlarged
license plate recognition problem and contribute a dataset containing 9342
images, which cover most of the challenges of real scenes. However, the created
data are still insufficient to train deep methods of enlarged license plate
recognition, and building large-scale training data is very time-consuming and
high labor cost. To handle this problem, we propose a novel task-level
disentanglement generation framework based on the Disentangled Generation
Network (DGNet), which disentangles the generation into the text generation and
background generation in an end-to-end manner to effectively ensure diversity
and integrity, for robust enlarged license plate recognition. Extensive
experiments on the created dataset are conducted, and we demonstrate the
effectiveness of the proposed approach in three representative text recognition
frameworks.
- Abstract(参考訳): ライセンスプレートの認識は多くの実用化において重要な役割を担っているが、大型車両のライセンスプレートは、低分解能、汚染、低照度、閉塞などの要因により認識が困難である。
上記の要因を克服するため、運送管理部門は一般的に車両後部に拡大したナンバープレートを導入する。
しかし、拡大されたライセンスプレートは、位置、サイズ、スタイルが非標準であるため、多様性が高い。
さらに、背景領域には、ナンバープレート文字の認識を著しく乱す様々なノイズ情報が含まれている。
現存する研究は、この困難な問題を研究していない。
本研究では,まず,拡大したライセンスプレート認識問題に対処し,9342枚の画像を含むデータセットを作成し,実際のシーンの課題のほとんどをカバーする。
しかし、作成したデータでは、ライセンスプレートを広く認識する深い方法の訓練にはまだ不十分であり、大規模なトレーニングデータの構築は非常に時間がかかり、高い労働コストがかかる。
そこで本研究では,テキスト生成と背景生成をエンドツーエンドに切り離し,多様性と整合性を効果的に確保し,堅牢な拡張ライセンスプレート認識を実現するための,DGNet(Disentangled Generation Network)に基づくタスクレベル・アンタングル生成フレームワークを提案する。
作成したデータセットに対する大規模な実験を行い,提案手法の有効性を3つの代表的なテキスト認識フレームワークで示す。
関連論文リスト
- License Plate Recognition Based On Multi-Angle View Model [0.0]
本稿では,異なる視点の複数のフレームをマージすることで,ライセンスプレート内のテキスト検出の問題に対処する。
提案手法は,各視点において,ライセンスプレートのテキストコンポーネントを特徴付ける記述的特徴を抽出する。
我々はライセンスプレート内のテキスト認識にCnOCR法を用いる。
論文 参考訳(メタデータ) (2023-09-22T16:12:45Z) - Indian Commercial Truck License Plate Detection and Recognition for
Weighbridge Automation [0.0]
本稿では,商用トラックナンバープレートのデータベースと,リアルタイムオブジェクト検出における最先端モデルの利用について述べる。
提案したライセンスプレートデータセットのアルゴリズム実装において,95.82%の精度を達成した。
論文 参考訳(メタデータ) (2022-11-23T18:28:12Z) - Semantic-aware One-shot Face Re-enactment with Dense Correspondence
Estimation [100.60938767993088]
ワンショットの顔の再現は、ソースと駆動する顔の同一性ミスマッチのため、難しい作業である。
本稿では,3次元形態素モデル(3DMM)を明示的な顔のセマンティックな分解とアイデンティティの絡み合いに利用することを提案する。
論文 参考訳(メタデータ) (2022-11-23T03:02:34Z) - End-to-End High Accuracy License Plate Recognition Based on Depthwise
Separable Convolution Networks [0.0]
ライセンスプレート認識のための新しいセグメンテーションフリーフレームワークを提案し,NP-ALPRデータセットを導入した。
提案するネットワークモデルは,最新のディープラーニング手法と最先端のアイデアと,新しいネットワークアーキテクチャのメリットで構成されている。
提案手法の有効性を3つの異なるデータセットで評価し,99%以上,70fps以上の認識精度を示した。
論文 参考訳(メタデータ) (2022-02-21T14:45:03Z) - Towards Real-World Prohibited Item Detection: A Large-Scale X-ray
Benchmark [53.9819155669618]
本稿では,PIDrayと命名された大規模データセットについて述べる。
大量の努力を払って、私たちのデータセットには、高品質な注釈付きセグメンテーションマスクとバウンディングボックスを備えた47,677ドルのX線画像に、禁止アイテムの12ドルカテゴリが含まれています。
提案手法は最先端の手法に対して,特に故意に隠された項目を検出するために好適に機能する。
論文 参考訳(メタデータ) (2021-08-16T11:14:16Z) - Unsupervised Pre-training for Person Re-identification [90.98552221699508]
大規模無ラベル人物再識別(Re-ID)データセットLUPersonを提案する。
学習者のRe-ID特徴表現の一般化能力を向上させるために,教師なし事前学習を初めて行おうとする。
論文 参考訳(メタデータ) (2020-12-07T14:48:26Z) - End-to-end trainable network for degraded license plate detection via
vehicle-plate relation mining [26.484883058620134]
そこで本研究では,車両-プレート関係のマイニングによるナンバープレート検出の新規かつ適用可能な手法を提案する。
まず,車両とナンバープレートの関係を利用して,ナンバープレート周辺の地域を推定する。
第二に, 斜めプレートの四隅を後退させて, 斜めプレートを頑健に検出することにより, 局所領域の四辺境界ボックスを予測することを提案する。
論文 参考訳(メタデータ) (2020-10-27T13:05:31Z) - Generalized Iris Presentation Attack Detection Algorithm under
Cross-Database Settings [63.90855798947425]
プレゼンテーションアタックは、バイオメトリックなモダリティの大部分に大きな課題をもたらす。
本稿では,汎用的な深層学習に基づくプレゼンテーション攻撃検出ネットワークであるMVANetを提案する。
これはハイブリッドアルゴリズムの単純さと成功、あるいは複数の検出ネットワークの融合にインスパイアされている。
論文 参考訳(メタデータ) (2020-10-25T22:42:27Z) - A Robust Attentional Framework for License Plate Recognition in the Wild [95.7296788722492]
本稿では,ライセンスプレート認識のための堅牢なフレームワークを提案する。
ナンバープレート画像生成のためのCycleGANモデルと、プレート認識のための精巧な設計された画像系列ネットワークで構成されている。
われわれは、中国本土31州から1200枚の画像を含む新しいライセンスプレートデータセット「CLPD」をリリースした。
論文 参考訳(メタデータ) (2020-06-06T17:11:52Z) - The Devil is in the Details: Self-Supervised Attention for Vehicle
Re-Identification [75.3310894042132]
車両識別のための自己監督的注意(SAVER)は、車両固有の識別特徴を効果的に学習するための新しいアプローチである。
我々は,SAVERがVeRi, VehicleID, Vehicle-1M, VERI-Wildのデータセットに挑戦する際の最先端性を改善することを示す。
論文 参考訳(メタデータ) (2020-04-14T02:24:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。