論文の概要: On the Cross-dataset Generalization for License Plate Recognition
- arxiv url: http://arxiv.org/abs/2201.00267v1
- Date: Sun, 2 Jan 2022 00:56:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-04 14:20:10.102618
- Title: On the Cross-dataset Generalization for License Plate Recognition
- Title(参考訳): ライセンスプレート認識のためのクロスデータセット一般化について
- Authors: Rayson Laroca, Everton V. Cardoso, Diego R. Lucio, Valter Estevam,
David Menotti
- Abstract要約: 12のOCRモデルのクロスデータセット一般化を実証的に評価するために,従来の分割対1データセットアウトの実験的なセットアップを提案する。
その結果、ALPRコンテキストにおけるアプローチを評価するために、従来の分割プロトコルの制限に光を当てた。
- 参考スコア(独自算出の注目度): 1.8514314381314887
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automatic License Plate Recognition (ALPR) systems have shown remarkable
performance on license plates (LPs) from multiple regions due to advances in
deep learning and the increasing availability of datasets. The evaluation of
deep ALPR systems is usually done within each dataset; therefore, it is
questionable if such results are a reliable indicator of generalization
ability. In this paper, we propose a traditional-split versus
leave-one-dataset-out experimental setup to empirically assess the
cross-dataset generalization of 12 Optical Character Recognition (OCR) models
applied to LP recognition on nine publicly available datasets with a great
variety in several aspects (e.g., acquisition settings, image resolution, and
LP layouts). We also introduce a public dataset for end-to-end ALPR that is the
first to contain images of vehicles with Mercosur LPs and the one with the
highest number of motorcycle images. The experimental results shed light on the
limitations of the traditional-split protocol for evaluating approaches in the
ALPR context, as there are significant drops in performance for most datasets
when training and testing the models in a leave-one-dataset-out fashion.
- Abstract(参考訳): ALPR(Automatic License Plate Recognition)システムは、ディープラーニングの進歩とデータセットの可用性の向上により、複数のリージョンのライセンスプレート(LP)に顕著な性能を示した。
深層alprシステムの評価は通常、各データセット内で行われ、その結果が一般化能力の信頼できる指標であるかどうか疑問視される。
本稿では,様々な側面(例えば取得設定,画像解像度,lpレイアウトなど)で利用可能な9つのデータセットのlp認識に適用される12の光学文字認識 (ocr) モデルのクロスデータセット一般化を実証的に評価するための,従来型スプリット対残1データセット実験的なセットアップを提案する。
我々はまた、Mercosur LPを用いた車両画像と、最も多くのオートバイ画像を含む車両画像を含む、エンドツーエンドALPRのためのパブリックデータセットも導入した。
実験結果は、alprコンテキストにおけるアプローチ評価のための従来のスプリットプロトコルの限界に光を当てた。モデルのトレーニングとテストにおいて、ほとんどのデータセットのパフォーマンスが大幅に低下するからだ。
関連論文リスト
- Toward Enhancing Vehicle Color Recognition in Adverse Conditions: A Dataset and Benchmark [2.326743352134195]
車両色認識(VCR)は、視覚的に区別可能な車両の属性であるため、重要な研究の関心を集めている。
このタスクの既存の手法の成功にもかかわらず、文献で使用されるデータセットの比較的低い複雑さは、ほとんど見過ごされてきている。
この研究は、より困難なVCRシナリオを表す新しいデータセットをコンパイルすることで、このギャップに対処する。
論文 参考訳(メタデータ) (2024-08-21T12:54:41Z) - Rethinking Transformers Pre-training for Multi-Spectral Satellite
Imagery [78.43828998065071]
教師なし学習の最近の進歩は、下流タスクにおける有望な結果を達成するための大きな視覚モデルの可能性を示している。
このような事前学習技術は、大量の未学習データが利用可能であることから、リモートセンシング領域でも最近研究されている。
本稿では,マルチモーダルで効果的に活用されるマルチスケール情報の事前学習と活用について述べる。
論文 参考訳(メタデータ) (2024-03-08T16:18:04Z) - A Survey on Open-Set Image Recognition [18.474539379698538]
オープンセット画像認識(OSR)は、既知のクラスサンプルの分類と、テストセット内の未知クラスサンプルの識別の両方を目的としている。
我々は,既存のDNNベースのOSR手法を包括的にレビューする新しい分類法を提案する。
我々は、粗粒度データセットと細粒度データセットの両方において、典型的なOSR法と最先端OSR法のパフォーマンスを比較した。
論文 参考訳(メタデータ) (2023-12-25T00:30:23Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Mitigating Representation Bias in Action Recognition: Algorithms and
Benchmarks [76.35271072704384]
ディープラーニングモデルは、稀なシーンやオブジェクトを持つビデオに適用すると、パフォーマンスが悪くなります。
この問題にはアルゴリズムとデータセットの2つの異なる角度から対処する。
偏りのある表現は、他のデータセットやタスクに転送するとより一般化できることを示す。
論文 参考訳(メタデータ) (2022-09-20T00:30:35Z) - A First Look at Dataset Bias in License Plate Recognition [1.8496815029347666]
データセットバイアスは コンピュータビジョンのコミュニティで 深刻な問題と認識されています
本稿では,ライセンスプレート認識におけるデータセットバイアス問題について検討する。
論文 参考訳(メタデータ) (2022-08-23T00:20:33Z) - An advanced combination of semi-supervised Normalizing Flow & Yolo
(YoloNF) to detect and recognize vehicle license plates [1.5208105446192792]
本稿では、最先端のYOLOオブジェクト検出器と正規化フローに基づく、堅牢で効率的なALPRシステムを提案する。
まず、YOLOを用いた2段階ネットワークと正規化フローベースモデルを用いて、ライセンスプレート(LP)を検出し、数字とアラビア文字でLPを認識する。
論文 参考訳(メタデータ) (2022-07-21T22:22:57Z) - Prefix Conditioning Unifies Language and Label Supervision [84.11127588805138]
学習した表現の一般化性を低減することにより,データセットのバイアスが事前学習に悪影響を及ぼすことを示す。
実験では、この単純な手法により、ゼロショット画像認識精度が向上し、画像レベルの分布シフトに対するロバスト性が向上することを示した。
論文 参考訳(メタデータ) (2022-06-02T16:12:26Z) - Unified Chinese License Plate Detection and Recognition with High
Efficiency [3.0279719282256137]
ディープラーニング手法は、ライセンスプレート(LP)検出および認識タスクにおいて優れたパフォーマンスを達成した。
大規模で代表的なデータセットが不足しているため、中国のLPのための堅牢なモデルを構築することは依然として困難である。
我々は、多目的の中国LP画像を含む中国道路プレートデータセット(CRPD)という新しいデータセットを提案する。
論文 参考訳(メタデータ) (2022-05-07T07:35:51Z) - Robust Semi-supervised Federated Learning for Images Automatic
Recognition in Internet of Drones [57.468730437381076]
プライバシー保護型UAV画像認識のための半教師付きフェデレートラーニング(SSFL)フレームワークを提案する。
異なるカメラモジュールを使用したUAVによって収集されたローカルデータの数、特徴、分布には大きな違いがある。
本稿では,クライアントがトレーニングに参加する頻度,すなわちFedFreqアグリゲーションルールに基づくアグリゲーションルールを提案する。
論文 参考訳(メタデータ) (2022-01-03T16:49:33Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。