論文の概要: Efficient License Plate Recognition in Videos Using Visual Rhythm and Accumulative Line Analysis
- arxiv url: http://arxiv.org/abs/2501.04750v1
- Date: Wed, 08 Jan 2025 16:17:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-10 14:00:06.655288
- Title: Efficient License Plate Recognition in Videos Using Visual Rhythm and Accumulative Line Analysis
- Title(参考訳): 視覚リズムと累積線解析を用いた映像の高能率ナンバープレート認識
- Authors: Victor Nascimento Ribeiro, Nina S. T. Hirata,
- Abstract要約: ビデオベースの自動ナンバープレート認識(ALPR)は、ビデオキャプチャーから車両ナンバープレートのテキスト情報を抽出する。
従来のシステムはハイエンドのコンピューティングリソースに大きく依存しており、複数のフレームを使用してライセンスプレートを認識する。
車両1台あたりの正確なフレームを効率よく抽出し,この画像からナンバープレートの文字を認識できる2つの手法を提案する。
- 参考スコア(独自算出の注目度): 0.36832029288386137
- License:
- Abstract: Video-based Automatic License Plate Recognition (ALPR) involves extracting vehicle license plate text information from video captures. Traditional systems typically rely heavily on high-end computing resources and utilize multiple frames to recognize license plates, leading to increased computational overhead. In this paper, we propose two methods capable of efficiently extracting exactly one frame per vehicle and recognizing its license plate characters from this single image, thus significantly reducing computational demands. The first method uses Visual Rhythm (VR) to generate time-spatial images from videos, while the second employs Accumulative Line Analysis (ALA), a novel algorithm based on single-line video processing for real-time operation. Both methods leverage YOLO for license plate detection within the frame and a Convolutional Neural Network (CNN) for Optical Character Recognition (OCR) to extract textual information. Experiments on real videos demonstrate that the proposed methods achieve results comparable to traditional frame-by-frame approaches, with processing speeds three times faster.
- Abstract(参考訳): ビデオベースの自動ナンバープレート認識(ALPR)は、ビデオキャプチャーから車両ナンバープレートのテキスト情報を抽出する。
従来のシステムは、通常、ハイエンドのコンピューティングリソースに大きく依存し、複数のフレームを使用してライセンスプレートを認識するため、計算オーバーヘッドが増大する。
本稿では,車両1台あたりの正確なフレームを効率よく抽出し,この単一画像からナンバープレート文字を認識できる2つの手法を提案する。
第1の方法は、ビデオから時間空間画像を生成するためにVisual Rhythm (VR) を用い、第2の方法は、リアルタイムに一直線ビデオ処理をベースとした新しいアルゴリズムであるAccumulative Line Analysis (ALA) を採用する。
どちらの手法も、フレーム内のナンバープレート検出にYOLO、光学文字認識(OCR)のための畳み込みニューラルネットワーク(CNN)を利用してテキスト情報を抽出する。
実ビデオ実験により,提案手法は従来のフレーム・バイ・フレーム方式に匹敵する処理速度を3倍に向上することを示した。
関連論文リスト
- Combining YOLO and Visual Rhythm for Vehicle Counting [0.36832029288386137]
ビデオによる車両の検知とカウントは、輸送インフラの管理において重要な役割を果たす。
従来の画像ベースのカウント手法は、通常、初期検出とその後の追跡という2つの主要なステップを含む。
本研究は、車両の検出とカウントのための代替的で効率的な方法を提案する。
論文 参考訳(メタデータ) (2025-01-08T14:33:47Z) - Efficient Video-Based ALPR System Using YOLO and Visual Rhythm [0.36832029288386137]
車両1台あたり1フレームを正確に抽出し,この特異画像からナンバープレート文字を認識できるシステムを提案する。
初期の実験では、この手法が有効であることが示されている。
論文 参考訳(メタデータ) (2025-01-04T12:15:58Z) - Neuromorphic Synergy for Video Binarization [54.195375576583864]
バイモーダルオブジェクトは視覚システムによって容易に認識できる情報を埋め込む視覚形式として機能する。
ニューロモルフィックカメラは、動きのぼかしを緩和する新しい機能を提供するが、最初にブルーを脱色し、画像をリアルタイムでバイナライズするのは簡単ではない。
本稿では,イベント空間と画像空間の両方で独立に推論を行うために,バイモーダル目標特性の事前知識を活用するイベントベースバイナリ再構築手法を提案する。
また、このバイナリ画像を高フレームレートバイナリビデオに伝搬する効率的な統合手法も開発している。
論文 参考訳(メタデータ) (2024-02-20T01:43:51Z) - Bidirectional Cross-Modal Knowledge Exploration for Video Recognition
with Pre-trained Vision-Language Models [149.1331903899298]
本稿では,双方向の知識を探索するクロスモーダルブリッジを用いた,BIKEと呼ばれる新しいフレームワークを提案する。
本研究では,テキスト・トゥ・ビデオの専門知識を用いて時間的サリエンシをパラメータフリーでキャプチャする時間的概念スポッティング機構を提案する。
我々の最良のモデルは、リリースしたCLIPモデルを使用して、Kinetics-400の挑戦に対して、最先端の精度88.6%を達成する。
論文 参考訳(メタデータ) (2022-12-31T11:36:53Z) - Deep Learning Computer Vision Algorithms for Real-time UAVs On-board
Camera Image Processing [77.34726150561087]
本稿では,ディープラーニングに基づくコンピュータビジョンアルゴリズムを用いて,小型UAVのリアルタイムセンサ処理を実現する方法について述べる。
すべてのアルゴリズムは、ディープニューラルネットワークに基づく最先端の画像処理手法を用いて開発されている。
論文 参考訳(メタデータ) (2022-11-02T11:10:42Z) - Frozen CLIP Models are Efficient Video Learners [86.73871814176795]
ビデオ認識はエンドツーエンドの学習パラダイムに支配されている。
Contrastive Vision-Language Pre-Trainingの最近の進歩は、視覚認識タスクのための新しいルートの道を開く。
高品質なビデオ認識モデルを直接トレーニングする効率的なフレームワークである、効率的なビデオ学習を提案する。
論文 参考訳(メタデータ) (2022-08-06T17:38:25Z) - NSNet: Non-saliency Suppression Sampler for Efficient Video Recognition [89.84188594758588]
非定常フレームの応答を抑制するために, NSNet(Non-Sliency Suppression Network)を提案する。
NSNetは最先端の精度効率トレードオフを実現し、最先端の手法よりもはるかに高速な2.44.3xの実用的な推論速度を示す。
論文 参考訳(メタデータ) (2022-07-21T09:41:22Z) - End-to-End License Plate Recognition Pipeline for Real-time Low Resource
Video Based Applications [0.43012765978447565]
リアルタイムの推論速度を実現するために、Vision APIと組み合わせた新しい2段階検出パイプラインを提案する。
私たちは、画像データセットと、野生のライセンスプレートを含むビデオデータセットに基づいて、モデルをトレーニングしました。
実時間処理速度(毎秒27.2フレーム)で妥当な検出・認識性能を観測した。
論文 参考訳(メタデータ) (2021-08-18T18:31:01Z) - Video Corpus Moment Retrieval with Contrastive Learning [56.249924768243375]
ビデオコーパスモーメント検索(VCMR)は、与えられたテキストクエリに意味的に対応する時間モーメントを取得することです。
VCMRのためのコントラシブラーニング(ReLoCLNet)を用いた検索・ローカリゼーションネットワークを提案する。
実験の結果、ReLoCLNetは効率のためにテキストとビデオを個別にエンコードし、その検索精度はクロスモーダル相互作用学習を採用するベースラインと匹敵する。
論文 参考訳(メタデータ) (2021-05-13T12:54:39Z) - Rethinking and Designing a High-performing Automatic License Plate
Recognition Approach [16.66787965777127]
そこで我々は,VSNetと呼ばれる新しい自動ナンバープレート認識(ALPR)手法を提案する。
VSNetには2つのCNN、すなわちライセンスプレート検出用のVertexNetとライセンスプレート認識用のSCR-Netが含まれている。
実験結果から,提案したVSNetは,エラー率の相対的改善率が50%以上向上し,最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-11-30T16:03:57Z) - Deep Learning Based Vehicle Tracking System Using License Plate
Detection And Recognition [0.0]
提案システムは,車両ナンバープレート検出・認識(OCR)技術を用いた車両追跡の新しい手法を用いている。
結果は、人間に近い精度で毎秒30フレームの速度で得られた。
論文 参考訳(メタデータ) (2020-05-10T14:03:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。