論文の概要: Impact of Video Compression on the Performance of Object Detection
Systems for Surveillance Applications
- arxiv url: http://arxiv.org/abs/2211.05805v1
- Date: Thu, 10 Nov 2022 19:01:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-14 16:24:27.748890
- Title: Impact of Video Compression on the Performance of Object Detection
Systems for Surveillance Applications
- Title(参考訳): 監視用物体検出システムの性能に及ぼす映像圧縮の影響
- Authors: Michael O'Byrne, Vibhoothi, Mark Sugrue, and Anil Kokaram
- Abstract要約: ビデオは22,32,37,42,47の定レート係数(CRF)値を用いて5つの品質レベルで符号化された。
YOLOv5は圧縮ビデオに適用され、各CRFレベルで検出性能が解析された。
圧縮画像上でのYOLOv5のリトレーニングは、高度に圧縮された映像に適用した場合、F1スコアが最大1%向上する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This study examines the relationship between H.264 video compression and the
performance of an object detection network (YOLOv5). We curated a set of 50
surveillance videos and annotated targets of interest (people, bikes, and
vehicles). Videos were encoded at 5 quality levels using Constant Rate Factor
(CRF) values in the set {22,32,37,42,47}. YOLOv5 was applied to compressed
videos and detection performance was analyzed at each CRF level. Test results
indicate that the detection performance is generally robust to moderate levels
of compression; using a CRF value of 37 instead of 22 leads to significantly
reduced bitrates/file sizes without adversely affecting detection performance.
However, detection performance degrades appreciably at higher compression
levels, especially in complex scenes with poor lighting and fast-moving
targets. Finally, retraining YOLOv5 on compressed imagery gives up to a 1%
improvement in F1 score when applied to highly compressed footage.
- Abstract(参考訳): 本研究では,H.264ビデオ圧縮とオブジェクト検出ネットワーク(YOLOv5)の性能の関係について検討する。
われわれは50の監視ビデオと注釈付き関心の対象(人、自転車、車両)をキュレートした。
ビデオは、セット {22,32,37,42,47} の定数レート係数(CRF)値を用いて、5つの品質レベルで符号化された。
YOLOv5は圧縮ビデオに適用され、各CRFレベルで検出性能が解析された。
テスト結果は、検出性能が適度な圧縮レベルに強いことを示している。22ではなく37のcrf値を使用することで、検出性能に悪影響を及ぼすことなく、ビットレート/ファイルサイズが著しく減少する。
しかし、特に照明の弱い複雑なシーンや高速移動ターゲットでは、高い圧縮レベルで検出性能が低下する。
最後に、圧縮画像上でのYOLOv5の再トレーニングでは、高圧縮映像に適用した場合、F1スコアが1%向上する。
関連論文リスト
- AIM 2024 Challenge on Compressed Video Quality Assessment: Methods and Results [120.95863275142727]
本稿では,ECCV 2024における画像操作の進歩(AIM)ワークショップと共同で開催されている圧縮映像品質評価の課題について述べる。
この課題は、様々な圧縮標準の14コーデックで符号化された459本の動画の多様なデータセット上で、VQA法の性能を評価することであった。
論文 参考訳(メタデータ) (2024-08-21T20:32:45Z) - SpikeCodec: An End-to-end Learned Compression Framework for Spiking
Camera [48.194993029659685]
連続的なモーション記録機能を備えたバイオインスピレーション付きスパイクカメラは、大きな注目を集めている。
本研究では,シーンリカバリ,変分自動エンコーダとスパイクシミュレータを用いた新しいスパイク圧縮フレームワークを提案する。
我々の知る限り、これは効率的でロバストなスパイクストリーム圧縮のための最初のデータ訓練モデルである。
論文 参考訳(メタデータ) (2023-06-25T03:11:21Z) - AlphaVC: High-Performance and Efficient Learned Video Compression [4.807439168741098]
コンディションIフレームをGoPの第1フレームとして導入し、再構成された品質を安定させ、ビットレートを節約する。
第二に,デコーダの複雑さを増大させることなく相互予測の精度を向上させるために,エンコーダ側の画素間動作予測手法を提案する。
第3に,性能向上だけでなく,エントロピー符号化の実行時間を大幅に削減する確率ベースのエントロピースキップ手法を提案する。
論文 参考訳(メタデータ) (2022-07-29T13:52:44Z) - Learned Video Compression via Heterogeneous Deformable Compensation
Network [78.72508633457392]
不安定な圧縮性能の問題に対処するために,不均一変形補償戦略(HDCVC)を用いた学習ビデオ圧縮フレームワークを提案する。
より具体的には、提案アルゴリズムは隣接する2つのフレームから特徴を抽出し、コンテンツ近傍の不均一な変形(HetDeform)カーネルオフセットを推定する。
実験結果から,HDCVCは最近の最先端の学習ビデオ圧縮手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2022-07-11T02:31:31Z) - Lost in Compression: the Impact of Lossy Image Compression on Variable
Size Object Detection within Infrared Imagery [11.135527192198092]
ロスシー画像圧縮戦略は、データを縮小形式に符号化することで、データのより効率的な保存と送信を可能にする。
これは、より少ないストレージ環境において、より大きなデータセットによるトレーニングを可能にするために不可欠である。
本研究では,95,75,50,15,10,5の圧縮レベルを6つの離散的に増加させたJPEG圧縮法を赤外線(熱)画像に適用する。
論文 参考訳(メタデータ) (2022-05-16T21:54:32Z) - Operationalizing Convolutional Neural Network Architectures for
Prohibited Object Detection in X-Ray Imagery [15.694880385913534]
本稿では,近年の2つのエンドツーエンドオブジェクト検出CNNアーキテクチャ,Cascade R-CNNとFreeAnchorの実現可能性について検討する。
パラメータが少なく訓練時間も少ないため、FreeAnchorは13 fps (3.9 ms)の最大検出速度を達成している。
CNNモデルは、損失のある圧縮に対してかなりのレジリエンスを示し、JPEG圧縮レベル50においてmAPの1.1%しか減少しない。
論文 参考訳(メタデータ) (2021-10-10T21:20:04Z) - Towards Compact CNNs via Collaborative Compression [166.86915086497433]
チャネルプルーニングとテンソル分解を結合してCNNモデルを圧縮する協調圧縮方式を提案する。
52.9%のFLOPを削減し、ResNet-50で48.4%のパラメータを削除しました。
論文 参考訳(メタデータ) (2021-05-24T12:07:38Z) - Analyzing and Mitigating JPEG Compression Defects in Deep Learning [69.04777875711646]
本稿では,JPEG圧縮が共通タスクやデータセットに与える影響を統一的に検討する。
高圧縮の一般的なパフォーマンス指標には大きなペナルティがあることが示される。
論文 参考訳(メタデータ) (2020-11-17T20:32:57Z) - Coherent Loss: A Generic Framework for Stable Video Segmentation [103.78087255807482]
ビデオセグメンテーションの結果の視覚的品質を,ジッタリングアーティファクトがいかに劣化させるかを検討する。
本稿では,ニューラルネットワークの性能向上を目的とした汎用フレームワークを備えたコヒーレントロスを提案する。
論文 参考訳(メタデータ) (2020-10-25T10:48:28Z) - Video Compression with CNN-based Post Processing [18.145942926665164]
本稿では,2つの最先端コーディング標準であるVVCとAV1を統合したCNNベースのポストプロセッシング手法を提案する。
その結果、様々な空間解像度でテストされた全てのシーケンスで一貫した符号化が得られ、それぞれ平均ビットレートは4.0%、AV1に対して5.8%である。
論文 参考訳(メタデータ) (2020-09-16T10:07:32Z) - On the Impact of Lossy Image and Video Compression on the Performance of
Deep Convolutional Neural Network Architectures [17.349420462716886]
本研究では,画像と映像の圧縮技術がディープラーニングアーキテクチャの性能に与える影響について検討する。
本研究では,人間のポーズ推定,セマンティックセグメンテーション,オブジェクト検出,行動認識,単眼深度推定の5つのタスクにおけるパフォーマンスへの影響について検討する。
その結果,ネットワーク性能と損失圧縮のレベルとの間には,非線形および不均一な関係が認められた。
論文 参考訳(メタデータ) (2020-07-28T15:37:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。