論文の概要: Impact of Video Compression Artifacts on Fisheye Camera Visual Perception Tasks
- arxiv url: http://arxiv.org/abs/2403.16338v1
- Date: Mon, 25 Mar 2024 00:24:10 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-26 16:26:58.794385
- Title: Impact of Video Compression Artifacts on Fisheye Camera Visual Perception Tasks
- Title(参考訳): 魚眼カメラ視覚知覚課題における映像圧縮アーチファクトの影響
- Authors: Madhumitha Sakthi, Louis Kerofsky, Varun Ravi Kumar, Senthil Yogamani,
- Abstract要約: 広視野の魚眼カメラ画像に標準映像圧縮が与える影響を初めて分析する。
魚眼画像のアーチファクトの性能を評価するために,放射状歪みを意識した地域計量法を提案する。
- 参考スコア(独自算出の注目度): 6.528776084707627
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autonomous driving systems require extensive data collection schemes to cover the diverse scenarios needed for building a robust and safe system. The data volumes are in the order of Exabytes and have to be stored for a long period of time (i.e., more than 10 years of the vehicle's life cycle). Lossless compression doesn't provide sufficient compression ratios, hence, lossy video compression has been explored. It is essential to prove that lossy video compression artifacts do not impact the performance of the perception algorithms. However, there is limited work in this area to provide a solid conclusion. In particular, there is no such work for fisheye cameras, which have high radial distortion and where compression may have higher artifacts. Fisheye cameras are commonly used in automotive systems for 3D object detection task. In this work, we provide the first analysis of the impact of standard video compression codecs on wide FOV fisheye camera images. We demonstrate that the achievable compression with negligible impact depends on the dataset and temporal prediction of the video codec. We propose a radial distortion-aware zonal metric to evaluate the performance of artifacts in fisheye images. In addition, we present a novel method for estimating affine mode parameters of the latest VVC codec, and suggest some areas for improvement in video codecs for the application to fisheye imagery.
- Abstract(参考訳): 自律運転システムは、堅牢で安全なシステムを構築するのに必要なさまざまなシナリオをカバーするために、広範なデータ収集スキームを必要とする。
データボリュームはエクサバイトの順で、長期間保存されなければならない(つまり、車両のライフサイクルの10年以上)。
ロスレス圧縮は十分な圧縮比を提供していないため、失われたビデオ圧縮が検討されている。
損失のあるビデオ圧縮アーティファクトが認識アルゴリズムの性能に影響を与えないことを証明することが不可欠である。
しかし、この領域には確固たる結論を出すための仕事が限られている。
特に魚眼カメラには、高い放射歪みを持ち、圧縮がより高いアーティファクトを持つような作業は存在しない。
フィッシュアイカメラは3Dオブジェクト検出タスクのために自動車システムで一般的に使用される。
本研究では,標準的な映像圧縮コーデックが広帯域魚眼カメラ画像に与える影響を初めて解析する。
我々は,映像コーデックのデータセットと時間的予測に依存して,到達可能な圧縮を無視できることを示す。
魚眼画像のアーチファクトの性能を評価するために,放射状歪みを意識した地域計量法を提案する。
さらに,最新のVVCコーデックのアフィンモードパラメータを推定するための新しい手法を提案する。
関連論文リスト
- Blurry Video Compression: A Trade-off between Visual Enhancement and
Data Compression [65.8148169700705]
既存のビデオ圧縮(VC)手法は主に、ビデオ内の連続フレーム間の空間的および時間的冗長性を減らすことを目的としている。
これまでの研究は、インスタント(既知の)露光時間やシャッタースピードなどの特定の設定で取得されたビデオに対して、顕著な成果を上げてきた。
本研究では,シーン内のカメラ設定やダイナミックスによって,所定の映像がぼやけてしまうという一般的なシナリオにおいて,VCの問題に取り組む。
論文 参考訳(メタデータ) (2023-11-08T02:17:54Z) - Are Visual Recognition Models Robust to Image Compression? [23.280147529096908]
画像圧縮が視覚認知タスクに与える影響を解析する。
我々は、0.1ビットから2ビット/ピクセル(bpp)までの幅広い圧縮レベルについて検討する。
これら3つのタスクすべてにおいて,強い圧縮を使用する場合,認識能力に大きな影響があることが判明した。
論文 参考訳(メタデータ) (2023-04-10T11:30:11Z) - Exploring Long- and Short-Range Temporal Information for Learned Video
Compression [54.91301930491466]
圧縮性能を高めるために,映像コンテンツの特徴を活かし,時間的情報を探究することに注力する。
本稿では,画像群(GOP)内で画像の推測中に連続的に更新できる時間前処理を提案する。
この場合、時間的事前は、現在のGOP内のすべてのデコードされた画像の貴重な時間的情報を含む。
本稿では,マルチスケール補償を実現する階層構造を設計する。
論文 参考訳(メタデータ) (2022-08-07T15:57:18Z) - Microdosing: Knowledge Distillation for GAN based Compression [18.140328230701233]
そこで本研究では,知識蒸留を利用した画像デコーダの有効化について,元のパラメータ数のごく一部で示す。
これにより、モデルサイズを20倍に削減し、デコード時間の50%削減を実現できます。
論文 参考訳(メタデータ) (2022-01-07T14:27:16Z) - COMISR: Compression-Informed Video Super-Resolution [76.94152284740858]
ウェブやモバイルデバイスのほとんどのビデオは圧縮され、帯域幅が制限されると圧縮は厳しい。
圧縮によるアーティファクトを導入せずに高解像度コンテンツを復元する圧縮インフォームドビデオ超解像モデルを提案する。
論文 参考訳(メタデータ) (2021-05-04T01:24:44Z) - Sampling Based Scene-Space Video Processing [89.49726406622842]
ビデオ処理のための新しいサンプリングベースのフレームワークを提案する。
奥行きのミスやカメラのポーズ推定がある場合、高品質なシーン空間ビデオ効果を可能にする。
カジュアルにキャプチャーされた、手持ちの、動く、圧縮された、モノラルなビデオの結果を提示する。
論文 参考訳(メタデータ) (2021-02-05T05:55:04Z) - Towards Robust Data Hiding Against (JPEG) Compression: A
Pseudo-Differentiable Deep Learning Approach [78.05383266222285]
これらの圧縮に対抗できるデータ隠蔽の目標を達成することは、依然としてオープンな課題である。
ディープラーニングはデータの隠蔽に大きな成功を収めていますが、JPEGの非差別化性は、損失のある圧縮に対する堅牢性を改善するための深いパイプラインのトレーニングを困難にしています。
本稿では,上記の制約をすべて一度に解決するための,単純かつ効果的なアプローチを提案する。
論文 参考訳(メタデータ) (2020-12-30T12:30:09Z) - Analyzing and Mitigating JPEG Compression Defects in Deep Learning [69.04777875711646]
本稿では,JPEG圧縮が共通タスクやデータセットに与える影響を統一的に検討する。
高圧縮の一般的なパフォーマンス指標には大きなペナルティがあることが示される。
論文 参考訳(メタデータ) (2020-11-17T20:32:57Z) - Adversarial Distortion for Learned Video Compression [17.721259583120396]
副次的対向歪みを最小化する深層対向学習ビデオ圧縮モデルを提案する。
最先端の学習ビデオ圧縮システムを用いた実験では,特に高圧縮下での知覚的アーティファクトの低減と詳細の再構築が実証された。
論文 参考訳(メタデータ) (2020-04-20T17:06:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。