論文の概要: Video Compression with CNN-based Post Processing
- arxiv url: http://arxiv.org/abs/2009.07583v2
- Date: Thu, 14 Jan 2021 20:23:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-18 00:29:28.536946
- Title: Video Compression with CNN-based Post Processing
- Title(参考訳): CNNを用いたポストプロセッシングによる映像圧縮
- Authors: Fan Zhang, Di Ma, Chen Feng and David R. Bull
- Abstract要約: 本稿では,2つの最先端コーディング標準であるVVCとAV1を統合したCNNベースのポストプロセッシング手法を提案する。
その結果、様々な空間解像度でテストされた全てのシーケンスで一貫した符号化が得られ、それぞれ平均ビットレートは4.0%、AV1に対して5.8%である。
- 参考スコア(独自算出の注目度): 18.145942926665164
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In recent years, video compression techniques have been significantly
challenged by the rapidly increased demands associated with high quality and
immersive video content. Among various compression tools, post-processing can
be applied on reconstructed video content to mitigate visible compression
artefacts and to enhance overall perceptual quality. Inspired by advances in
deep learning, we propose a new CNN-based post-processing approach, which has
been integrated with two state-of-the-art coding standards, VVC and AV1. The
results show consistent coding gains on all tested sequences at various spatial
resolutions, with average bit rate savings of 4.0% and 5.8% against original
VVC and AV1 respectively (based on the assessment of PSNR). This network has
also been trained with perceptually inspired loss functions, which have further
improved reconstruction quality based on perceptual quality assessment (VMAF),
with average coding gains of 13.9% over VVC and 10.5% against AV1.
- Abstract(参考訳): 近年,映像圧縮技術は,高品質で没入的な映像コンテンツに対する要求が急速に高まっているため,大きな課題となっている。
様々な圧縮ツールの中で、後処理が再構成された映像コンテンツに適用され、可視圧縮アーチファクトが軽減され、全体的な知覚品質が向上する。
ディープラーニングの進歩に触発されて,最新の2つのコーディング標準であるvvcとav1を統合した,cnnベースのポストプロセッシング手法を提案する。
これらの結果から,PSNRの評価値から,各テストシーケンスの平均ビットレートは4.0%,AV1に対して5.8%と,様々な空間解像度で一貫した符号ゲインを示した。
また、このネットワークは知覚にインスパイアされた損失関数で訓練されており、知覚品質評価(VMAF)に基づく再構築品質がさらに向上し、平均符号ゲインはVVCが13.9%、AV1が10.5%となった。
関連論文リスト
- AIM 2024 Challenge on Compressed Video Quality Assessment: Methods and Results [120.95863275142727]
本稿では,ECCV 2024における画像操作の進歩(AIM)ワークショップと共同で開催されている圧縮映像品質評価の課題について述べる。
この課題は、様々な圧縮標準の14コーデックで符号化された459本の動画の多様なデータセット上で、VQA法の性能を評価することであった。
論文 参考訳(メタデータ) (2024-08-21T20:32:45Z) - Compression-Realized Deep Structural Network for Video Quality Enhancement [78.13020206633524]
本稿では,圧縮ビデオの品質向上の課題に焦点をあてる。
既存の手法のほとんどは、圧縮コーデック内での事前処理を最適に活用するための構造設計を欠いている。
新しいパラダイムは、より意識的な品質向上プロセスのために緊急に必要である。
論文 参考訳(メタデータ) (2024-05-10T09:18:17Z) - High Visual-Fidelity Learned Video Compression [6.609832462227998]
我々は,HVFVC(High Visual-Fidelity Learned Video Compression framework)を提案する。
具体的には,新たに出現した地域での貧弱な復興問題に対処するために,信頼度に基づく新しい特徴再構成手法を設計する。
広汎な実験により提案したHVFVCは、50%しか必要とせず、最新のVVC標準よりも優れた知覚品質が得られることが示された。
論文 参考訳(メタデータ) (2023-10-07T03:27:45Z) - HiNeRV: Video Compression with Hierarchical Encoding-based Neural
Representation [14.088444622391501]
Implicit Representations (INRs) は画像やビデオのコンテントの表現や圧縮に使われてきた。
既存のINRベースの手法は、ビデオ圧縮の最先端技術に匹敵する速度性能を達成できなかった。
軽量層と階層的位置符号化を組み合わせたINRであるHiNeRVを提案する。
論文 参考訳(メタデータ) (2023-06-16T12:59:52Z) - Perceptual Quality Assessment of Face Video Compression: A Benchmark and
An Effective Method [69.868145936998]
生成的符号化アプローチは、合理的な速度歪曲トレードオフを持つ有望な代替手段として認識されている。
従来のハイブリッドコーディングフレームワークから生成モデルまで、空間的・時間的領域における歪みの多様さは、圧縮顔画像品質評価(VQA)における大きな課題を提示する。
大規模圧縮顔画像品質評価(CFVQA)データベースを導入し,顔ビデオの知覚的品質と多角化圧縮歪みを体系的に理解するための最初の試みである。
論文 参考訳(メタデータ) (2023-04-14T11:26:09Z) - AlphaVC: High-Performance and Efficient Learned Video Compression [4.807439168741098]
コンディションIフレームをGoPの第1フレームとして導入し、再構成された品質を安定させ、ビットレートを節約する。
第二に,デコーダの複雑さを増大させることなく相互予測の精度を向上させるために,エンコーダ側の画素間動作予測手法を提案する。
第3に,性能向上だけでなく,エントロピー符号化の実行時間を大幅に削減する確率ベースのエントロピースキップ手法を提案する。
論文 参考訳(メタデータ) (2022-07-29T13:52:44Z) - Learned Video Compression via Heterogeneous Deformable Compensation
Network [78.72508633457392]
不安定な圧縮性能の問題に対処するために,不均一変形補償戦略(HDCVC)を用いた学習ビデオ圧縮フレームワークを提案する。
より具体的には、提案アルゴリズムは隣接する2つのフレームから特徴を抽出し、コンテンツ近傍の不均一な変形(HetDeform)カーネルオフセットを推定する。
実験結果から,HDCVCは最近の最先端の学習ビデオ圧縮手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2022-07-11T02:31:31Z) - Leveraging Bitstream Metadata for Fast, Accurate, Generalized Compressed
Video Quality Enhancement [74.1052624663082]
圧縮ビデオの細部を復元する深層学習アーキテクチャを開発した。
これにより,従来の圧縮補正法と比較して復元精度が向上することを示す。
我々は、ビットストリームで容易に利用できる量子化データに対して、我々のモデルを条件付けする。
論文 参考訳(メタデータ) (2022-01-31T18:56:04Z) - DVC-P: Deep Video Compression with Perceptual Optimizations [22.54270922884164]
本稿では,Deep Video compression with Perceptual Optimizations (DVC-P)を提案する。
具体的には、ネットワークの歪み、知覚、レートのトレードオフを支援するために、識別器ネットワークと混合損失を用いる。
論文 参考訳(メタデータ) (2021-09-22T17:20:13Z) - Perceptually-inspired super-resolution of compressed videos [18.72040343193715]
空間分解能適応は、符号化効率を高めるためにしばしばビデオ圧縮に使用される技法である。
近年の研究では、畳み込みニューラルネットワーク(CNN)に基づく高度な超解像法を用いて、再構築品質をさらに向上させている。
本稿では,CNNモデルを用いた圧縮映像の空間的アップサンプリングのために,知覚にインスパイアされた超解像法(M-SRGAN)を提案する。
論文 参考訳(メタデータ) (2021-06-15T13:50:24Z) - Towards Compact CNNs via Collaborative Compression [166.86915086497433]
チャネルプルーニングとテンソル分解を結合してCNNモデルを圧縮する協調圧縮方式を提案する。
52.9%のFLOPを削減し、ResNet-50で48.4%のパラメータを削除しました。
論文 参考訳(メタデータ) (2021-05-24T12:07:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。