論文の概要: High Visual-Fidelity Learned Video Compression
- arxiv url: http://arxiv.org/abs/2310.04679v1
- Date: Sat, 7 Oct 2023 03:27:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-12 16:51:15.458453
- Title: High Visual-Fidelity Learned Video Compression
- Title(参考訳): 高視認性学習ビデオ圧縮
- Authors: Meng Li, Yibo Shi, Jing Wang, Yunqi Huang
- Abstract要約: 我々は,HVFVC(High Visual-Fidelity Learned Video Compression framework)を提案する。
具体的には,新たに出現した地域での貧弱な復興問題に対処するために,信頼度に基づく新しい特徴再構成手法を設計する。
広汎な実験により提案したHVFVCは、50%しか必要とせず、最新のVVC標準よりも優れた知覚品質が得られることが示された。
- 参考スコア(独自算出の注目度): 6.609832462227998
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the growing demand for video applications, many advanced learned video
compression methods have been developed, outperforming traditional methods in
terms of objective quality metrics such as PSNR. Existing methods primarily
focus on objective quality but tend to overlook perceptual quality. Directly
incorporating perceptual loss into a learned video compression framework is
nontrivial and raises several perceptual quality issues that need to be
addressed. In this paper, we investigated these issues in learned video
compression and propose a novel High Visual-Fidelity Learned Video Compression
framework (HVFVC). Specifically, we design a novel confidence-based feature
reconstruction method to address the issue of poor reconstruction in
newly-emerged regions, which significantly improves the visual quality of the
reconstruction. Furthermore, we present a periodic compensation loss to
mitigate the checkerboard artifacts related to deconvolution operation and
optimization. Extensive experiments have shown that the proposed HVFVC achieves
excellent perceptual quality, outperforming the latest VVC standard with only
50% required bitrate.
- Abstract(参考訳): ビデオアプリケーションへの需要が高まり、psnrのような客観的品質指標で従来の方法よりも優れる、多くの高度な学習ビデオ圧縮手法が開発されている。
既存の手法は主に客観的な品質に焦点を合わせているが、知覚的品質を見落としがちである。
学習ビデオ圧縮フレームワークに知覚的損失を直接組み込むことは簡単ではなく、対処しなければならない知覚的品質の問題を引き起こす。
本稿では,学習ビデオ圧縮におけるこれらの課題を調査し,高忠実度学習ビデオ圧縮フレームワーク(hvfvc)を提案する。
具体的には,新たに導入した地域における貧弱な復興問題に対処するための,信頼度に基づく新しい特徴再構築手法を設計し,その視覚的品質を著しく向上させる。
さらに,デコンボリューション操作と最適化に関連するチェッカーボードアーティファクトを緩和するために,周期的な補償損失を示す。
広汎な実験により,提案したHVFVCは高い知覚品質を達成し,最新のVVC標準を50%のビットレートで上回った。
関連論文リスト
- RMT-BVQA: Recurrent Memory Transformer-based Blind Video Quality Assessment for Enhanced Video Content [7.283653823423298]
本稿では,映像コンテンツの改良を目的とした新しいブラインド・ディープ・ビデオ品質評価手法を提案する。
新しいリカレントメモリトランス (Recurrent Memory Transformer, RMT) ベースのネットワークアーキテクチャを使用して、ビデオ品質の表現を得る。
抽出された品質表現は線形回帰によって合成され、ビデオレベルの品質指標を生成する。
論文 参考訳(メタデータ) (2024-05-14T14:01:15Z) - Compression-Realized Deep Structural Network for Video Quality Enhancement [78.13020206633524]
本稿では,圧縮ビデオの品質向上の課題に焦点をあてる。
既存の手法のほとんどは、圧縮コーデック内での事前処理を最適に活用するための構造設計を欠いている。
新しいパラダイムは、より意識的な品質向上プロセスのために緊急に必要である。
論文 参考訳(メタデータ) (2024-05-10T09:18:17Z) - Blurry Video Compression: A Trade-off between Visual Enhancement and
Data Compression [65.8148169700705]
既存のビデオ圧縮(VC)手法は主に、ビデオ内の連続フレーム間の空間的および時間的冗長性を減らすことを目的としている。
これまでの研究は、インスタント(既知の)露光時間やシャッタースピードなどの特定の設定で取得されたビデオに対して、顕著な成果を上げてきた。
本研究では,シーン内のカメラ設定やダイナミックスによって,所定の映像がぼやけてしまうという一般的なシナリオにおいて,VCの問題に取り組む。
論文 参考訳(メタデータ) (2023-11-08T02:17:54Z) - Perceptual Quality Improvement in Videoconferencing using
Keyframes-based GAN [28.773037051085318]
本稿では,ビデオ会議における圧縮アーティファクト削減のための新しいGAN手法を提案する。
まず,圧縮および参照フレームからマルチスケールの特徴を抽出する。
そして、私たちのアーキテクチャは、顔のランドマークに従って、これらの特徴を段階的に組み合わせます。
論文 参考訳(メタデータ) (2023-11-07T16:38:23Z) - Perceptual Quality Assessment of Face Video Compression: A Benchmark and
An Effective Method [69.868145936998]
生成的符号化アプローチは、合理的な速度歪曲トレードオフを持つ有望な代替手段として認識されている。
従来のハイブリッドコーディングフレームワークから生成モデルまで、空間的・時間的領域における歪みの多様さは、圧縮顔画像品質評価(VQA)における大きな課題を提示する。
大規模圧縮顔画像品質評価(CFVQA)データベースを導入し,顔ビデオの知覚的品質と多角化圧縮歪みを体系的に理解するための最初の試みである。
論文 参考訳(メタデータ) (2023-04-14T11:26:09Z) - Learned Video Compression via Heterogeneous Deformable Compensation
Network [78.72508633457392]
不安定な圧縮性能の問題に対処するために,不均一変形補償戦略(HDCVC)を用いた学習ビデオ圧縮フレームワークを提案する。
より具体的には、提案アルゴリズムは隣接する2つのフレームから特徴を抽出し、コンテンツ近傍の不均一な変形(HetDeform)カーネルオフセットを推定する。
実験結果から,HDCVCは最近の最先端の学習ビデオ圧縮手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2022-07-11T02:31:31Z) - Leveraging Bitstream Metadata for Fast, Accurate, Generalized Compressed
Video Quality Enhancement [74.1052624663082]
圧縮ビデオの細部を復元する深層学習アーキテクチャを開発した。
これにより,従来の圧縮補正法と比較して復元精度が向上することを示す。
我々は、ビットストリームで容易に利用できる量子化データに対して、我々のモデルを条件付けする。
論文 参考訳(メタデータ) (2022-01-31T18:56:04Z) - Video Compression with CNN-based Post Processing [18.145942926665164]
本稿では,2つの最先端コーディング標準であるVVCとAV1を統合したCNNベースのポストプロセッシング手法を提案する。
その結果、様々な空間解像度でテストされた全てのシーケンスで一貫した符号化が得られ、それぞれ平均ビットレートは4.0%、AV1に対して5.8%である。
論文 参考訳(メタデータ) (2020-09-16T10:07:32Z) - Early Exit or Not: Resource-Efficient Blind Quality Enhancement for
Compressed Images [54.40852143927333]
ロスシー画像圧縮は、通信帯域を節約するために広範に行われ、望ましくない圧縮アーティファクトをもたらす。
圧縮画像に対する資源効率の高いブラインド品質向上手法(RBQE)を提案する。
提案手法は, 評価された画像の品質に応じて, 自動的にエンハンスメントを終了するか, 継続するかを決定することができる。
論文 参考訳(メタデータ) (2020-06-30T07:38:47Z) - Feedback Recurrent Autoencoder for Video Compression [14.072596106425072]
低レイテンシモードで動作する学習ビデオ圧縮のための新しいネットワークアーキテクチャを提案する。
提案手法は,高分解能UVGデータセット上でのMS-SSIM/レート性能を示す。
論文 参考訳(メタデータ) (2020-04-09T02:58:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。