論文の概要: Multi-scale Grouped Dense Network for VVC Intra Coding
- arxiv url: http://arxiv.org/abs/2005.07896v1
- Date: Sat, 16 May 2020 08:08:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-02 13:51:41.879311
- Title: Multi-scale Grouped Dense Network for VVC Intra Coding
- Title(参考訳): VVCイントラ符号化のためのマルチスケールグループデンスネットワーク
- Authors: Xin Li, Simeng Sun, Zhizheng Zhang and Zhibo Chen
- Abstract要約: Versatile Video Coding (H.266/VVC) は、他のどの画像よりも同じビットを保持する場合、画質が向上する。
圧縮アーチファクトをさらに削減するために,マルチスケールグループ密集ネットワーク(MSGDN)を設計する。
また,MSGDNをジェネレータとして利用し,ジェネレーティブ・逆境ネットワーク(MSGDN-GAN)を提案する。
- 参考スコア(独自算出の注目度): 39.86548434016985
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Versatile Video Coding (H.266/VVC) standard achieves better image quality
when keeping the same bits than any other conventional image codec, such as
BPG, JPEG, and etc. However, it is still attractive and challenging to improve
the image quality with high compression ratio on the basis of traditional
coding techniques. In this paper, we design the multi-scale grouped dense
network (MSGDN) to further reduce the compression artifacts by combining the
multi-scale and grouped dense block, which are integrated as the post-process
network of VVC intra coding. Besides, to improve the subjective quality of
compressed image, we also present a generative adversarial network (MSGDN-GAN)
by utilizing our MSGDN as generator. Across the extensive experiments on
validation set, our MSGDN trained by MSE losses yields the PSNR of 32.622 on
average with teams IMC at the bit-rate of 0.15 in Lowrate track. Moreover, our
MSGDN-GAN could achieve the better subjective performance.
- Abstract(参考訳): 汎用ビデオ符号化(h.266/vvc)標準は、bpgやjpegなど、他の一般的な画像コーデックと同じビットを保持することで、画質が向上する。
しかし、従来の符号化技術に基づいて高い圧縮比で画質を向上させることは、今でも魅力的で難しい。
本稿では,VVCイントラ符号化のプロセス後ネットワークとして統合されたマルチスケールおよびグループ化高密度ブロックを組み合わせることで,圧縮アーティファクトをさらに削減するために,マルチスケール・グループ化高密度ネットワーク(MSGDN)を設計する。
また,圧縮画像の主観的品質を向上させるため,MSGDNをジェネレータとして利用し,生成的対向ネットワーク(MSGDN-GAN)を提案する。
MSEの損失によってトレーニングされたMSGDNは、検証セットに関する広範な実験全体にわたって、平均で32.622のPSNRを、低レートトラックの0.15のビットレートで獲得する。
さらに,MSGDN-GANは主観的性能が向上した。
関連論文リスト
- Enhancing Perception Quality in Remote Sensing Image Compression via Invertible Neural Network [10.427300958330816]
リモートセンシング画像をデコードして、特に低解像度で高い知覚品質を実現することは、依然として大きな課題である。
Invertible Neural Network-based Remote Sensor Image compression (INN-RSIC)法を提案する。
我々の INN-RSIC は、認識品質の観点から、既存の最先端のディープラーニングベースの画像圧縮手法よりも優れています。
論文 参考訳(メタデータ) (2024-05-17T03:52:37Z) - JDEC: JPEG Decoding via Enhanced Continuous Cosine Coefficients [17.437568540883106]
本稿では,コサインの連続的定式化による局所的暗黙的ニューラル表現を用いたJPEG画像デコーディングの実践的手法を提案する。
提案するネットワークは,フレキシブルカラー画像JPEGアーティファクト削除タスクにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2024-04-03T03:28:04Z) - Bit Distribution Study and Implementation of Spatial Quality Map in the
JPEG-AI Standardization [39.71764233394706]
JPEG-AI検証モデルがリリースされ、現在標準化に向けて開発中である。
本稿では,JPEG-AI検証モデルのビット分布を最適化し,視覚的品質を向上させるための空間ビット割り当て手法を提案する。
論文 参考訳(メタデータ) (2024-02-27T12:52:44Z) - Semantic Ensemble Loss and Latent Refinement for High-Fidelity Neural Image Compression [58.618625678054826]
本研究は、最適な視覚的忠実度のために設計された強化されたニューラル圧縮手法を提案する。
我々は,洗練されたセマンティック・アンサンブル・ロス,シャルボニエ・ロス,知覚的損失,スタイル・ロス,非バイナリ・ディバイザ・ロスを組み込んだモデルを構築した。
実験により,本手法は神経画像圧縮の統計的忠実度を著しく向上させることが示された。
論文 参考訳(メタデータ) (2024-01-25T08:11:27Z) - Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG
Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。
実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文 参考訳(メタデータ) (2022-01-27T20:20:03Z) - A New Image Codec Paradigm for Human and Machine Uses [53.48873918537017]
本研究では,人間用と機械用の両方にスケーラブルな画像パラダイムを提案する。
高レベルのインスタンスセグメンテーションマップと低レベルの信号特徴をニューラルネットワークで抽出する。
画像は16ビットのグレースケールプロファイルと信号特徴を持つ一般的な画質のイメージ再構成を実現するために設計および訓練される。
論文 参考訳(メタデータ) (2021-12-19T06:17:38Z) - Learned Multi-Resolution Variable-Rate Image Compression with
Octave-based Residual Blocks [15.308823742699039]
一般化オクターブ畳み込み(GoConv)と一般化オクターブ畳み込み(GoTConv)を用いた新しい可変レート画像圧縮フレームワークを提案する。
単一モデルが異なるビットレートで動作し、複数レートの画像特徴を学習できるようにするため、新しい目的関数が導入される。
実験結果から,H.265/HEVCベースのBPGや最先端の学習に基づく可変レート法などの標準コーデックよりも高い性能を示した。
論文 参考訳(メタデータ) (2020-12-31T06:26:56Z) - Learning to Improve Image Compression without Changing the Standard
Decoder [100.32492297717056]
本稿では,標準デコーダによる符号化性能向上のための学習法を提案する。
具体的には、DCT係数の分布を最適化する周波数領域事前編集法を提案する。
JPEGデコーダは変更しないので、広く使われている標準JPEGデコーダで画像を見る際には、我々のアプローチが適用可能である。
論文 参考訳(メタデータ) (2020-09-27T19:24:42Z) - Learning for Video Compression with Hierarchical Quality and Recurrent
Enhancement [164.7489982837475]
本稿では,階層型ビデオ圧縮(HLVC)手法を提案する。
我々のHLVCアプローチでは、エンコーダ側とデコーダ側の低品質フレームの圧縮と強化を容易にするため、階層的品質は符号化効率の恩恵を受ける。
論文 参考訳(メタデータ) (2020-03-04T09:31:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。