論文の概要: B-DRRN: A Block Information Constrained Deep Recursive Residual Network
for Video Compression Artifacts Reduction
- arxiv url: http://arxiv.org/abs/2101.09021v2
- Date: Sat, 30 Jan 2021 05:52:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-20 17:14:06.421146
- Title: B-DRRN: A Block Information Constrained Deep Recursive Residual Network
for Video Compression Artifacts Reduction
- Title(参考訳): B-DRRN:ビデオ圧縮アーチファクト削減のためのブロック情報制約付き深部再帰残差ネットワーク
- Authors: Trinh Man Hoang, Jinjia Zhou
- Abstract要約: ブロック情報を利用して,圧縮フレームの品質を向上させるニューラルネットワークを設計した。
実験の結果,提案したB-DRRNはHEVC標準に比べて6.16%のBDレートを低減できることがわかった。
- 参考スコア(独自算出の注目度): 10.637636148816803
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Although the video compression ratio nowadays becomes higher, the video
coders such as H.264/AVC, H.265/HEVC, H.266/VVC always suffer from the video
artifacts. In this paper, we design a neural network to enhance the quality of
the compressed frame by leveraging the block information, called B-DRRN (Deep
Recursive Residual Network with Block information). Firstly, an extra network
branch is designed for leveraging the block information of the coding unit
(CU). Moreover, to avoid a great increase in the network size, Recursive
Residual structure and sharing weight techniques are applied. We also conduct a
new large-scale dataset with 209,152 training samples. Experimental results
show that the proposed B-DRRN can reduce 6.16% BD-rate compared to the HEVC
standard. After efficiently adding an extra network branch, this work can
improve the performance of the main network without increasing any memory for
storing.
- Abstract(参考訳): H.264/AVC、H.265/HEVC、H.266/VVCなどのビデオコーダは常にビデオアーティファクトに悩まされている。
本稿では,B-DRRN(Deep Recursive Residual Network with Block Information)と呼ばれるブロック情報を活用することにより,圧縮フレームの品質を向上させるニューラルネットワークを設計する。
まず、符号化ユニット(CU)のブロック情報を活用するために、余分なネットワークブランチを設計する。
さらに,ネットワークサイズが大きく増加するのを避けるため,再帰的残差構造と共有重み法を適用した。
また、209,152のトレーニングサンプルを備えた新しい大規模データセットも実施しています。
実験の結果,提案したB-DRRNはHEVC標準に比べて6.16%のBDレートを低減できることがわかった。
追加のネットワークブランチを効率的に追加すると、メモリを増やさずにメインネットワークの性能を向上させることができる。
関連論文リスト
- TBSN: Transformer-Based Blind-Spot Network for Self-Supervised Image Denoising [94.09442506816724]
BSN(Blind-spot Network)は、自己教師型イメージデノベーション(SSID)において一般的なネットワークアーキテクチャである。
本稿では, ブラインドスポット要求を満たす変圧器演算子の解析と再設計により, 変圧器ベースブラインドスポットネットワーク(TBSN)を提案する。
空間的自己注意のために、注意行列に精巧なマスクを適用して受容場を制限し、拡張された畳み込みを模倣する。
チャネル自己アテンションについては,マルチスケールアーキテクチャの深層部において,チャネル数が空間的サイズよりも大きい場合,盲点情報を漏洩する可能性がある。
論文 参考訳(メタデータ) (2024-04-11T15:39:10Z) - VQ-NeRV: A Vector Quantized Neural Representation for Videos [3.6662666629446043]
Inlicit Neural representations (INR)は、ニューラルネットワーク内のビデオのエンコーディングに優れ、ビデオ圧縮やデノイングといったコンピュータビジョンタスクにおける約束を示す。
本稿では,新しいコンポーネントであるVQ-NeRVブロックを統合した,高度なU字型アーキテクチャであるVector Quantized-NeRV(VQ-NeRV)を紹介する。
このブロックには、ネットワークの浅い残差特徴とフレーム間の残差情報を効果的に識別するコードブック機構が組み込まれている。
論文 参考訳(メタデータ) (2024-03-19T03:19:07Z) - NERV++: An Enhanced Implicit Neural Video Representation [11.25130799452367]
強調された暗黙的ニューラルビデオ表現であるNeRV++のニューラル表現を導入する。
NeRV++は、オリジナルのNeRVデコーダアーキテクチャよりも単純だが効果的な拡張である。
提案手法をUVG,MCL JVC,Bunnyのデータセット上で評価し,INRによる映像圧縮の競合性を実現する。
論文 参考訳(メタデータ) (2024-02-28T13:00:32Z) - HNeRV: A Hybrid Neural Representation for Videos [56.492309149698606]
暗黙の神経表現は、動画をニューラルネットワークとして保存する。
ビデオ用ハイブリッドニューラル表現法(HNeRV)を提案する。
コンテンツ適応型埋め込みと再設計アーキテクチャにより、HNeRVはビデオレグレッションタスクにおいて暗黙のメソッドよりも優れる。
論文 参考訳(メタデータ) (2023-04-05T17:55:04Z) - A Codec Information Assisted Framework for Efficient Compressed Video
Super-Resolution [15.690562510147766]
リカレントニューラルネットワークアーキテクチャを用いたビデオ超解法(VSR)は、長距離時間依存性の効率的なモデリングのため、有望なソリューションである。
圧縮ビデオの繰り返しVSRモデルの高速化と高速化を目的としたコーデック情報支援フレームワーク(CIAF)を提案する。
論文 参考訳(メタデータ) (2022-10-15T08:48:29Z) - Graph Neural Networks for Channel Decoding [71.15576353630667]
低密度パリティチェック(LDPC)やBCH符号など、様々な符号化方式の競合復号性能を示す。
ニューラルネットワーク(NN)は、与えられたグラフ上で一般化されたメッセージパッシングアルゴリズムを学習する。
提案するデコーダを,従来のチャネル復号法および最近のディープラーニングに基づく結果と比較した。
論文 参考訳(メタデータ) (2022-07-29T15:29:18Z) - Structured Sparsity Learning for Efficient Video Super-Resolution [99.1632164448236]
我々は、ビデオ超解像(VSR)モデルの特性に応じて、構造化スパシティ学習(SSL)と呼ばれる構造化プルーニング手法を開発する。
SSLでは,残差ブロック,リカレントネットワーク,アップサンプリングネットワークなど,VSRモデルのいくつかの重要なコンポーネントに対するプルーニングスキームを設計する。
論文 参考訳(メタデータ) (2022-06-15T17:36:04Z) - Deep Networks for Image and Video Super-Resolution [30.75380029218373]
単一画像超解像(SISR)は、MDCB(Mixed-Dense connection block)と呼ばれる効率的な畳み込みユニットを用いて構築される。
ネットワークの2つのバージョンをトレーニングし、異なる損失構成を用いて相補的な画像品質を向上させる。
ネットワークは複数のフレームから情報を集約し,時間的整合性を維持するために学習する。
論文 参考訳(メタデータ) (2022-01-28T09:15:21Z) - BasicVSR++: Improving Video Super-Resolution with Enhanced Propagation
and Alignment [90.81396836308085]
我々は,伝播とアライメントの強化による再生フレームワークの強化により,映像情報をより効果的に活用できることを示す。
我々のモデルである BasicVSR++ は PSNR で BasicVSR を 0.82 dB で上回っている。
BasicVSR++は圧縮ビデオ強化などの他のビデオ復元タスクによく一般化される。
論文 参考訳(メタデータ) (2021-04-27T17:58:31Z) - CVEGAN: A Perceptually-inspired GAN for Compressed Video Enhancement [15.431248645312309]
CVEGAN(Compressed Video Quality Enhancement)のための新しいジェネレーティブ・アドバイザリアル・ネットワークを提案する。
CVEGANジェネレータは、新しいMul2Resブロック(複数レベルの残留学習枝を持つ)、強化された残留非局所ブロック(ERNB)、拡張された畳み込みブロックアテンションモジュール(ECBAM)の恩恵を受けている。
トレーニング戦略は、相対論的球面GAN(ReSphereGAN)トレーニング手法と新しい知覚的損失関数を併用するために、特にビデオ圧縮アプリケーションのために再設計されている。
論文 参考訳(メタデータ) (2020-11-18T10:24:38Z) - Learning for Video Compression with Recurrent Auto-Encoder and Recurrent
Probability Model [164.7489982837475]
本稿では、リカレントオートエンコーダ(RAE)とリカレント確率モデル(RPM)を用いたリカレントラーニングビデオ圧縮(RLVC)手法を提案する。
RAEは、ビデオフレーム間の時間的相関を利用するために、エンコーダとデコーダの両方で繰り返しセルを使用する。
提案手法は,PSNRとMS-SSIMの両方の観点から,最先端の学習ビデオ圧縮性能を実現する。
論文 参考訳(メタデータ) (2020-06-24T08:46:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。