論文の概要: Variable Rate Video Compression using a Hybrid Recurrent Convolutional
Learning Framework
- arxiv url: http://arxiv.org/abs/2004.04244v2
- Date: Fri, 21 Aug 2020 20:21:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-15 08:46:53.182122
- Title: Variable Rate Video Compression using a Hybrid Recurrent Convolutional
Learning Framework
- Title(参考訳): ハイブリッドリカレント畳み込み学習フレームワークを用いた可変レートビデオ圧縮
- Authors: Aishwarya Jadhav
- Abstract要約: 本稿では,予測自動符号化の概念に基づくハイブリッドビデオ圧縮フレームワークであるPredEncoderを提案する。
可変レートブロック符号化方式が論文で提案され,ビットレート比が著しく向上した。
- 参考スコア(独自算出の注目度): 1.9290392443571382
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, neural network-based image compression techniques have been
able to outperform traditional codecs and have opened the gates for the
development of learning-based video codecs. However, to take advantage of the
high temporal correlation in videos, more sophisticated architectures need to
be employed. This paper presents PredEncoder, a hybrid video compression
framework based on the concept of predictive auto-encoding that models the
temporal correlations between consecutive video frames using a prediction
network which is then combined with a progressive encoder network to exploit
the spatial redundancies. A variable-rate block encoding scheme has been
proposed in the paper that leads to remarkably high quality to bit-rate ratios.
By joint training and fine-tuning of this hybrid architecture, PredEncoder has
been able to gain significant improvement over the MPEG-4 codec and has
achieved bit-rate savings over the H.264 codec in the low to medium bit-rate
range for HD videos and comparable results over most bit-rates for non-HD
videos. This paper serves to demonstrate how neural architectures can be
leveraged to perform at par with the highly optimized traditional methodologies
in the video compression domain.
- Abstract(参考訳): 近年、ニューラルネットワークベースの画像圧縮技術は従来のコーデックよりも優れており、学習ベースのビデオコーデックの開発のための門を開いた。
しかし、ビデオの高時間相関を利用するには、より高度なアーキテクチャを採用する必要がある。
本稿では,プログレッシブエンコーダネットワークと組み合わせた予測ネットワークを用いて,連続する映像フレーム間の時間的相関をモデル化する予測自動エンコーディングの概念に基づくハイブリッドビデオ圧縮フレームワークpredencoderを提案する。
可変レートブロック符号化方式が論文で提案され,ビットレート比が著しく向上した。
このハイブリッドアーキテクチャの共同トレーニングと微調整により、PredEncoderはMPEG-4コーデックよりも大幅に改善され、HDビデオではH.264コーデックよりも低ビットレートでビットレートの節約を実現した。
本稿では,ビデオ圧縮領域において,高度に最適化された従来の手法と同等に,ニューラルアーキテクチャを活用する方法を示す。
関連論文リスト
- High-Efficiency Neural Video Compression via Hierarchical Predictive Learning [27.41398149573729]
強化されたDeep Hierarchical Video Compression(DHVC 2.0)は、優れた圧縮性能と目覚ましい複雑さの効率を導入する。
階層的な予測符号化を使用して、各ビデオフレームをマルチスケール表現に変換する。
トランスミッションフレンドリーなプログレッシブデコーディングをサポートしており、パケットロスの存在下では特にネットワーク化されたビデオアプリケーションに有利である。
論文 参考訳(メタデータ) (2024-10-03T15:40:58Z) - Accelerating Learned Video Compression via Low-Resolution Representation Learning [18.399027308582596]
低解像度表現学習に焦点を当てた学習ビデオ圧縮のための効率最適化フレームワークを提案する。
提案手法は,H.266参照ソフトウェアVTMの低遅延P構成と同等の性能を実現する。
論文 参考訳(メタデータ) (2024-07-23T12:02:57Z) - Prediction and Reference Quality Adaptation for Learned Video Compression [54.58691829087094]
本研究では,空間的およびチャネル的予測品質差の明確な識別を行うために,信頼度に基づく予測品質適応(PQA)モジュールを提案する。
また、参照品質適応(RQA)モジュールと関連する繰り返し学習戦略を提案し、様々な参照品質のための動的空間変化フィルタを提供する。
論文 参考訳(メタデータ) (2024-06-20T09:03:26Z) - HiNeRV: Video Compression with Hierarchical Encoding-based Neural
Representation [14.088444622391501]
Implicit Representations (INRs) は画像やビデオのコンテントの表現や圧縮に使われてきた。
既存のINRベースの手法は、ビデオ圧縮の最先端技術に匹敵する速度性能を達成できなかった。
軽量層と階層的位置符号化を組み合わせたINRであるHiNeRVを提案する。
論文 参考訳(メタデータ) (2023-06-16T12:59:52Z) - Low-complexity Deep Video Compression with A Distributed Coding
Architecture [4.5885672744218]
一般的な予測符号化に基づくビデオ圧縮手法は、時間的冗長性を低減するために重エンコーダに依存している。
従来の分散コーディング手法は、予測的コーディングとはかなりのパフォーマンスギャップに悩まされている。
本稿では,レート歪み特性を改善するために,最初のエンドツーエンドの分散ビデオ圧縮フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-21T05:34:04Z) - A Coding Framework and Benchmark towards Low-Bitrate Video Understanding [63.05385140193666]
我々は,従来のコーデックとニューラルネットワーク(NN)の両方を活用する,従来型ニューラル混合符号化フレームワークを提案する。
このフレームワークは、動画の移動効率の良いセマンティック表現を確実に保持することで最適化される。
8つのデータセットに3つのダウンストリームタスクを備えた低ビットレートビデオ理解ベンチマークを構築し、このアプローチの顕著な優位性を実証した。
論文 参考訳(メタデータ) (2022-02-06T16:29:15Z) - Leveraging Bitstream Metadata for Fast, Accurate, Generalized Compressed
Video Quality Enhancement [74.1052624663082]
圧縮ビデオの細部を復元する深層学習アーキテクチャを開発した。
これにより,従来の圧縮補正法と比較して復元精度が向上することを示す。
我々は、ビットストリームで容易に利用できる量子化データに対して、我々のモデルを条件付けする。
論文 参考訳(メタデータ) (2022-01-31T18:56:04Z) - Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG
Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。
実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文 参考訳(メタデータ) (2022-01-27T20:20:03Z) - Conditional Entropy Coding for Efficient Video Compression [82.35389813794372]
本稿では,フレーム間の条件エントロピーをモデル化することのみに焦点を当てた,非常にシンプルで効率的なビデオ圧縮フレームワークを提案する。
まず、画像遅延符号間のエントロピーをモデル化する単純なアーキテクチャが、他のニューラルビデオ圧縮やビデオコーデックと同等の競争力を持つことを示す。
次に、このアーキテクチャの上に新しい内部学習拡張を提案し、復号速度を抑えることなく10%の節約を実現した。
論文 参考訳(メタデータ) (2020-08-20T20:01:59Z) - Content Adaptive and Error Propagation Aware Deep Video Compression [110.31693187153084]
本稿では,コンテンツ適応型・誤り伝搬対応型ビデオ圧縮システムを提案する。
本手法では, 複数フレームの圧縮性能を1フレームではなく複数フレームで考慮し, 共同学習手法を用いる。
従来の圧縮システムでは手作りのコーディングモードを使用する代わりに,オンラインエンコーダ更新方式をシステム内に設計する。
論文 参考訳(メタデータ) (2020-03-25T09:04:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。