論文の概要: Efficient Video Compression via Content-Adaptive Super-Resolution
- arxiv url: http://arxiv.org/abs/2104.02322v1
- Date: Tue, 6 Apr 2021 07:01:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-07 14:27:19.899029
- Title: Efficient Video Compression via Content-Adaptive Super-Resolution
- Title(参考訳): コンテンツ適応型スーパーリゾリューションによる効率的な映像圧縮
- Authors: Mehrdad Khani, Vibhaalakshmi Sivaraman, Mohammad Alizadeh
- Abstract要約: ビデオ圧縮はインターネットビデオ配信の重要なコンポーネントである。
近年の研究では、ディープラーニング技術が人間のアルゴリズムに匹敵する、あるいは優れていることが示されている。
本稿では,最近の深層学習に基づくビデオ圧縮方式を補強する新しい手法を提案する。
- 参考スコア(独自算出の注目度): 11.6624528293976
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Video compression is a critical component of Internet video delivery. Recent
work has shown that deep learning techniques can rival or outperform
human-designed algorithms, but these methods are significantly less compute and
power-efficient than existing codecs. This paper presents a new approach that
augments existing codecs with a small, content-adaptive super-resolution model
that significantly boosts video quality. Our method, SRVC, encodes video into
two bitstreams: (i) a content stream, produced by compressing downsampled
low-resolution video with the existing codec, (ii) a model stream, which
encodes periodic updates to a lightweight super-resolution neural network
customized for short segments of the video. SRVC decodes the video by passing
the decompressed low-resolution video frames through the (time-varying)
super-resolution model to reconstruct high-resolution video frames. Our results
show that to achieve the same PSNR, SRVC requires 16% of the bits-per-pixel of
H.265 in slow mode, and 2% of the bits-per-pixel of DVC, a recent deep
learning-based video compression scheme. SRVC runs at 90 frames per second on a
NVIDIA V100 GPU.
- Abstract(参考訳): ビデオ圧縮はインターネットビデオ配信の重要なコンポーネントである。
近年の研究では、ディープラーニング技術は人間の設計したアルゴリズムに匹敵したり、性能を上回ったりすることが示されている。
本稿では,映像品質を大幅に向上させる小型コンテンツ適応型超解像モデルにより,既存のコーデックを増強する手法を提案する。
SRVCは,映像を2つのビットストリームにエンコードする: (i) ダウンサンプリングされた低解像度映像を既存のコーデックで圧縮したコンテンツストリーム, (ii) ビデオの短いセグメント用にカスタマイズされた軽量超解像度ニューラルネットワークへの定期的な更新をエンコードするモデルストリーム。
SRVCは、圧縮された低解像度ビデオフレームを(時変の)超解像度モデルに渡して高解像度ビデオフレームを再構成することで、ビデオをデコードする。
以上の結果から, SRVC は同じ PSNR を実現するためには, H.265 ピクセルあたりの16% と DVC ビット毎の2% を必要とすることがわかった。
SRVCはNVIDIA V100 GPU上で毎秒90フレームで動作する。
関連論文リスト
- NU-Class Net: A Novel Deep Learning-based Approach for Video Quality
Enhancement [1.9964933018731446]
本稿では,圧縮コーデックによる圧縮アーチファクトの軽減を目的とした,革新的な深層学習モデルであるNU-Class Netを紹介する。
NU-Class Netを利用することで、ビデオキャプチャノード内のビデオエンコーダは出力品質を低下させ、低ビットレートのビデオを生成することができる。
実験により,低ビットレートでストリーミングされたビデオの知覚品質を高めるためのモデルの有効性が確認された。
論文 参考訳(メタデータ) (2024-01-02T11:46:42Z) - Video Compression with Arbitrary Rescaling Network [8.489428003916622]
符号化前のビデオリサイズのためのレート誘導任意再スケーリングネットワーク(RARN)を提案する。
軽量RARN構造は、FHD(1080p)コンテンツをリアルタイム(91 FPS)で処理し、かなりのレート低下を得ることができる。
論文 参考訳(メタデータ) (2023-06-07T07:15:18Z) - Gemino: Practical and Robust Neural Compression for Video Conferencing [19.137804113000474]
Geminoは、新しい高周波超解像パイプラインに基づくビデオ会議のための新しいニューラル圧縮システムである。
我々は,GeminoがTitan X GPU上でリアルタイムに動画を処理し,従来のビデオコーデックよりも2.2~5倍低画質で知覚品質を実現していることを示す。
論文 参考訳(メタデータ) (2022-09-21T17:10:46Z) - Block Modulating Video Compression: An Ultra Low Complexity Image
Compression Encoder for Resource Limited Platforms [15.646001803032421]
省電力・計算資源の少ないモバイルプラットフォーム上で, BMVCの超低コスト化が提案されている。
ディープニューラルネットワークによって実装された2種類のBMVCデコーダを提示する。
論文 参考訳(メタデータ) (2022-05-07T16:20:09Z) - Perceptual Coding for Compressed Video Understanding: A New Framework
and Benchmark [57.23523738351178]
本稿では,ビデオ理解のための最初のプログラミングフレームワークを提案する。このフレームワークでは,別の学習可能な知覚ビットストリームを導入し,同時にビデオビットストリームを転送する。
このフレームワークは,(1)産業用ビデオの高能率コンテンツ符号化,(2)ニューラルネットワーク(NN)のフレキシブルパーセプチュアル符号化,という2つの世界の長所を享受することができる。
論文 参考訳(メタデータ) (2022-02-06T16:29:15Z) - Leveraging Bitstream Metadata for Fast, Accurate, Generalized Compressed
Video Quality Enhancement [74.1052624663082]
圧縮ビデオの細部を復元する深層学習アーキテクチャを開発した。
これにより,従来の圧縮補正法と比較して復元精度が向上することを示す。
我々は、ビットストリームで容易に利用できる量子化データに対して、我々のモデルを条件付けする。
論文 参考訳(メタデータ) (2022-01-31T18:56:04Z) - COMISR: Compression-Informed Video Super-Resolution [76.94152284740858]
ウェブやモバイルデバイスのほとんどのビデオは圧縮され、帯域幅が制限されると圧縮は厳しい。
圧縮によるアーティファクトを導入せずに高解像度コンテンツを復元する圧縮インフォームドビデオ超解像モデルを提案する。
論文 参考訳(メタデータ) (2021-05-04T01:24:44Z) - Learning to Compress Videos without Computing Motion [39.46212197928986]
動き推定を必要としない新しいディープラーニングビデオ圧縮アーキテクチャを提案する。
本フレームワークでは,映像のフレーム差分を映像表現として利用することにより,映像の動きに固有の規則性を利用する。
実験の結果,Motionless VIdeo Codec (MOVI-Codec) と呼ばれる圧縮モデルは,動きを計算せずに効率的に動画を圧縮する方法を学習することがわかった。
論文 参考訳(メタデータ) (2020-09-29T15:49:25Z) - Conditional Entropy Coding for Efficient Video Compression [82.35389813794372]
本稿では,フレーム間の条件エントロピーをモデル化することのみに焦点を当てた,非常にシンプルで効率的なビデオ圧縮フレームワークを提案する。
まず、画像遅延符号間のエントロピーをモデル化する単純なアーキテクチャが、他のニューラルビデオ圧縮やビデオコーデックと同等の競争力を持つことを示す。
次に、このアーキテクチャの上に新しい内部学習拡張を提案し、復号速度を抑えることなく10%の節約を実現した。
論文 参考訳(メタデータ) (2020-08-20T20:01:59Z) - Content Adaptive and Error Propagation Aware Deep Video Compression [110.31693187153084]
本稿では,コンテンツ適応型・誤り伝搬対応型ビデオ圧縮システムを提案する。
本手法では, 複数フレームの圧縮性能を1フレームではなく複数フレームで考慮し, 共同学習手法を用いる。
従来の圧縮システムでは手作りのコーディングモードを使用する代わりに,オンラインエンコーダ更新方式をシステム内に設計する。
論文 参考訳(メタデータ) (2020-03-25T09:04:24Z) - Learning for Video Compression with Hierarchical Quality and Recurrent
Enhancement [164.7489982837475]
本稿では,階層型ビデオ圧縮(HLVC)手法を提案する。
我々のHLVCアプローチでは、エンコーダ側とデコーダ側の低品質フレームの圧縮と強化を容易にするため、階層的品質は符号化効率の恩恵を受ける。
論文 参考訳(メタデータ) (2020-03-04T09:31:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。