論文の概要: Rate-Perception Optimized Preprocessing for Video Coding
- arxiv url: http://arxiv.org/abs/2301.10455v1
- Date: Wed, 25 Jan 2023 08:21:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-26 15:37:39.697762
- Title: Rate-Perception Optimized Preprocessing for Video Coding
- Title(参考訳): ビデオ符号化のためのレート知覚最適化前処理
- Authors: Chengqian Ma, Zhiqiang Wu, Chunlei Cai, Pengwei Zhang, Yi Wang, Long
Zheng, Chao Chen, Quan Zhou
- Abstract要約: 本稿では,レート・ディストーション性能を向上させるために,レート・パーセプション最適化前処理(RPP)手法を提案する。
RPP法は非常にシンプルで効率的であり,ビデオエンコーディング,ストリーミング,デコードの設定に何ら変更を加える必要もない。
主観的視覚的品質テストでは、87%のユーザが、RPPで圧縮した動画を約12%圧縮するだけで、RPPで動画がより良く、あるいは同等であると考えている。
- 参考スコア(独自算出の注目度): 15.808458228130261
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the past decades, lots of progress have been done in the video compression
field including traditional video codec and learning-based video codec.
However, few studies focus on using preprocessing techniques to improve the
rate-distortion performance. In this paper, we propose a rate-perception
optimized preprocessing (RPP) method. We first introduce an adaptive Discrete
Cosine Transform loss function which can save the bitrate and keep essential
high frequency components as well. Furthermore, we also combine several
state-of-the-art techniques from low-level vision fields into our approach,
such as the high-order degradation model, efficient lightweight network design,
and Image Quality Assessment model. By jointly using these powerful techniques,
our RPP approach can achieve on average, 16.27% bitrate saving with different
video encoders like AVC, HEVC, and VVC under multiple quality metrics. In the
deployment stage, our RPP method is very simple and efficient which is not
required any changes in the setting of video encoding, streaming, and decoding.
Each input frame only needs to make a single pass through RPP before sending
into video encoders. In addition, in our subjective visual quality test, 87% of
users think videos with RPP are better or equal to videos by only using the
codec to compress, while these videos with RPP save about 12% bitrate on
average. Our RPP framework has been integrated into the production environment
of our video transcoding services which serve millions of users every day.
- Abstract(参考訳): 過去数十年間、従来のビデオコーデックや学習ベースのビデオコーデックなど、ビデオ圧縮分野で多くの進歩を遂げてきた。
しかし,前処理技術を用いて速度分散性能を向上させる研究は少ない。
本稿では,レートパーセプション最適化前処理(RPP)手法を提案する。
まず適応型離散コサイン変換損失関数を導入し、ビットレートを節約し、必須の高周波成分を保持する。
さらに,高次劣化モデル,効率的な軽量ネットワーク設計,画質評価モデルなど,低レベルの視覚領域から最先端技術をいくつか組み合わせた。
これらの強力なテクニックを併用することで、当社のRCPアプローチは、AVC、HEVC、VVCなどの異なるビデオエンコーダで、平均16.27%のビットレートの節約を達成できます。
デプロイメント段階では、RPP手法は非常にシンプルで効率的であり、ビデオエンコーディング、ストリーミング、デコードの設定の変更は不要である。
各入力フレームは、ビデオエンコーダを送る前に、RCPを1回通すだけでよい。
さらに、当社の主観的視覚的品質テストでは、RPPビデオの87%がコーデックのみを使用して圧縮することで、RPPビデオの方が良いか等しいと考える一方、RPPビデオは平均で12%のビットレートを節約している。
当社のRCPフレームワークは,毎日数百万のユーザが利用しているビデオトランスコーディングサービスの生産環境に統合されています。
関連論文リスト
- Accelerating Learned Video Compression via Low-Resolution Representation Learning [18.399027308582596]
低解像度表現学習に焦点を当てた学習ビデオ圧縮のための効率最適化フレームワークを提案する。
提案手法は,H.266参照ソフトウェアVTMの低遅延P構成と同等の性能を実現する。
論文 参考訳(メタデータ) (2024-07-23T12:02:57Z) - Blurry Video Compression: A Trade-off between Visual Enhancement and
Data Compression [65.8148169700705]
既存のビデオ圧縮(VC)手法は主に、ビデオ内の連続フレーム間の空間的および時間的冗長性を減らすことを目的としている。
これまでの研究は、インスタント(既知の)露光時間やシャッタースピードなどの特定の設定で取得されたビデオに対して、顕著な成果を上げてきた。
本研究では,シーン内のカメラ設定やダイナミックスによって,所定の映像がぼやけてしまうという一般的なシナリオにおいて,VCの問題に取り組む。
論文 参考訳(メタデータ) (2023-11-08T02:17:54Z) - Predictive Coding For Animation-Based Video Compression [13.161311799049978]
本稿では,画像アニメーションを予測器として用いる予測符号化手法を提案し,実際の対象フレームに対する残差を符号化する。
実験の結果,HEVCビデオ標準に比べて70%以上,VVCに比べて30%以上,有意な上昇を示した。
論文 参考訳(メタデータ) (2023-07-09T14:40:54Z) - Video Compression with Arbitrary Rescaling Network [8.489428003916622]
符号化前のビデオリサイズのためのレート誘導任意再スケーリングネットワーク(RARN)を提案する。
軽量RARN構造は、FHD(1080p)コンテンツをリアルタイム(91 FPS)で処理し、かなりのレート低下を得ることができる。
論文 参考訳(メタデータ) (2023-06-07T07:15:18Z) - AlphaVC: High-Performance and Efficient Learned Video Compression [4.807439168741098]
コンディションIフレームをGoPの第1フレームとして導入し、再構成された品質を安定させ、ビットレートを節約する。
第二に,デコーダの複雑さを増大させることなく相互予測の精度を向上させるために,エンコーダ側の画素間動作予測手法を提案する。
第3に,性能向上だけでなく,エントロピー符号化の実行時間を大幅に削減する確率ベースのエントロピースキップ手法を提案する。
論文 参考訳(メタデータ) (2022-07-29T13:52:44Z) - Leveraging Bitstream Metadata for Fast, Accurate, Generalized Compressed
Video Quality Enhancement [74.1052624663082]
圧縮ビデオの細部を復元する深層学習アーキテクチャを開発した。
これにより,従来の圧縮補正法と比較して復元精度が向上することを示す。
我々は、ビットストリームで容易に利用できる量子化データに対して、我々のモデルを条件付けする。
論文 参考訳(メタデータ) (2022-01-31T18:56:04Z) - ELF-VC: Efficient Learned Flexible-Rate Video Coding [61.10102916737163]
低レイテンシモードの性能向上を実現するための,学習ビデオ圧縮のための新しいアイデアをいくつか提案する。
一般的なビデオテストセット UVG と MCL-JCV 上で,ELF-VC と呼ぶ手法をベンチマークする。
我々の手法は少なくとも5倍高速に動作し、これらの数値を報告するすべてのMLコーデックよりもパラメータが少ない。
論文 参考訳(メタデータ) (2021-04-29T17:50:35Z) - Conditional Entropy Coding for Efficient Video Compression [82.35389813794372]
本稿では,フレーム間の条件エントロピーをモデル化することのみに焦点を当てた,非常にシンプルで効率的なビデオ圧縮フレームワークを提案する。
まず、画像遅延符号間のエントロピーをモデル化する単純なアーキテクチャが、他のニューラルビデオ圧縮やビデオコーデックと同等の競争力を持つことを示す。
次に、このアーキテクチャの上に新しい内部学習拡張を提案し、復号速度を抑えることなく10%の節約を実現した。
論文 参考訳(メタデータ) (2020-08-20T20:01:59Z) - Efficient Adaptation of Neural Network Filter for Video Compression [10.769305738505071]
本稿では,ニューラルネットワークフィルタのための効率的なファインタニング手法を提案する。
微細チューニングは、エンコーダ側で行われ、ニューラルネットワークが符号化されている特定のコンテンツに適応する。
提案手法は従来のファインタニング手法よりもはるかに高速である。
論文 参考訳(メタデータ) (2020-07-28T14:24:28Z) - Content Adaptive and Error Propagation Aware Deep Video Compression [110.31693187153084]
本稿では,コンテンツ適応型・誤り伝搬対応型ビデオ圧縮システムを提案する。
本手法では, 複数フレームの圧縮性能を1フレームではなく複数フレームで考慮し, 共同学習手法を用いる。
従来の圧縮システムでは手作りのコーディングモードを使用する代わりに,オンラインエンコーダ更新方式をシステム内に設計する。
論文 参考訳(メタデータ) (2020-03-25T09:04:24Z) - Learning for Video Compression with Hierarchical Quality and Recurrent
Enhancement [164.7489982837475]
本稿では,階層型ビデオ圧縮(HLVC)手法を提案する。
我々のHLVCアプローチでは、エンコーダ側とデコーダ側の低品質フレームの圧縮と強化を容易にするため、階層的品質は符号化効率の恩恵を受ける。
論文 参考訳(メタデータ) (2020-03-04T09:31:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。