論文の概要: AlphaVC: High-Performance and Efficient Learned Video Compression
- arxiv url: http://arxiv.org/abs/2207.14678v1
- Date: Fri, 29 Jul 2022 13:52:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-01 13:03:30.544293
- Title: AlphaVC: High-Performance and Efficient Learned Video Compression
- Title(参考訳): AlphaVC: 高性能で効率的な学習ビデオ圧縮
- Authors: Yibo Shi, Yunying Ge, Jing Wang, Jue Mao
- Abstract要約: コンディションIフレームをGoPの第1フレームとして導入し、再構成された品質を安定させ、ビットレートを節約する。
第二に,デコーダの複雑さを増大させることなく相互予測の精度を向上させるために,エンコーダ側の画素間動作予測手法を提案する。
第3に,性能向上だけでなく,エントロピー符号化の実行時間を大幅に削減する確率ベースのエントロピースキップ手法を提案する。
- 参考スコア(独自算出の注目度): 4.807439168741098
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, learned video compression has drawn lots of attention and show a
rapid development trend with promising results. However, the previous works
still suffer from some criticial issues and have a performance gap with
traditional compression standards in terms of widely used PSNR metric. In this
paper, we propose several techniques to effectively improve the performance.
First, to address the problem of accumulative error, we introduce a
conditional-I-frame as the first frame in the GoP, which stabilizes the
reconstructed quality and saves the bit-rate. Second, to efficiently improve
the accuracy of inter prediction without increasing the complexity of decoder,
we propose a pixel-to-feature motion prediction method at encoder side that
helps us to obtain high-quality motion information. Third, we propose a
probability-based entropy skipping method, which not only brings performance
gain, but also greatly reduces the runtime of entropy coding. With these
powerful techniques, this paper proposes AlphaVC, a high-performance and
efficient learned video compression scheme. To the best of our knowledge,
AlphaVC is the first E2E AI codec that exceeds the latest compression standard
VVC on all common test datasets for both PSNR (-28.2% BD-rate saving) and
MSSSIM (-52.2% BD-rate saving), and has very fast encoding (0.001x VVC) and
decoding (1.69x VVC) speeds.
- Abstract(参考訳): 近年,学習ビデオ圧縮が注目され,将来性のある結果を得た急速な開発傾向を示している。
しかし、以前の研究は批判的な問題に悩まされており、広く使われているPSNRメートル法では従来の圧縮標準と性能差がある。
本稿では,性能を効果的に向上させる手法を提案する。
まず、累積誤差の問題に対処するため、gopの第1フレームとして条件付きiフレームを導入し、再構成された品質を安定化しビットレートを節約する。
第2に,デコーダの複雑さを増すことなく,相互予測の精度を効率的に向上させるため,高品質な動作情報を得るためのエンコーダ側での画素間動作予測手法を提案する。
第3に,性能向上だけでなく,エントロピー符号化の実行時間を大幅に削減する確率ベースのエントロピースキップ手法を提案する。
そこで本研究では,高速かつ効率的な学習ビデオ圧縮方式であるAlphaVCを提案する。
我々の知る限り、AlphaVCはPSNR(-28.2%BDレートセーブ)とMSSSIM(-52.2%BDレートセーブ)の共通テストデータセットで最新の圧縮標準VVCを超える最初のE2E AIコーデックであり、非常に高速な符号化(0.001xVVC)と復号(1.69xVVC)速度を持つ。
関連論文リスト
- Accelerating Learned Video Compression via Low-Resolution Representation Learning [18.399027308582596]
低解像度表現学習に焦点を当てた学習ビデオ圧縮のための効率最適化フレームワークを提案する。
提案手法は,H.266参照ソフトウェアVTMの低遅延P構成と同等の性能を実現する。
論文 参考訳(メタデータ) (2024-07-23T12:02:57Z) - Blurry Video Compression: A Trade-off between Visual Enhancement and
Data Compression [65.8148169700705]
既存のビデオ圧縮(VC)手法は主に、ビデオ内の連続フレーム間の空間的および時間的冗長性を減らすことを目的としている。
これまでの研究は、インスタント(既知の)露光時間やシャッタースピードなどの特定の設定で取得されたビデオに対して、顕著な成果を上げてきた。
本研究では,シーン内のカメラ設定やダイナミックスによって,所定の映像がぼやけてしまうという一般的なシナリオにおいて,VCの問題に取り組む。
論文 参考訳(メタデータ) (2023-11-08T02:17:54Z) - Leveraging progressive model and overfitting for efficient learned image
compression [14.937446839215868]
マルチスケールプログレッシブ(MSP)確率モデルと潜在表現オーバーフィッティング(LOF)技術を用いた強力で柔軟なlicフレームワークを提案する。
事前定義されたプロファイルの異なるフレームワークでは、圧縮効率と計算複雑性のバランスポイントを達成できる。
実験の結果,提案フレームワークはVVC/H.266標準よりも2.5%,1.0%,1.3%Bjontegaardデルタビットレート(BDレート)の低減を実現している。
論文 参考訳(メタデータ) (2022-10-08T21:54:58Z) - Perceptual Learned Video Compression with Recurrent Conditional GAN [158.0726042755]
本稿では, PVC (Perceptual Learned Video Compression) アプローチを提案する。
PLVCは低ビットレートで映像を知覚品質に圧縮することを学ぶ。
ユーザスタディでは、最新の学習ビデオ圧縮手法と比較して、PLVCの優れた知覚性能をさらに検証している。
論文 参考訳(メタデータ) (2021-09-07T13:36:57Z) - ELF-VC: Efficient Learned Flexible-Rate Video Coding [61.10102916737163]
低レイテンシモードの性能向上を実現するための,学習ビデオ圧縮のための新しいアイデアをいくつか提案する。
一般的なビデオテストセット UVG と MCL-JCV 上で,ELF-VC と呼ぶ手法をベンチマークする。
我々の手法は少なくとも5倍高速に動作し、これらの数値を報告するすべてのMLコーデックよりもパラメータが少ない。
論文 参考訳(メタデータ) (2021-04-29T17:50:35Z) - Conditional Entropy Coding for Efficient Video Compression [82.35389813794372]
本稿では,フレーム間の条件エントロピーをモデル化することのみに焦点を当てた,非常にシンプルで効率的なビデオ圧縮フレームワークを提案する。
まず、画像遅延符号間のエントロピーをモデル化する単純なアーキテクチャが、他のニューラルビデオ圧縮やビデオコーデックと同等の競争力を持つことを示す。
次に、このアーキテクチャの上に新しい内部学習拡張を提案し、復号速度を抑えることなく10%の節約を実現した。
論文 参考訳(メタデータ) (2020-08-20T20:01:59Z) - Content Adaptive and Error Propagation Aware Deep Video Compression [110.31693187153084]
本稿では,コンテンツ適応型・誤り伝搬対応型ビデオ圧縮システムを提案する。
本手法では, 複数フレームの圧縮性能を1フレームではなく複数フレームで考慮し, 共同学習手法を用いる。
従来の圧縮システムでは手作りのコーディングモードを使用する代わりに,オンラインエンコーダ更新方式をシステム内に設計する。
論文 参考訳(メタデータ) (2020-03-25T09:04:24Z) - Learning for Video Compression with Hierarchical Quality and Recurrent
Enhancement [164.7489982837475]
本稿では,階層型ビデオ圧縮(HLVC)手法を提案する。
我々のHLVCアプローチでは、エンコーダ側とデコーダ側の低品質フレームの圧縮と強化を容易にするため、階層的品質は符号化効率の恩恵を受ける。
論文 参考訳(メタデータ) (2020-03-04T09:31:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。