論文の概要: Can Learned Frame-Prediction Compete with Block-Motion Compensation for
Video Coding?
- arxiv url: http://arxiv.org/abs/2007.08922v1
- Date: Fri, 17 Jul 2020 11:54:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-09 13:39:38.744613
- Title: Can Learned Frame-Prediction Compete with Block-Motion Compensation for
Video Coding?
- Title(参考訳): 学習フレーム予測はビデオ符号化のブロックモーション補償と競合するか?
- Authors: Serkan Sulun, A. Murat Tekalp
- Abstract要約: プレトレーニングされた深度モデルを用いて,次のフレーム予測を行う場合,ブロックモーション補償に基づく標準的なビデオコーデックと競合するかどうかを検討する。
また,10MPEGテストビデオのx264に比べて,対称的複雑性を持つ単純さの速度歪み性能は平均的に優れているが,x265のレベルには達していないことを示す。
- 参考スコア(独自算出の注目度): 10.329264495669028
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Given recent advances in learned video prediction, we investigate whether a
simple video codec using a pre-trained deep model for next frame prediction
based on previously encoded/decoded frames without sending any motion side
information can compete with standard video codecs based on block-motion
compensation. Frame differences given learned frame predictions are encoded by
a standard still-image (intra) codec. Experimental results show that the
rate-distortion performance of the simple codec with symmetric complexity is on
average better than that of x264 codec on 10 MPEG test videos, but does not yet
reach the level of x265 codec. This result demonstrates the power of learned
frame prediction (LFP), since unlike motion compensation, LFP does not use
information from the current picture. The implications of training with L1, L2,
or combined L2 and adversarial loss on prediction performance and compression
efficiency are analyzed.
- Abstract(参考訳): 近年の学習ビデオ予測の進歩を踏まえて,前もって符号化/復号化されたフレームをベースとした事前学習深度モデルを用いた簡単なビデオコーデックが,ブロックモーション補償に基づく標準的なビデオコーデックと競合するかどうかを検討する。
学習されたフレーム予測のフレーム差は、標準静止画像(intra)コーデックによって符号化される。
実験結果から, 対称複雑度を有する単純コーデックの速度歪み性能は, 10MPEGテストビデオのx264コーデックよりも平均的に優れているが, x265コーデックのレベルには達していないことがわかった。
この結果は、学習フレーム予測(LFP)のパワーを示すが、動き補正とは異なり、LFPは現在の画像からの情報を使用しない。
予測性能と圧縮効率に及ぼすL1,L2,または複合L2による学習の影響を解析した。
関連論文リスト
- Prediction and Reference Quality Adaptation for Learned Video Compression [54.58691829087094]
本研究では,空間的およびチャネル的予測品質差の明確な識別を行うために,信頼度に基づく予測品質適応(PQA)モジュールを提案する。
また、参照品質適応(RQA)モジュールと関連する繰り返し学習戦略を提案し、様々な参照品質のための動的空間変化フィルタを提供する。
論文 参考訳(メタデータ) (2024-06-20T09:03:26Z) - Extreme Video Compression with Pre-trained Diffusion Models [11.898317376595697]
本稿では,デコーダにおける拡散型生成モデルの予測力を活用した,極端な映像圧縮のための新しい手法を提案する。
ビデオ全体が順次エンコードされ、知覚品質の指標を考慮し、視覚的に快く再現される。
その結果、生成モデルを用いて映像データの時間的関係を活用できる可能性が示された。
論文 参考訳(メタデータ) (2024-02-14T04:23:05Z) - Towards Real-Time Neural Video Codec for Cross-Platform Application
Using Calibration Information [17.141950680993617]
浮動小数点演算によるクロスプラットフォームの計算誤差は、ビットストリームの不正確な復号につながる可能性がある。
符号化と復号処理の計算複雑性が高いことは、リアルタイムのパフォーマンスを達成する上での課題である。
リアルタイムクロスプラットフォームのニューラルビデオは、コンシューマグレードのGPU上で、他のエンコーディングプラットフォームから720Pビデオのビットストリームを効率的に復号することができる。
論文 参考訳(メタデータ) (2023-09-20T13:01:15Z) - Advancing Learned Video Compression with In-loop Frame Prediction [177.67218448278143]
本稿では,ループ内フレーム予測モジュールを用いたALVC(Advanced Learned Video Compression)アプローチを提案する。
予測フレームは、以前圧縮されたフレームよりも優れた参照として機能し、圧縮性能の恩恵を受けることができる。
本実験は,学習ビデオ圧縮におけるALVC手法の最先端性能を示すものである。
論文 参考訳(メタデータ) (2022-11-13T19:53:14Z) - Deep Contextual Video Compression [20.301569390401102]
本稿では,予測符号化から条件付き符号化へのパラダイムシフトを実現するための,深い文脈ビデオ圧縮フレームワークを提案する。
提案手法は従来のSOTA(State-of-theart)ディープビデオ圧縮法よりも大幅に優れる。
論文 参考訳(メタデータ) (2021-09-30T12:14:24Z) - Conditional Entropy Coding for Efficient Video Compression [82.35389813794372]
本稿では,フレーム間の条件エントロピーをモデル化することのみに焦点を当てた,非常にシンプルで効率的なビデオ圧縮フレームワークを提案する。
まず、画像遅延符号間のエントロピーをモデル化する単純なアーキテクチャが、他のニューラルビデオ圧縮やビデオコーデックと同等の競争力を持つことを示す。
次に、このアーキテクチャの上に新しい内部学習拡張を提案し、復号速度を抑えることなく10%の節約を実現した。
論文 参考訳(メタデータ) (2020-08-20T20:01:59Z) - Learning for Video Compression with Recurrent Auto-Encoder and Recurrent
Probability Model [164.7489982837475]
本稿では、リカレントオートエンコーダ(RAE)とリカレント確率モデル(RPM)を用いたリカレントラーニングビデオ圧縮(RLVC)手法を提案する。
RAEは、ビデオフレーム間の時間的相関を利用するために、エンコーダとデコーダの両方で繰り返しセルを使用する。
提案手法は,PSNRとMS-SSIMの両方の観点から,最先端の学習ビデオ圧縮性能を実現する。
論文 参考訳(メタデータ) (2020-06-24T08:46:33Z) - M-LVC: Multiple Frames Prediction for Learned Video Compression [111.50760486258993]
低レイテンシシナリオのためのエンドツーエンドの学習ビデオ圧縮方式を提案する。
提案方式では, 移動ベクトル(MV)場を現在のフレームと前のフレームの間で計算する。
実験の結果,提案手法は,低遅延モードにおける既存の学習ビデオ圧縮法よりも優れていた。
論文 参考訳(メタデータ) (2020-04-21T20:42:02Z) - Variable Rate Video Compression using a Hybrid Recurrent Convolutional
Learning Framework [1.9290392443571382]
本稿では,予測自動符号化の概念に基づくハイブリッドビデオ圧縮フレームワークであるPredEncoderを提案する。
可変レートブロック符号化方式が論文で提案され,ビットレート比が著しく向上した。
論文 参考訳(メタデータ) (2020-04-08T20:49:25Z) - Content Adaptive and Error Propagation Aware Deep Video Compression [110.31693187153084]
本稿では,コンテンツ適応型・誤り伝搬対応型ビデオ圧縮システムを提案する。
本手法では, 複数フレームの圧縮性能を1フレームではなく複数フレームで考慮し, 共同学習手法を用いる。
従来の圧縮システムでは手作りのコーディングモードを使用する代わりに,オンラインエンコーダ更新方式をシステム内に設計する。
論文 参考訳(メタデータ) (2020-03-25T09:04:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。