論文の概要: CANF-VC: Conditional Augmented Normalizing Flows for Video Compression
- arxiv url: http://arxiv.org/abs/2207.05315v1
- Date: Tue, 12 Jul 2022 04:53:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-13 13:58:17.957054
- Title: CANF-VC: Conditional Augmented Normalizing Flows for Video Compression
- Title(参考訳): CANF-VC:ビデオ圧縮のための条件付き正規化フロー
- Authors: Yung-Han Ho, Chih-Peng Chang, Peng-Yu Chen, Alessandro Gnutti,
Wen-Hsiao Peng
- Abstract要約: CANF-VCは、エンドツーエンドの学習ベースのビデオ圧縮システムである。
条件付き拡張正規化フロー(ANF)に基づく。
- 参考スコア(独自算出の注目度): 81.41594331948843
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper presents an end-to-end learning-based video compression system,
termed CANF-VC, based on conditional augmented normalizing flows (ANF). Most
learned video compression systems adopt the same hybrid-based coding
architecture as the traditional codecs. Recent research on conditional coding
has shown the sub-optimality of the hybrid-based coding and opens up
opportunities for deep generative models to take a key role in creating new
coding frameworks. CANF-VC represents a new attempt that leverages the
conditional ANF to learn a video generative model for conditional inter-frame
coding. We choose ANF because it is a special type of generative model, which
includes variational autoencoder as a special case and is able to achieve
better expressiveness. CANF-VC also extends the idea of conditional coding to
motion coding, forming a purely conditional coding framework. Extensive
experimental results on commonly used datasets confirm the superiority of
CANF-VC to the state-of-the-art methods.
- Abstract(参考訳): 本稿では,条件付き拡張正規化フロー(ANF)に基づく,エンドツーエンドの学習ベースビデオ圧縮システムCANF-VCを提案する。
ほとんどの学習ビデオ圧縮システムは、従来のコーデックと同じハイブリッドベースのコーディングアーキテクチャを採用している。
条件付きコーディングの最近の研究は、ハイブリッドベースのコーディングの亜最適性を示し、深層生成モデルが新しいコーディングフレームワークを作成する上で重要な役割を果たす機会を開く。
canf-vcは条件付きanfを利用して条件付きフレーム間コーディングのためのビデオ生成モデルを学ぶ新しい試みである。
我々は、特殊ケースとして変分オートエンコーダを含む特殊な生成モデルであり、表現性を向上できるため、ANFを選択する。
CANF-VCはまた、条件付きコーディングをモーションコーディングに拡張し、純粋に条件付きコーディングフレームワークを形成する。
CANF-VCが最先端の手法よりも優れていることを確認するために、一般的に使用されるデータセットの大規模な実験結果が得られた。
関連論文リスト
- Beyond GFVC: A Progressive Face Video Compression Framework with Adaptive Visual Tokens [28.03183316628635]
本稿では、適応的な視覚トークンを用いて、再構成と帯域幅のインテリジェンス間の例外的なトレードオフを実現する、新しいプログレッシブ・フェイス・ビデオ圧縮フレームワークであるPFVCを提案する。
実験により,提案したPFVCフレームワークは,最新のVersatile Video Coding (VVC) や最新技術であるGenerative Face Video Compression (GFVC) アルゴリズムと比較して,符号化の柔軟性と速度歪み性能に優れることを示した。
論文 参考訳(メタデータ) (2024-10-11T03:24:21Z) - When Video Coding Meets Multimodal Large Language Models: A Unified Paradigm for Video Coding [112.44822009714461]
CMVC(Cross-Modality Video Coding)は、ビデオ符号化における多モード表現とビデオ生成モデルを探索する先駆的な手法である。
復号化の際には、以前に符号化されたコンポーネントとビデオ生成モデルを利用して複数の復号モードを生成する。
TT2Vは効果的な意味再構成を実現し,IT2Vは競争力のある知覚整合性を示した。
論文 参考訳(メタデータ) (2024-08-15T11:36:18Z) - Boosting Neural Representations for Videos with a Conditional Decoder [28.073607937396552]
Inlicit Neural representations (INRs) は、ビデオストレージと処理において有望なアプローチとして登場した。
本稿では,現在の暗黙的ビデオ表現手法のための普遍的なブースティングフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-28T08:32:19Z) - Neural Data-Dependent Transform for Learned Image Compression [72.86505042102155]
ニューラルデータに依存した変換を構築し,各画像の符号化効率を最適化する連続オンラインモード決定機構を導入する。
実験の結果,提案したニューラルシンタクス設計と連続オンラインモード決定機構の有効性が示された。
論文 参考訳(メタデータ) (2022-03-09T14:56:48Z) - A Coding Framework and Benchmark towards Low-Bitrate Video Understanding [63.05385140193666]
我々は,従来のコーデックとニューラルネットワーク(NN)の両方を活用する,従来型ニューラル混合符号化フレームワークを提案する。
このフレームワークは、動画の移動効率の良いセマンティック表現を確実に保持することで最適化される。
8つのデータセットに3つのダウンストリームタスクを備えた低ビットレートビデオ理解ベンチマークを構築し、このアプローチの顕著な優位性を実証した。
論文 参考訳(メタデータ) (2022-02-06T16:29:15Z) - CAESR: Conditional Autoencoder and Super-Resolution for Learned Spatial
Scalability [13.00115213941287]
本稿では,多目的ビデオ符号化(VVC)標準に基づく空間スケーラビリティの学習に基づく符号化手法であるCAESRを提案する。
本フレームワークでは,VVCイントラモードをベース層(BL)として符号化した低分解能信号と,高優先度(AE-HP)を用いたディープコンディショニングオートエンコーダを拡張層(EL)モデルとして検討する。
当社のソリューションは,スケーラブルなVVCのフル解像度イントラコーディングと競合するものです。
論文 参考訳(メタデータ) (2022-02-01T13:59:43Z) - Perceptual Learned Video Compression with Recurrent Conditional GAN [158.0726042755]
本稿では, PVC (Perceptual Learned Video Compression) アプローチを提案する。
PLVCは低ビットレートで映像を知覚品質に圧縮することを学ぶ。
ユーザスタディでは、最新の学習ビデオ圧縮手法と比較して、PLVCの優れた知覚性能をさらに検証している。
論文 参考訳(メタデータ) (2021-09-07T13:36:57Z) - Conditional Entropy Coding for Efficient Video Compression [82.35389813794372]
本稿では,フレーム間の条件エントロピーをモデル化することのみに焦点を当てた,非常にシンプルで効率的なビデオ圧縮フレームワークを提案する。
まず、画像遅延符号間のエントロピーをモデル化する単純なアーキテクチャが、他のニューラルビデオ圧縮やビデオコーデックと同等の競争力を持つことを示す。
次に、このアーキテクチャの上に新しい内部学習拡張を提案し、復号速度を抑えることなく10%の節約を実現した。
論文 参考訳(メタデータ) (2020-08-20T20:01:59Z) - Variable Rate Video Compression using a Hybrid Recurrent Convolutional
Learning Framework [1.9290392443571382]
本稿では,予測自動符号化の概念に基づくハイブリッドビデオ圧縮フレームワークであるPredEncoderを提案する。
可変レートブロック符号化方式が論文で提案され,ビットレート比が著しく向上した。
論文 参考訳(メタデータ) (2020-04-08T20:49:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。