論文の概要: Neural Generation of Blocks for Video Coding
- arxiv url: http://arxiv.org/abs/2010.02748v1
- Date: Mon, 5 Oct 2020 04:40:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-10 22:40:28.168747
- Title: Neural Generation of Blocks for Video Coding
- Title(参考訳): ビデオ符号化のためのブロックのニューラル生成
- Authors: Jonah Probell
- Abstract要約: よく訓練された生成ニューラルネットワーク(GNN)は、学習パラメータの静的画像の視覚情報を圧縮するのに非常に効率的である。
本稿では、ビデオビットストリーム内のGNNのコンテンツ固有の学習パラメータを特定のタイミングで符号化し、GNNを用いてブロックやフレームの特定の範囲のコンテンツを生成することを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Well-trained generative neural networks (GNN) are very efficient at
compressing visual information for static images in their learned parameters
but not as efficient as inter- and intra-prediction for most video content.
However, for content entering a frame, such as during panning or zooming out,
and content with curves, irregular shapes, or fine detail, generation by a GNN
can give better compression efficiency (lower rate-distortion). This paper
proposes encoding content-specific learned parameters of a GNN within a video
bitstream at specific times and using the GNN to generate content for specific
ranges of blocks and frames. The blocks to generate are just the ones for which
generation gives more efficient compression than inter- or intra- prediction.
This approach maximizes the usefulness of the information contained in the
learned parameters.
- Abstract(参考訳): 十分に訓練された生成ニューラルネットワーク(GNN)は、学習パラメータの静的画像の視覚情報を圧縮するのに非常に効率的であるが、ほとんどのビデオコンテンツにおいて、インタープレディションやイントラプレディクションほど効率的ではない。
しかし、パンニングやズームアウトなどのフレームに入るコンテンツや、カーブ、不規則な形状、細部を含むコンテンツの場合、GNNによる生成により圧縮効率が向上する(より低いレート歪み)。
本稿では、ビデオビットストリーム内のGNNのコンテンツ固有の学習パラメータを特定のタイミングで符号化し、GNNを用いてブロックやフレームの特定の範囲のコンテンツを生成することを提案する。
生成するブロックは、生成するブロックだけで、インターまたはイントラ予測よりも効率的な圧縮を提供する。
このアプローチは学習パラメータに含まれる情報の有用性を最大化する。
関連論文リスト
- NERV++: An Enhanced Implicit Neural Video Representation [11.25130799452367]
強調された暗黙的ニューラルビデオ表現であるNeRV++のニューラル表現を導入する。
NeRV++は、オリジナルのNeRVデコーダアーキテクチャよりも単純だが効果的な拡張である。
提案手法をUVG,MCL JVC,Bunnyのデータセット上で評価し,INRによる映像圧縮の競合性を実現する。
論文 参考訳(メタデータ) (2024-02-28T13:00:32Z) - Dynamic Semantic Compression for CNN Inference in Multi-access Edge
Computing: A Graph Reinforcement Learning-based Autoencoder [82.8833476520429]
部分オフロードにおける効果的な意味抽出と圧縮のための新しい意味圧縮手法であるオートエンコーダベースのCNNアーキテクチャ(AECNN)を提案する。
セマンティックエンコーダでは、CNNのチャネルアテンション機構に基づく特徴圧縮モジュールを導入し、最も情報性の高い特徴を選択して中間データを圧縮する。
セマンティックデコーダでは、受信した圧縮データから学習して中間データを再構築し、精度を向上させる軽量デコーダを設計する。
論文 参考訳(メタデータ) (2024-01-19T15:19:47Z) - HNeRV: A Hybrid Neural Representation for Videos [56.492309149698606]
暗黙の神経表現は、動画をニューラルネットワークとして保存する。
ビデオ用ハイブリッドニューラル表現法(HNeRV)を提案する。
コンテンツ適応型埋め込みと再設計アーキテクチャにより、HNeRVはビデオレグレッションタスクにおいて暗黙のメソッドよりも優れる。
論文 参考訳(メタデータ) (2023-04-05T17:55:04Z) - Towards Scalable Neural Representation for Diverse Videos [68.73612099741956]
Inlicit Neural representations (INR)は、3Dシーンや画像の表現において注目を集めている。
既存のINRベースの手法は、冗長な視覚コンテンツを持つ短いビデオの符号化に限られている。
本稿では,多種多様な視覚コンテンツを持つ長編・多作ビデオの符号化のためのニューラル表現の開発に焦点をあてる。
論文 参考訳(メタデータ) (2023-03-24T16:32:19Z) - NIRVANA: Neural Implicit Representations of Videos with Adaptive
Networks and Autoregressive Patch-wise Modeling [37.51397331485574]
Inlicit Neural Representations (INR)は、最近、高品質なビデオ圧縮のための強力なツールであることが示されている。
これらの手法は、より長いビデオや高解像度にスケールしない固定されたアーキテクチャを持つ。
我々は,動画をフレーム群として扱うNIRVANAを提案し,パッチワイズ予測を行うグループ毎に個別のネットワークを適合させる。
論文 参考訳(メタデータ) (2022-12-30T08:17:02Z) - Scalable Neural Video Representations with Learnable Positional Features [73.51591757726493]
我々は,学習可能な位置特徴(NVP)を用いて,映像を潜時符号として効果的に再生するニューラル表現の訓練方法を示す。
一般的なUVGベンチマークにおけるNVPの優位性を実証し,先行技術と比較して,NVPは2倍の速度(5分以内)で走行するだけでなく,符号化品質も34.07rightarrow$34.57(PSNR測定値で測定)に上回っている。
論文 参考訳(メタデータ) (2022-10-13T08:15:08Z) - Variable Bitrate Neural Fields [75.24672452527795]
本稿では,特徴格子を圧縮し,メモリ消費を最大100倍に削減する辞書手法を提案する。
辞書の最適化をベクトル量子化オートデコーダ問題として定式化し、直接監督できない空間において、エンドツーエンドの離散神経表現を学習する。
論文 参考訳(メタデータ) (2022-06-15T17:58:34Z) - COIN++: Data Agnostic Neural Compression [55.27113889737545]
COIN++は、幅広いデータモダリティをシームレスに扱うニューラルネットワーク圧縮フレームワークである。
様々なデータモダリティを圧縮することで,本手法の有効性を示す。
論文 参考訳(メタデータ) (2022-01-30T20:12:04Z) - Implicit Neural Video Compression [17.873088127087605]
暗黙的なニューラル表現で全解像度映像列を圧縮する手法を提案する。
各フレームは、座標位置をピクセル値にマッピングするニューラルネットワークとして表現される。
我々は、異なる暗黙ネットワークを用いて座標入力を変調し、フレーム間の効率的な動き補償を可能にする。
論文 参考訳(メタデータ) (2021-12-21T15:59:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。