Fugu-MT 論文翻訳(概要): NVRC: Neural Video Representation Compression

論文の概要: NVRC: Neural Video Representation Compression

arxiv url: http://arxiv.org/abs/2409.07414v1
Date: Wed, 11 Sep 2024 16:57:12 GMT
ステータス: 翻訳完了
システム内更新日: 2024-09-12 13:41:10.305571
Title: NVRC: Neural Video Representation Compression
Title（参考訳）: NVRC: ニューラルビデオ表現圧縮
Authors: Ho Man Kwan, Ge Gao, Fan Zhang, Andrew Gower, David Bull,
Abstract要約: 我々は、新しいINRベースのビデオ圧縮フレームワーク、Neural Video Representation Compression (NVRC)を提案する。 NVRCは初めて、INRベースのビデオをエンドツーエンドで最適化することができる。実験の結果,NVRCは従来のベンチマークエントロピーよりも優れていた。
参考スコア（独自算出の注目度）: 13.131842990481038
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Recent advances in implicit neural representation (INR)-based video coding have demonstrated its potential to compete with both conventional and other learning-based approaches. With INR methods, a neural network is trained to overfit a video sequence, with its parameters compressed to obtain a compact representation of the video content. However, although promising results have been achieved, the best INR-based methods are still out-performed by the latest standard codecs, such as VVC VTM, partially due to the simple model compression techniques employed. In this paper, rather than focusing on representation architectures as in many existing works, we propose a novel INR-based video compression framework, Neural Video Representation Compression (NVRC), targeting compression of the representation. Based on the novel entropy coding and quantization models proposed, NVRC, for the first time, is able to optimize an INR-based video codec in a fully end-to-end manner. To further minimize the additional bitrate overhead introduced by the entropy models, we have also proposed a new model compression framework for coding all the network, quantization and entropy model parameters hierarchically. Our experiments show that NVRC outperforms many conventional and learning-based benchmark codecs, with a 24% average coding gain over VVC VTM (Random Access) on the UVG dataset, measured in PSNR. As far as we are aware, this is the first time an INR-based video codec achieving such performance. The implementation of NVRC will be released at www.github.com.
Abstract（参考訳）: 暗黙的ニューラル表現(INR)に基づくビデオ符号化の最近の進歩は、従来のものと他の学習に基づくアプローチの両方と競合する可能性を示している。 INR法では、ニューラルネットワークはビデオシーケンスに過度に適合するように訓練され、そのパラメータは圧縮され、ビデオコンテンツのコンパクトな表現が得られる。しかし、有望な結果が得られたものの、最も優れたINRベースの手法は、VVC VTMのような最新の標準コーデックよりも性能が優れている。本稿では、既存の多くの作品のように表現アーキテクチャに焦点をあてるのではなく、新しいINRベースのビデオ圧縮フレームワークであるNeural Video Representation Compression (NVRC)を提案する。 NVRCは、新しいエントロピー符号化と量子化モデルに基づいて、INRベースのビデオコーデックを完全にエンドツーエンドに最適化することができる。エントロピーモデルによってもたらされる新たなビットレートオーバーヘッドを最小化するため,ネットワーク,量子化,エントロピーモデルパラメータを階層的に符号化する新しいモデル圧縮フレームワークも提案した。実験の結果,PSNRで測定したVVC VTM(Random Access)よりも平均24%の速度で,従来のベンチマークコーデックと学習ベースのベンチマークコーデックを24%上回った。私たちが知っている限りでは、INRベースのビデオコーデックがそのようなパフォーマンスを達成するのはこれが初めてです。 NVRCの実装はwww.github.comで公開される。

関連論文リスト

Ultra-lightweight Neural Video Representation Compression [18.390031994984096]
ニューラルビデオ表現に2つの重要な変更を加えたNVRC-Liteを提案する。まず、マルチスケールの機能グリッドを軽量なニューラル表現に統合しました。第二に、既存のINRがエントロピー符号化に自己回帰モデルを利用するという問題に対処する。実験の結果, NVRC-Lite は INR ベースのビデオコーデックの最高性能である C3 より優れていた。
論文参考訳（メタデータ） (2025-12-03T17:56:44Z)
Multi-Scale Invertible Neural Network for Wide-Range Variable-Rate Learned Image Compression [90.59962443790593]
本稿では,制限を克服するために,可逆変換に基づく可変レート画像圧縮モデルを提案する。具体的には、入力画像をマルチスケールの潜在表現にマッピングする、軽量なマルチスケール非可逆ニューラルネットワークを設計する。実験結果から,提案手法は既存の可変レート法と比較して最先端性能を実現することが示された。
論文参考訳（メタデータ） (2025-03-27T09:08:39Z)
PNVC: Towards Practical INR-based Video Compression [14.088444622391501]
自動エンコーダと過度に適合したソリューションを革新的に組み合わせた新しいINRベースのコーディングフレームワークであるPNVCを提案する。 PNVCはHEVC HM 18.0(LD)に対して35%以上のBDレートの節約を実現している。
論文参考訳（メタデータ） (2024-09-02T05:31:11Z)
NERV++: An Enhanced Implicit Neural Video Representation [11.25130799452367]
強調された暗黙的ニューラルビデオ表現であるNeRV++のニューラル表現を導入する。 NeRV++は、オリジナルのNeRVデコーダアーキテクチャよりも単純だが効果的な拡張である。提案手法をUVG,MCL JVC,Bunnyのデータセット上で評価し,INRによる映像圧縮の競合性を実現する。
論文参考訳（メタデータ） (2024-02-28T13:00:32Z)
Boosting Neural Representations for Videos with a Conditional Decoder [28.073607937396552]
Inlicit Neural representations (INRs) は、ビデオストレージと処理において有望なアプローチとして登場した。本稿では,現在の暗黙的ビデオ表現手法のための普遍的なブースティングフレームワークを提案する。
論文参考訳（メタデータ） (2024-02-28T08:32:19Z)
Progressive Fourier Neural Representation for Sequential Video Compilation [75.43041679717376]
連続学習によって動機づけられたこの研究は、シーケンシャルエンコーディングセッションを通じて、複数の複雑なビデオデータに対して、ニューラル暗黙表現を蓄積し、転送する方法を研究する。本稿では,FFNR(Progressive Fourier Neural Representation)という,FFNR(Progressive Fourier Neural Representation)という,FFNR(Progressive Fourier Neural Representation)という手法を提案する。我々は,UVG8/17とDAVIS50のビデオシーケンスベンチマークでPFNR法を検証し,強力な連続学習ベースラインよりも優れた性能向上を実現した。
論文参考訳（メタデータ） (2023-06-20T06:02:19Z)
HiNeRV: Video Compression with Hierarchical Encoding-based Neural Representation [14.088444622391501]
Implicit Representations (INRs) は画像やビデオのコンテントの表現や圧縮に使われてきた。既存のINRベースの手法は、ビデオ圧縮の最先端技術に匹敵する速度性能を達成できなかった。軽量層と階層的位置符号化を組み合わせたINRであるHiNeRVを提案する。
論文参考訳（メタデータ） (2023-06-16T12:59:52Z)
Modality-Agnostic Variational Compression of Implicit Neural Representations [96.35492043867104]
Inlicit Neural Representation (INR) としてパラメータ化されたデータの関数的ビューに基づくモーダリティ非依存型ニューラル圧縮アルゴリズムを提案する。潜時符号化と疎性の間のギャップを埋めて、ソフトゲーティング機構に非直線的にマッピングされたコンパクト潜時表現を得る。このような潜在表現のデータセットを得た後、ニューラル圧縮を用いてモーダリティ非依存空間におけるレート/歪みトレードオフを直接最適化する。
論文参考訳（メタデータ） (2023-01-23T15:22:42Z)
Scalable Neural Video Representations with Learnable Positional Features [73.51591757726493]
我々は,学習可能な位置特徴(NVP)を用いて,映像を潜時符号として効果的に再生するニューラル表現の訓練方法を示す。一般的なUVGベンチマークにおけるNVPの優位性を実証し,先行技術と比較して,NVPは2倍の速度(5分以内)で走行するだけでなく,符号化品質も34.07rightarrow$34.57(PSNR測定値で測定)に上回っている。
論文参考訳（メタデータ） (2022-10-13T08:15:08Z)
Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文参考訳（メタデータ） (2022-01-27T20:20:03Z)
Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文参考訳（メタデータ） (2021-12-08T13:02:53Z)
Learning for Video Compression with Recurrent Auto-Encoder and Recurrent Probability Model [164.7489982837475]
本稿では、リカレントオートエンコーダ(RAE)とリカレント確率モデル(RPM)を用いたリカレントラーニングビデオ圧縮(RLVC)手法を提案する。 RAEは、ビデオフレーム間の時間的相関を利用するために、エンコーダとデコーダの両方で繰り返しセルを使用する。提案手法は,PSNRとMS-SSIMの両方の観点から,最先端の学習ビデオ圧縮性能を実現する。
論文参考訳（メタデータ） (2020-06-24T08:46:33Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。