論文の概要: Releasing the Parameter Latency of Neural Representation for High-Efficiency Video Compression
- arxiv url: http://arxiv.org/abs/2410.01654v2
- Date: Thu, 3 Oct 2024 12:43:14 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-04 16:13:24.647459
- Title: Releasing the Parameter Latency of Neural Representation for High-Efficiency Video Compression
- Title(参考訳): 高能率映像圧縮のためのニューラル表現のパラメータ遅延の緩和
- Authors: Gai Zhang, Xinfeng Zhang, Lv Tang, Yue Li, Kai Zhang, Li Zhang,
- Abstract要約: 暗黙的ニューラル表現(INR)技術は、ビデオ全体を基本単位としてモデル化し、フレーム内およびフレーム間の相関を自動的にキャプチャする。
本稿では,INRビデオ圧縮の速度歪み特性を大幅に向上させる手法を提案する。
- 参考スコア(独自算出の注目度): 18.769136361963472
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: For decades, video compression technology has been a prominent research area. Traditional hybrid video compression framework and end-to-end frameworks continue to explore various intra- and inter-frame reference and prediction strategies based on discrete transforms and deep learning techniques. However, the emerging implicit neural representation (INR) technique models entire videos as basic units, automatically capturing intra-frame and inter-frame correlations and obtaining promising performance. INR uses a compact neural network to store video information in network parameters, effectively eliminating spatial and temporal redundancy in the original video. However, in this paper, our exploration and verification reveal that current INR video compression methods do not fully exploit their potential to preserve information. We investigate the potential of enhancing network parameter storage through parameter reuse. By deepening the network, we designed a feasible INR parameter reuse scheme to further improve compression performance. Extensive experimental results show that our method significantly enhances the rate-distortion performance of INR video compression.
- Abstract(参考訳): 何十年もの間、ビデオ圧縮技術は顕著な研究領域であった。
従来のハイブリッドビデオ圧縮フレームワークとエンドツーエンドフレームワークは、離散変換とディープラーニング技術に基づいて、フレーム内およびフレーム間参照および予測戦略を探索し続けている。
しかし、新たな暗黙的ニューラル表現(INR)技術は、ビデオ全体を基本単位としてモデル化し、フレーム内およびフレーム間相関を自動的にキャプチャし、有望なパフォーマンスを得る。
INRは、コンパクトなニューラルネットワークを使用して、ビデオ情報をネットワークパラメータに格納し、元のビデオにおける空間的および時間的冗長性を効果的に排除する。
しかし,本稿では,現在のINRビデオ圧縮手法が情報保存の可能性を十分に活用していないことを明らかにする。
パラメータ再利用によるネットワークパラメータ記憶の強化の可能性を検討する。
ネットワークをより深めることにより、圧縮性能をさらに向上させるために、実現可能なINRパラメータ再利用スキームを設計した。
実験結果から,INRビデオ圧縮の速度歪み性能が有意に向上することが示唆された。
関連論文リスト
- Streaming Neural Images [56.41827271721955]
Inlicit Neural Representations (INR) は信号表現の新しいパラダイムであり、画像圧縮にかなりの関心を集めている。
本研究では,INRの計算コスト,不安定な性能,堅牢性などの限界要因について検討する。
論文 参考訳(メタデータ) (2024-09-25T17:51:20Z) - NVRC: Neural Video Representation Compression [13.131842990481038]
我々は、新しいINRベースのビデオ圧縮フレームワーク、Neural Video Representation Compression (NVRC)を提案する。
NVRCは初めて、INRベースのビデオをエンドツーエンドで最適化することができる。
実験の結果,NVRCは従来のベンチマークエントロピーよりも優れていた。
論文 参考訳(メタデータ) (2024-09-11T16:57:12Z) - UniCompress: Enhancing Multi-Data Medical Image Compression with Knowledge Distillation [59.3877309501938]
Inlicit Neural Representation (INR) ネットワークは、その柔軟な圧縮比のため、顕著な汎用性を示している。
周波数領域情報を含むコードブックをINRネットワークへの事前入力として導入する。
これにより、INRの表現力が向上し、異なる画像ブロックに対して特異な条件付けが提供される。
論文 参考訳(メタデータ) (2024-05-27T05:52:13Z) - NERV++: An Enhanced Implicit Neural Video Representation [11.25130799452367]
強調された暗黙的ニューラルビデオ表現であるNeRV++のニューラル表現を導入する。
NeRV++は、オリジナルのNeRVデコーダアーキテクチャよりも単純だが効果的な拡張である。
提案手法をUVG,MCL JVC,Bunnyのデータセット上で評価し,INRによる映像圧縮の競合性を実現する。
論文 参考訳(メタデータ) (2024-02-28T13:00:32Z) - DNeRV: Modeling Inherent Dynamics via Difference Neural Representation
for Videos [53.077189668346705]
映像の差分表現(eRV)
我々はこれを制限関数の適合性とフレーム差の重要性の観点から分析する。
DNeRVは最先端のニューラル圧縮アプローチと競合する結果を得る。
論文 参考訳(メタデータ) (2023-04-13T13:53:49Z) - Modality-Agnostic Variational Compression of Implicit Neural
Representations [96.35492043867104]
Inlicit Neural Representation (INR) としてパラメータ化されたデータの関数的ビューに基づくモーダリティ非依存型ニューラル圧縮アルゴリズムを提案する。
潜時符号化と疎性の間のギャップを埋めて、ソフトゲーティング機構に非直線的にマッピングされたコンパクト潜時表現を得る。
このような潜在表現のデータセットを得た後、ニューラル圧縮を用いてモーダリティ非依存空間におけるレート/歪みトレードオフを直接最適化する。
論文 参考訳(メタデータ) (2023-01-23T15:22:42Z) - Learned Video Compression via Heterogeneous Deformable Compensation
Network [78.72508633457392]
不安定な圧縮性能の問題に対処するために,不均一変形補償戦略(HDCVC)を用いた学習ビデオ圧縮フレームワークを提案する。
より具体的には、提案アルゴリズムは隣接する2つのフレームから特徴を抽出し、コンテンツ近傍の不均一な変形(HetDeform)カーネルオフセットを推定する。
実験結果から,HDCVCは最近の最先端の学習ビデオ圧縮手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2022-07-11T02:31:31Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - Neural Weight Step Video Compression [0.5772546394254112]
本稿では,2つのアーキテクチャのパラダイムを用いて,映像圧縮の実現可能性をテストするための一連の実験を提案する。
ビデオのフレームを低エントロピーパラメータ更新として符号化する手法を提案する。
提案手法の有効性を評価するため,複数の高解像度映像データセット上で映像圧縮性能をテストする。
論文 参考訳(メタデータ) (2021-12-02T18:53:05Z) - Towards Generative Video Compression [37.759436128930346]
本稿では,GAN(Generative Adversarial Network)に基づくニューラルビデオ圧縮手法を提案する。
論文 参考訳(メタデータ) (2021-07-26T08:53:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。