論文の概要: High-Frequency Enhanced Hybrid Neural Representation for Video Compression
- arxiv url: http://arxiv.org/abs/2411.06685v1
- Date: Mon, 11 Nov 2024 03:04:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-12 14:10:57.649743
- Title: High-Frequency Enhanced Hybrid Neural Representation for Video Compression
- Title(参考訳): ビデオ圧縮のための高周波強化ハイブリッドニューラル表現
- Authors: Li Yu, Zhihui Li, Jimin Xiao, Moncef Gabbouj,
- Abstract要約: 本稿では,高周波拡張型ハイブリッドニューラル表現ネットワークを提案する。
本手法は,ネットワークによる細部合成を改善するために,高周波情報を活用することに焦点を当てている。
BunnyおよびUVGデータセットの実験は、我々の手法が他の手法よりも優れていることを示した。
- 参考スコア(独自算出の注目度): 32.38933743785333
- License:
- Abstract: Neural Representations for Videos (NeRV) have simplified the video codec process and achieved swift decoding speeds by encoding video content into a neural network, presenting a promising solution for video compression. However, existing work overlooks the crucial issue that videos reconstructed by these methods lack high-frequency details. To address this problem, this paper introduces a High-Frequency Enhanced Hybrid Neural Representation Network. Our method focuses on leveraging high-frequency information to improve the synthesis of fine details by the network. Specifically, we design a wavelet high-frequency encoder that incorporates Wavelet Frequency Decomposer (WFD) blocks to generate high-frequency feature embeddings. Next, we design the High-Frequency Feature Modulation (HFM) block, which leverages the extracted high-frequency embeddings to enhance the fitting process of the decoder. Finally, with the refined Harmonic decoder block and a Dynamic Weighted Frequency Loss, we further reduce the potential loss of high-frequency information. Experiments on the Bunny and UVG datasets demonstrate that our method outperforms other methods, showing notable improvements in detail preservation and compression performance.
- Abstract(参考訳): NeRV(Neural Representations for Videos)は、ビデオコーデックプロセスを単純化し、ビデオコンテンツをニューラルネットワークに符号化することで、高速なデコード速度を実現し、ビデオ圧縮のための有望なソリューションを提供する。
しかし、既存の作業は、これらの方法で再構成されたビデオが高周波の詳細を欠いている重要な問題を見落としている。
そこで本研究では,高周波拡張型ハイブリッドニューラル表現ネットワークを提案する。
本手法は,ネットワークによる細部合成を改善するために,高周波情報を活用することに焦点を当てている。
具体的には、Wavelet Frequency Decomposer(WFD)ブロックを組み込んで高周波特徴埋め込みを生成するウェーブレット高周波エンコーダを設計する。
次に、抽出した高周波埋め込みを利用してデコーダの嵌合性を高める高周波特徴変調(HFM)ブロックを設計する。
最後に、改良された高調波デコーダブロックと動的重み付き周波数損失により、高周波情報の潜在的な損失をさらに低減する。
Bunny および UVG データセットの実験により,本手法が他の手法よりも優れており,詳細な保存性能と圧縮性能が顕著に向上していることが示された。
関連論文リスト
- Neural Video Representation for Redundancy Reduction and Consistency Preservation [0.0]
入射神経表現(INR)は、様々な信号をニューラルネットワークに埋め込む。
フレームの高周波成分と低周波成分の両方を生成する映像表現法を提案する。
実験の結果,提案手法は既存のHNeRV法よりも優れており,動画の96%において優れた結果が得られた。
論文 参考訳(メタデータ) (2024-09-27T07:30:12Z) - Bi-Level Spatial and Channel-aware Transformer for Learned Image Compression [0.0]
本稿では,特徴マップ内の周波数成分を考慮したトランスフォーマーに基づく画像圧縮手法を提案する。
本手法は,空間ベース分岐が高周波数と低周波数を独立に扱うHSCATB(Hybrid Space-Channel Attention Transformer Block)を統合した。
また、トランスフォーマーブロック内にMLGFFN(Mixed Local-Global Feed Forward Network)を導入し、多様な情報とリッチな情報の抽出を強化する。
論文 参考訳(メタデータ) (2024-08-07T15:35:25Z) - Wave-Mamba: Wavelet State Space Model for Ultra-High-Definition Low-Light Image Enhancement [7.891750065129094]
ウェーブレット領域から導出される2つの重要な洞察に基づく新しいアプローチであるWave-Mambaを提案する。
提案手法は優れた性能を示し, 従来の先行技術を大きく上回っている。
論文 参考訳(メタデータ) (2024-08-02T14:01:34Z) - Compression-Realized Deep Structural Network for Video Quality Enhancement [78.13020206633524]
本稿では,圧縮ビデオの品質向上の課題に焦点をあてる。
既存の手法のほとんどは、圧縮コーデック内での事前処理を最適に活用するための構造設計を欠いている。
新しいパラダイムは、より意識的な品質向上プロセスのために緊急に必要である。
論文 参考訳(メタデータ) (2024-05-10T09:18:17Z) - HybridFlow: Infusing Continuity into Masked Codebook for Extreme Low-Bitrate Image Compression [51.04820313355164]
HyrbidFlowは、連続的な機能ベースのストリームとコードブックベースのストリームを組み合わせることで、極めて低い条件下で高い知覚品質と高い忠実性を実現する。
実験の結果、超低速で複数のデータセットにまたがる優れた性能が示された。
論文 参考訳(メタデータ) (2024-04-20T13:19:08Z) - Denoising Diffusion Error Correction Codes [92.10654749898927]
近年、ニューラルデコーダは古典的デコーダ技術に対する優位性を実証している。
最近の最先端のニューラルデコーダは複雑で、多くのレガシデコーダの重要な反復的スキームが欠如している。
本稿では,任意のブロック長の線形符号のソフトデコードにデノナイズ拡散モデルを適用することを提案する。
論文 参考訳(メタデータ) (2022-09-16T11:00:50Z) - Learned Video Compression via Heterogeneous Deformable Compensation
Network [78.72508633457392]
不安定な圧縮性能の問題に対処するために,不均一変形補償戦略(HDCVC)を用いた学習ビデオ圧縮フレームワークを提案する。
より具体的には、提案アルゴリズムは隣接する2つのフレームから特徴を抽出し、コンテンツ近傍の不均一な変形(HetDeform)カーネルオフセットを推定する。
実験結果から,HDCVCは最近の最先端の学習ビデオ圧縮手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2022-07-11T02:31:31Z) - Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG
Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。
実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文 参考訳(メタデータ) (2022-01-27T20:20:03Z) - Ultra-low bitrate video conferencing using deep image animation [7.263312285502382]
ビデオ会議のための超低速ビデオ圧縮のための新しい深層学習手法を提案する。
我々はディープニューラルネットワークを用いて、動き情報をキーポイント変位として符号化し、デコーダ側で映像信号を再構成する。
論文 参考訳(メタデータ) (2020-12-01T09:06:34Z) - Multi-level Wavelet-based Generative Adversarial Network for Perceptual
Quality Enhancement of Compressed Video [51.631731922593225]
既存の手法は主に、その知覚的品質を無視しながら、圧縮映像の客観的品質を高めることに焦点を当てている。
圧縮ビデオの知覚品質を高めるために,マルチレベルウェーブレットパケット変換(WPT)に基づくGAN(Generative Adversarial Network)を提案する。
論文 参考訳(メタデータ) (2020-08-02T15:01:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。