論文の概要: NeuralLVC: Neural Lossless Video Compression via Masked Diffusion with Temporal Conditioning
- arxiv url: http://arxiv.org/abs/2604.03353v1
- Date: Fri, 03 Apr 2026 16:49:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:18.535069
- Title: NeuralLVC: Neural Lossless Video Compression via Masked Diffusion with Temporal Conditioning
- Title(参考訳): NeuralLVC: 仮面拡散によるニューラルロスレスビデオ圧縮
- Authors: Tiberio Uricchio, Marco Bertini,
- Abstract要約: 本稿では,仮面拡散と時間的冗長性を利用するI/Pフレームアーキテクチャを組み合わせたニューラルLVCを提案する。
9つのXiph CIF配列の実験により、NeuralLVCはH.264とH.265よりも大きなマージンで優れていることが示された。
- 参考スコア(独自算出の注目度): 8.961948904211619
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While neural lossless image compression has advanced significantly with learned entropy models, lossless video compression remains largely unexplored in the neural setting. We present NeuralLVC, a neural lossless video codec that combines masked diffusion with an I/P-frame architecture for exploiting temporal redundancy. Our I-frame model compresses individual frames using bijective linear tokenization that guarantees exact pixel reconstruction. The P-frame model compresses temporal differences between consecutive frames, conditioned on the previous decoded frame via a lightweight reference embedding that adds only 1.3% trainable parameters. Group-wise decoding enables controllable speed-compression trade-offs. Our codec is lossless in the input domain: for video, it reconstructs YUV420 planes exactly; for image evaluation, RGB channels are reconstructed exactly. Experiments on 9 Xiph CIF sequences show that NeuralLVC outperforms H.264 and H.265 lossless by a significant margin. We verify exact reconstruction through end-to-end encode-decode testing with arithmetic coding. These results suggest that masked diffusion with temporal conditioning is a promising direction for neural lossless video compression.
- Abstract(参考訳): 学習エントロピーモデルでは、ニューラルロスレス画像圧縮は大幅に進歩しているが、ニューラルセッティングでは、ロスレスビデオ圧縮はほとんど探索されていない。
マスク拡散とI/Pフレームアーキテクチャを組み合わせて時間的冗長性を利用するニューラルLVCを提案する。
我々のIフレームモデルは、正確な画素再構成を保証する単射線形トークン化を用いて、個々のフレームを圧縮する。
Pフレームモデルは、トレーニング可能なパラメータをわずか1.3%追加する軽量な参照埋め込みを通じて、以前の復号化フレームで条件付けられた連続フレーム間の時間差を圧縮する。
グループワイドデコーディングは、制御可能な速度圧縮トレードオフを可能にする。
我々のコーデックは入力領域ではロスレスであり、ビデオではYUV420平面を正確に再構成し、画像評価ではRGBチャネルを正確に再構成する。
9つのXiph CIF配列の実験では、NeuralLVCはH.264とH.265の損失をかなりの差で上回っている。
算術符号を用いたエンド・ツー・エンドのエンコード・デコードテストによる正確な再構成を検証する。
これらの結果は,時間条件付きマスク拡散がニューラルロスレスビデオ圧縮の有望な方向であることを示唆している。
関連論文リスト
- Generative Latent Video Compression [26.99743586846841]
本稿では,知覚的ビデオ圧縮の有効なフレームワークであるジェネレーティブ・ラテント・ビデオ圧縮(GLVC)を提案する。
GLVCは、ビデオフレームを知覚的に整列された潜在空間に投影するために、事前訓練された連続トークンを使用する。
GLVC は DISTS と LPIPS の指標で最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2025-10-11T03:28:49Z) - Large Motion Video Autoencoding with Cross-modal Video VAE [52.13379965800485]
ビデオ可変オートエンコーダ(VAE)は、ビデオ冗長性を低減し、効率的なビデオ生成を容易にするために不可欠である。
既存のビデオVAEは時間圧縮に対処し始めているが、しばしば再建性能が不十分である。
本稿では,高忠実度ビデオエンコーディングが可能な,新規で強力なビデオオートエンコーダを提案する。
論文 参考訳(メタデータ) (2024-12-23T18:58:24Z) - FCNR: Fast Compressive Neural Representation of Visualization Images [6.648837287947374]
我々は,何万もの可視化画像に対する高速圧縮ニューラル表現であるFCNRを提案する。
FCNRはステレオ画像圧縮の最近の進歩に基づき、ステレオコンテキストモジュールとジョイントコンテキスト転送モジュールを同化して画像ペアを圧縮する。
論文 参考訳(メタデータ) (2024-07-23T10:34:02Z) - NeRFCodec: Neural Feature Compression Meets Neural Radiance Fields for Memory-Efficient Scene Representation [22.151167286623416]
メモリ効率のよいシーン表現のための非線形変換,量子化,エントロピー符号化を統合したエンドツーエンドのNeRF圧縮フレームワークを提案する。
提案手法は既存のNeRF圧縮法より優れており、0.5MBのメモリ予算で高品質な新規ビュー合成を可能にする。
論文 参考訳(メタデータ) (2024-04-02T15:49:00Z) - Extreme Video Compression with Pre-trained Diffusion Models [11.898317376595697]
本稿では,デコーダにおける拡散型生成モデルの予測力を活用した,極端な映像圧縮のための新しい手法を提案する。
ビデオ全体が順次エンコードされ、知覚品質の指標を考慮し、視覚的に快く再現される。
その結果、生成モデルを用いて映像データの時間的関係を活用できる可能性が示された。
論文 参考訳(メタデータ) (2024-02-14T04:23:05Z) - Perceptual Learned Video Compression with Recurrent Conditional GAN [158.0726042755]
本稿では, PVC (Perceptual Learned Video Compression) アプローチを提案する。
PLVCは低ビットレートで映像を知覚品質に圧縮することを学ぶ。
ユーザスタディでは、最新の学習ビデオ圧縮手法と比較して、PLVCの優れた知覚性能をさらに検証している。
論文 参考訳(メタデータ) (2021-09-07T13:36:57Z) - Conditional Entropy Coding for Efficient Video Compression [82.35389813794372]
本稿では,フレーム間の条件エントロピーをモデル化することのみに焦点を当てた,非常にシンプルで効率的なビデオ圧縮フレームワークを提案する。
まず、画像遅延符号間のエントロピーをモデル化する単純なアーキテクチャが、他のニューラルビデオ圧縮やビデオコーデックと同等の競争力を持つことを示す。
次に、このアーキテクチャの上に新しい内部学習拡張を提案し、復号速度を抑えることなく10%の節約を実現した。
論文 参考訳(メタデータ) (2020-08-20T20:01:59Z) - Learning for Video Compression with Recurrent Auto-Encoder and Recurrent
Probability Model [164.7489982837475]
本稿では、リカレントオートエンコーダ(RAE)とリカレント確率モデル(RPM)を用いたリカレントラーニングビデオ圧縮(RLVC)手法を提案する。
RAEは、ビデオフレーム間の時間的相関を利用するために、エンコーダとデコーダの両方で繰り返しセルを使用する。
提案手法は,PSNRとMS-SSIMの両方の観点から,最先端の学習ビデオ圧縮性能を実現する。
論文 参考訳(メタデータ) (2020-06-24T08:46:33Z) - Content Adaptive and Error Propagation Aware Deep Video Compression [110.31693187153084]
本稿では,コンテンツ適応型・誤り伝搬対応型ビデオ圧縮システムを提案する。
本手法では, 複数フレームの圧縮性能を1フレームではなく複数フレームで考慮し, 共同学習手法を用いる。
従来の圧縮システムでは手作りのコーディングモードを使用する代わりに,オンラインエンコーダ更新方式をシステム内に設計する。
論文 参考訳(メタデータ) (2020-03-25T09:04:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。