論文の概要: Light Field Compression by Residual CNN Assisted JPEG
- arxiv url: http://arxiv.org/abs/2010.00062v2
- Date: Thu, 18 Mar 2021 15:02:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-13 00:30:23.306277
- Title: Light Field Compression by Residual CNN Assisted JPEG
- Title(参考訳): 残留CNN支援JPEGによる光場圧縮
- Authors: Eisa Hedayati, Timothy C. Havens, Jeremy P. Bos
- Abstract要約: 我々はJPEGを用いた学習技術を開発し、平均0.0047ピクセル当たりのビットストリームからLFを再構成する。
提案手法は,圧縮時間の1%と圧縮の18倍の高速化により,LFの圧縮に使用される最先端ビデオ圧縮技術と比較して,構造類似度指標(SSIM)とピーク信号-雑音比(PSNR)が向上したことを示す。
- 参考スコア(独自算出の注目度): 4.767599257804181
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Light field (LF) imaging has gained significant attention due to its recent
success in 3-dimensional (3D) displaying and rendering as well as augmented and
virtual reality usage. Nonetheless, because of the two extra dimensions, LFs
are much larger than conventional images. We develop a JPEG-assisted
learning-based technique to reconstruct an LF from a JPEG bitstream with a bit
per pixel ratio of 0.0047 on average. For compression, we keep the LF's center
view and use JPEG compression with 50% quality. Our reconstruction pipeline
consists of a small JPEG enhancement network (JPEG-Hance), a depth estimation
network (Depth-Net), followed by view synthesizing by warping the enhanced
center view. Our pipeline is significantly faster than using video compression
on pseudo-sequences extracted from an LF, both in compression and
decompression, while maintaining effective performance. We show that with a 1%
compression time cost and 18x speedup for decompression, our methods
reconstructed LFs have better structural similarity index metric (SSIM) and
comparable peak signal-to-noise ratio (PSNR) compared to the state-of-the-art
video compression techniques used to compress LFs.
- Abstract(参考訳): 光場(LF)イメージングは、最近の3次元表示とレンダリングの成功と、拡張現実と仮想現実の使用により、大きな注目を集めている。
しかしながら、2つの余剰次元のため、LFは従来の画像よりもはるかに大きい。
我々は、JPEGビットストリームからLFを平均0.0047ピクセル当たりのビット比で再構成するJPEG支援学習技術を開発した。
圧縮のために、LFの中心ビューを保持し、50%の品質でJPEG圧縮を使用します。
再構成パイプラインは, JPEG拡張ネットワーク (JPEG-Hance) と深度推定ネットワーク (Depth-Net) から構成され, 拡張中心ビューをワープすることでビュー合成を行う。
我々のパイプラインは、LFから抽出した擬似シーケンスの動画圧縮よりも、圧縮と非圧縮の両方で、効果的な性能を維持しながら、はるかに高速である。
提案手法では,圧縮時間の1%と圧縮の18倍の高速化により,LFの圧縮に使用される最先端ビデオ圧縮技術と比較して,構造類似度指標(SSIM)とピーク信号-雑音比(PSNR)が向上した。
関連論文リスト
- LFIC-DRASC: Deep Light Field Image Compression Using Disentangled Representation and Asymmetrical Strip Convolution [51.909036244222904]
ディスタングル表現と非対称ストリップ畳み込みを用いたエンドツーエンドのディープLF画像圧縮法を提案する。
実験の結果,提案したLFIC-DRASCは平均20.5%のビットレート削減を達成した。
論文 参考訳(メタデータ) (2024-09-18T05:33:42Z) - Learned Image Compression for HE-stained Histopathological Images via Stain Deconvolution [33.69980388844034]
本稿では,一般的なJPEGアルゴリズムがさらなる圧縮に適していないことを示す。
Stain Quantized Latent Compression, a novel DL based histopathology data compression approach。
提案手法はJPEGのような従来の手法と比較して,下流タスクの分類において優れた性能を示すことを示す。
論文 参考訳(メタデータ) (2024-06-18T13:47:17Z) - RAGE for the Machine: Image Compression with Low-Cost Random Access for
Embedded Applications [5.199703527082964]
RAGEは画像圧縮フレームワークで、一般的に矛盾する4つの目的を達成する。
RAGEは、最先端のロスレス画像圧縮機と類似またはより良い圧縮比を有することを示す。
また、RAGE-Qは、組込みグラフィックスの歪みという点でJPEGを数倍上回っていることを示す。
論文 参考訳(メタデータ) (2024-02-07T19:28:33Z) - Unified learning-based lossy and lossless JPEG recompression [15.922937139019547]
本稿では,学習量子化テーブルとマルコフ階層型変分オートエンコーダから構成されるJPEG再圧縮フレームワークを提案する。
実験の結果,JPEGが上界に近づくと,任意に低歪みが得られることがわかった。
論文 参考訳(メタデータ) (2023-12-05T12:07:27Z) - Learned Lossless Compression for JPEG via Frequency-Domain Prediction [50.20577108662153]
JPEG画像のロスレス圧縮を学習するための新しいフレームワークを提案する。
周波数領域での学習を可能にするために、DCT係数は暗黙の局所冗長性を利用するためにグループに分割される。
グループ化されたDCT係数のエントロピーモデリングを実現するために、重み付きブロックに基づいてオートエンコーダのようなアーキテクチャを設計する。
論文 参考訳(メタデータ) (2023-03-05T13:15:28Z) - Data Efficient Visual Place Recognition Using Extremely JPEG-Compressed
Images [17.847661026367767]
本稿では,JPEG圧縮が視覚的位置認識技術の性能に与える影響について検討する。
圧縮を導入することにより、特に高い圧縮スペクトルにおいて、VPR性能が大幅に低下することを示す。
我々は、JPEG圧縮データに最適化された微調整CNNを提案し、非常に圧縮されたJPEG画像で検出された画像変換とより一貫した性能を示す。
論文 参考訳(メタデータ) (2022-09-17T14:46:28Z) - Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG
Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。
実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文 参考訳(メタデータ) (2022-01-27T20:20:03Z) - Learning to Improve Image Compression without Changing the Standard
Decoder [100.32492297717056]
本稿では,標準デコーダによる符号化性能向上のための学習法を提案する。
具体的には、DCT係数の分布を最適化する周波数領域事前編集法を提案する。
JPEGデコーダは変更しないので、広く使われている標準JPEGデコーダで画像を見る際には、我々のアプローチが適用可能である。
論文 参考訳(メタデータ) (2020-09-27T19:24:42Z) - Quantization Guided JPEG Artifact Correction [69.04777875711646]
我々はJPEGファイル量子化行列を用いたアーティファクト修正のための新しいアーキテクチャを開発した。
これにより、特定の品質設定のためにトレーニングされたモデルに対して、単一のモデルで最先端のパフォーマンスを達成できます。
論文 参考訳(メタデータ) (2020-04-17T00:10:08Z) - Learning Better Lossless Compression Using Lossy Compression [100.50156325096611]
我々は、ロスレス画像圧縮システムを構築するために、強力なロスレス画像圧縮アルゴリズムであるBPGを利用する。
我々は,BPG再構成を条件とした畳み込みニューラルネットワークに基づく確率モデルを用いて,残差分布をモデル化する。
そして、この画像は、BPGが生成したビットストリームと学習した残留コーダの連結を用いて保存される。
論文 参考訳(メタデータ) (2020-03-23T11:21:52Z) - Improved Image Coding Autoencoder With Deep Learning [8.92071749364712]
自動エンコーダベースのパイプラインを構築し,Ball'eのアプローチに基づく極端エンドツーエンドの画像圧縮を実現する。
ピクセル当たりのビット数は4.0%減少し(bpp)、マルチスケール構造類似度(MS-SSIM)は0.03%増加し、ピーク信号-ノイズ比(PSNR)は0.47%低下した。
論文 参考訳(メタデータ) (2020-02-28T03:21:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。