論文の概要: Improved Image Coding Autoencoder With Deep Learning
- arxiv url: http://arxiv.org/abs/2002.12521v1
- Date: Fri, 28 Feb 2020 03:21:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-28 02:56:48.849737
- Title: Improved Image Coding Autoencoder With Deep Learning
- Title(参考訳): ディープラーニングによる画像符号化オートエンコーダの改良
- Authors: Licheng Xiao, Hairong Wang, Nam Ling
- Abstract要約: 自動エンコーダベースのパイプラインを構築し,Ball'eのアプローチに基づく極端エンドツーエンドの画像圧縮を実現する。
ピクセル当たりのビット数は4.0%減少し(bpp)、マルチスケール構造類似度(MS-SSIM)は0.03%増加し、ピーク信号-ノイズ比(PSNR)は0.47%低下した。
- 参考スコア(独自算出の注目度): 8.92071749364712
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we build autoencoder based pipelines for extreme end-to-end
image compression based on Ball\'e's approach, which is the state-of-the-art
open source implementation in image compression using deep learning. We
deepened the network by adding one more hidden layer before each strided
convolutional layer with exactly the same number of down-samplings and
up-samplings. Our approach outperformed Ball\'e's approach, and achieved around
4.0% reduction in bits per pixel (bpp), 0.03% increase in multi-scale
structural similarity (MS-SSIM), and only 0.47% decrease in peak
signal-to-noise ratio (PSNR), It also outperforms all traditional image
compression methods including JPEG2000 and HEIC by at least 20% in terms of
compression efficiency at similar reconstruction image quality. Regarding
encoding and decoding time, our approach takes similar amount of time compared
with traditional methods with the support of GPU, which means it's almost ready
for industrial applications.
- Abstract(参考訳): 本稿では、画像圧縮における最先端のオープンソース実装であるball\'eのアプローチに基づいて、極端にエンドツーエンドな画像圧縮のためのオートエンコーダベースのパイプラインを構築する。
各層が全く同じ数のダウンサンプリングとアップサンプリングを持つ畳み込み層の前に、さらに1つの隠れ層を追加することで、ネットワークをさらに深めました。
提案手法は,Ball\eのアプローチよりも優れ,画素当たりのビット数の約4.0%削減,マルチスケール構造類似度(MS-SSIM)の0.03%向上,ピーク信号-雑音比(PSNR)のわずか0.47%低下,JPEG2000やHEICを含む従来の画像圧縮手法の圧縮効率の少なくとも20%向上を実現した。
エンコーディングとデコーディングに関しては、従来のgpuをサポートする従来の方法と同等の時間を要するため、産業アプリケーションではほぼ準備が整っています。
関連論文リスト
- DeepHQ: Learned Hierarchical Quantizer for Progressive Deep Image Coding [27.875207681547074]
プログレッシブ画像符号化(PIC)は、画像の様々な品質を単一のビットストリームに圧縮することを目的としている。
ニューラルネットワーク(NN)に基づくPICの研究は、その初期段階にある。
本稿では,まず,学習した量子化ステップサイズを各量子化レイヤの学習により活用するNNベースのプログレッシブコーディング手法を提案する。
論文 参考訳(メタデータ) (2024-08-22T06:32:53Z) - Progressive Learning with Visual Prompt Tuning for Variable-Rate Image
Compression [60.689646881479064]
本稿では,変圧器を用いた可変レート画像圧縮のためのプログレッシブラーニングパラダイムを提案する。
視覚的プロンプトチューニングにインスパイアされた私たちは,エンコーダ側とデコーダ側でそれぞれ入力画像と隠蔽特徴のプロンプトを抽出するためにLPMを使用する。
提案モデルでは, 速度歪み特性の観点から現行の可変画像法よりも優れ, スクラッチから訓練した最先端の固定画像圧縮法にアプローチする。
論文 参考訳(メタデータ) (2023-11-23T08:29:32Z) - You Can Mask More For Extremely Low-Bitrate Image Compression [80.7692466922499]
近年,学習画像圧縮(lic)法は大きな進歩を遂げている。
licメソッドは、画像圧縮に不可欠な画像構造とテクスチャコンポーネントを明示的に探索することができない。
原画像の構造とテクスチャに基づいて可視パッチをサンプリングするDA-Maskを提案する。
極めて低ビットレート圧縮のために, lic と lic のエンドツーエンドを統一する最初のフレームワークである, 単純で効果的なマスク付き圧縮モデル (MCM) を提案する。
論文 参考訳(メタデータ) (2023-06-27T15:36:22Z) - Leveraging progressive model and overfitting for efficient learned image
compression [14.937446839215868]
マルチスケールプログレッシブ(MSP)確率モデルと潜在表現オーバーフィッティング(LOF)技術を用いた強力で柔軟なlicフレームワークを提案する。
事前定義されたプロファイルの異なるフレームワークでは、圧縮効率と計算複雑性のバランスポイントを達成できる。
実験の結果,提案フレームワークはVVC/H.266標準よりも2.5%,1.0%,1.3%Bjontegaardデルタビットレート(BDレート)の低減を実現している。
論文 参考訳(メタデータ) (2022-10-08T21:54:58Z) - Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG
Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。
実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文 参考訳(メタデータ) (2022-01-27T20:20:03Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - Towards Compact CNNs via Collaborative Compression [166.86915086497433]
チャネルプルーニングとテンソル分解を結合してCNNモデルを圧縮する協調圧縮方式を提案する。
52.9%のFLOPを削減し、ResNet-50で48.4%のパラメータを削除しました。
論文 参考訳(メタデータ) (2021-05-24T12:07:38Z) - Light Field Compression by Residual CNN Assisted JPEG [4.767599257804181]
我々はJPEGを用いた学習技術を開発し、平均0.0047ピクセル当たりのビットストリームからLFを再構成する。
提案手法は,圧縮時間の1%と圧縮の18倍の高速化により,LFの圧縮に使用される最先端ビデオ圧縮技術と比較して,構造類似度指標(SSIM)とピーク信号-雑音比(PSNR)が向上したことを示す。
論文 参考訳(メタデータ) (2020-09-30T19:09:37Z) - Learning Better Lossless Compression Using Lossy Compression [100.50156325096611]
我々は、ロスレス画像圧縮システムを構築するために、強力なロスレス画像圧縮アルゴリズムであるBPGを利用する。
我々は,BPG再構成を条件とした畳み込みニューラルネットワークに基づく確率モデルを用いて,残差分布をモデル化する。
そして、この画像は、BPGが生成したビットストリームと学習した残留コーダの連結を用いて保存される。
論文 参考訳(メタデータ) (2020-03-23T11:21:52Z) - A Unified End-to-End Framework for Efficient Deep Image Compression [35.156677716140635]
本稿では,3つの新しい技術に基づくEDIC(Efficient Deep Image Compression)という統合フレームワークを提案する。
具体的には、学習に基づく画像圧縮のためのオートエンコーダスタイルのネットワークを設計する。
EDIC法は,映像圧縮性能を向上させるために,Deep Video Compression (DVC) フレームワークに容易に組み込むことができる。
論文 参考訳(メタデータ) (2020-02-09T14:21:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。