論文の概要: Deep Learning-based Image Compression with Trellis Coded Quantization
- arxiv url: http://arxiv.org/abs/2001.09417v1
- Date: Sun, 26 Jan 2020 08:00:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-06 19:44:01.828861
- Title: Deep Learning-based Image Compression with Trellis Coded Quantization
- Title(参考訳): トレリス符号化量子化を用いた深層学習に基づく画像圧縮
- Authors: Binglin Li, Mohammad Akbari, Jie Liang, Yang Wang
- Abstract要約: 本稿では、深層学習に基づく画像圧縮フレームワークにトレリス符号化量子化器(TCQ)を組み込むことを提案する。
トレーニング中のバック伝搬を可能にするソフト・ツー・ハード戦略が適用される。
我々は,3つのワーク(エンコーダ,デコーダ,エントロピー推定)からなる単純な画像圧縮モデルを開発し,すべてのコンポーネントをエンドツーエンドに最適化する。
- 参考スコア(独自算出の注目度): 13.728517700074423
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently many works attempt to develop image compression models based on deep
learning architectures, where the uniform scalar quantizer (SQ) is commonly
applied to the feature maps between the encoder and decoder. In this paper, we
propose to incorporate trellis coded quantizer (TCQ) into a deep learning based
image compression framework. A soft-to-hard strategy is applied to allow for
back propagation during training. We develop a simple image compression model
that consists of three subnetworks (encoder, decoder and entropy estimation),
and optimize all of the components in an end-to-end manner. We experiment on
two high resolution image datasets and both show that our model can achieve
superior performance at low bit rates. We also show the comparisons between TCQ
and SQ based on our proposed baseline model and demonstrate the advantage of
TCQ.
- Abstract(参考訳): 近年,一様スカラー量子化器 (SQ) をエンコーダとデコーダの機能マップに適用する深層学習アーキテクチャに基づく画像圧縮モデルの開発が盛んに行われている。
本稿では,トレリス符号化量子化器(TCQ)をディープラーニングに基づく画像圧縮フレームワークに組み込むことを提案する。
トレーニング中のバック伝搬を可能にするソフト・ツー・ハード戦略が適用される。
本稿では,3つのサブネットワーク(エンコーダ,デコーダ,エントロピー推定)からなる単純な画像圧縮モデルを構築し,すべてのコンポーネントをエンドツーエンドに最適化する。
我々は2つの高解像度画像データセットを実験し、両モデルとも低ビットレートで優れた性能が得られることを示す。
また,提案したベースラインモデルに基づいて,TCQとSQの比較を行い,TCQの利点を示す。
関連論文リスト
- Lossy Image Compression with Quantized Hierarchical VAEs [33.173021636656465]
ResNet VAEはもともとデータ(画像)の分散モデリングのために設計された。
自然画像の損失圧縮における従来の手法より優れる、強力で効率的なモデルを提案する。
本モデルでは,画像を粗大に圧縮し,並列符号化と復号化をサポートする。
論文 参考訳(メタデータ) (2022-08-27T17:15:38Z) - Rank-Enhanced Low-Dimensional Convolution Set for Hyperspectral Image
Denoising [50.039949798156826]
本稿では,ハイパースペクトル(HS)画像の難解化問題に対処する。
ランク付き低次元畳み込み集合(Re-ConvSet)を提案する。
次に、Re-ConvSetを広く使われているU-Netアーキテクチャに組み込んで、HS画像復号法を構築する。
論文 参考訳(メタデータ) (2022-07-09T13:35:12Z) - Estimating the Resize Parameter in End-to-end Learned Image Compression [50.20567320015102]
本稿では,最近の画像圧縮モデルの速度歪みトレードオフをさらに改善する検索自由化フレームワークについて述べる。
提案手法により,Bjontegaard-Deltaレート(BD-rate)を最大10%向上させることができる。
論文 参考訳(メタデータ) (2022-04-26T01:35:02Z) - Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG
Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。
実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文 参考訳(メタデータ) (2022-01-27T20:20:03Z) - Variable-Rate Deep Image Compression through Spatially-Adaptive Feature
Transform [58.60004238261117]
空間特徴変換(SFT arXiv:1804.02815)に基づく多目的深部画像圧縮ネットワークを提案する。
本モデルは,任意の画素単位の品質マップによって制御される単一モデルを用いて,幅広い圧縮速度をカバーしている。
提案するフレームワークにより,様々なタスクに対してタスク対応の画像圧縮を行うことができる。
論文 参考訳(メタデータ) (2021-08-21T17:30:06Z) - Learned Image Compression with Gaussian-Laplacian-Logistic Mixture Model
and Concatenated Residual Modules [22.818632387206257]
学習画像圧縮の2つの重要な要素は、潜在表現のエントロピーモデルと符号化/復号化ネットワークアーキテクチャである。
本稿では,よりフレキシブルなガウス・ラプラシア・ロジスティック混合モデル(GLLMM)を提案する。
符号化/復号化ネットワーク設計部では、複数の残差ブロックを追加のショートカット接続で直列接続する残差ブロック(CRB)を提案する。
論文 参考訳(メタデータ) (2021-07-14T02:54:22Z) - Learned Multi-Resolution Variable-Rate Image Compression with
Octave-based Residual Blocks [15.308823742699039]
一般化オクターブ畳み込み(GoConv)と一般化オクターブ畳み込み(GoTConv)を用いた新しい可変レート画像圧縮フレームワークを提案する。
単一モデルが異なるビットレートで動作し、複数レートの画像特徴を学習できるようにするため、新しい目的関数が導入される。
実験結果から,H.265/HEVCベースのBPGや最先端の学習に基づく可変レート法などの標準コーデックよりも高い性能を示した。
論文 参考訳(メタデータ) (2020-12-31T06:26:56Z) - Quantization Guided JPEG Artifact Correction [69.04777875711646]
我々はJPEGファイル量子化行列を用いたアーティファクト修正のための新しいアーキテクチャを開発した。
これにより、特定の品質設定のためにトレーニングされたモデルに対して、単一のモデルで最先端のパフォーマンスを達成できます。
論文 参考訳(メタデータ) (2020-04-17T00:10:08Z) - Learning End-to-End Lossy Image Compression: A Benchmark [90.35363142246806]
まず,学習した画像の圧縮方法に関する総合的な文献調査を行う。
本稿では,最先端の学習画像圧縮手法のマイルストーンについて述べるとともに,既存の幅広い作品について概観し,その歴史的開発ルートについて考察する。
エントロピー推定と信号再構成のための粗大な超高次モデルを導入することにより、速度歪み性能の向上を実現する。
論文 参考訳(メタデータ) (2020-02-10T13:13:43Z) - A Unified End-to-End Framework for Efficient Deep Image Compression [35.156677716140635]
本稿では,3つの新しい技術に基づくEDIC(Efficient Deep Image Compression)という統合フレームワークを提案する。
具体的には、学習に基づく画像圧縮のためのオートエンコーダスタイルのネットワークを設計する。
EDIC法は,映像圧縮性能を向上させるために,Deep Video Compression (DVC) フレームワークに容易に組み込むことができる。
論文 参考訳(メタデータ) (2020-02-09T14:21:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。