論文の概要: DPICT: Deep Progressive Image Compression Using Trit-Planes
- arxiv url: http://arxiv.org/abs/2112.06334v1
- Date: Sun, 12 Dec 2021 22:09:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-14 18:40:34.908784
- Title: DPICT: Deep Progressive Image Compression Using Trit-Planes
- Title(参考訳): DPICT:トリトプレーンを用いた深部進行画像圧縮
- Authors: Jae-Han Lee, Seungmin Jeon, Kwang Pyo Choi, Youngo Park, and Chang-Su
Kim
- Abstract要約: Trit-planes (DPICT) アルゴリズムを用いた深部プログレッシブ画像圧縮
解析ネットワークを用いて,画像を潜時テンソルに変換する。
圧縮ビットストリームトリトプレーンにトリトプレーンでエンコードする。
- 参考スコア(独自算出の注目度): 36.34865777731784
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose the deep progressive image compression using trit-planes (DPICT)
algorithm, which is the first learning-based codec supporting fine granular
scalability (FGS). First, we transform an image into a latent tensor using an
analysis network. Then, we represent the latent tensor in ternary digits
(trits) and encode it into a compressed bitstream trit-plane by trit-plane in
the decreasing order of significance. Moreover, within each trit-plane, we sort
the trits according to their rate-distortion priorities and transmit more
important information first. Since the compression network is less optimized
for the cases of using fewer trit-planes, we develop a postprocessing network
for refining reconstructed images at low rates. Experimental results show that
DPICT outperforms conventional progressive codecs significantly, while enabling
FGS transmission.
- Abstract(参考訳): 本稿では,FGS(微細粒度スケーラビリティ)をサポートする最初の学習ベースコーデックであるトリオプレーン(DPICT)アルゴリズムを用いた深部プログレッシブ画像圧縮を提案する。
まず,解析ネットワークを用いて画像から潜時テンソルに変換する。
そして、三進数(三進数)の潜在テンソルを表現し、三進数の減少順序で圧縮ビットストリームトリト平面に符号化する。
さらに,各トライトプレーン内で,そのレートゆがみ優先度に応じてトリットを分類し,より重要な情報を最初に送信する。
圧縮ネットワークは, トリトプレーンの少ない場合にはあまり最適化されないため, 再構成画像の低精細化のための後処理ネットワークを開発する。
実験の結果,DPICTは従来のプログレッシブコーデックよりも優れ,FGS伝送が可能であった。
関連論文リスト
- Chasing Better Deep Image Priors between Over- and Under-parameterization [63.8954152220162]
そこで本研究では,DNN固有の空間性を利用して,LIP(lottery image prior)を新たに検討する。
LIPworksは、コンパクトなモデルサイズでディープデコーダを著しく上回っている。
また、LIPを圧縮センシング画像再構成に拡張し、事前学習したGANジェネレータを前者として使用する。
論文 参考訳(メタデータ) (2024-10-31T17:49:44Z) - Semantic Ensemble Loss and Latent Refinement for High-Fidelity Neural Image Compression [58.618625678054826]
本研究は、最適な視覚的忠実度のために設計された強化されたニューラル圧縮手法を提案する。
我々は,洗練されたセマンティック・アンサンブル・ロス,シャルボニエ・ロス,知覚的損失,スタイル・ロス,非バイナリ・ディバイザ・ロスを組み込んだモデルを構築した。
実験により,本手法は神経画像圧縮の統計的忠実度を著しく向上させることが示された。
論文 参考訳(メタデータ) (2024-01-25T08:11:27Z) - Context-Based Trit-Plane Coding for Progressive Image Compression [31.396712329965005]
トリトプレーン符号化は、深いプログレッシブな画像圧縮を可能にするが、自己回帰的文脈モデルを使用することはできない。
我々は,潜在要素のトライト確率を正確に推定するために,文脈に基づくレート低減モジュールを開発した。
第2に、三面体から部分潜時テンソルを精製する文脈に基づく歪み低減モジュールを開発する。
第三に、デコーダがより優れたレート歪みトレードオフを達成するための再訓練方式を提案する。
論文 参考訳(メタデータ) (2023-03-10T05:46:25Z) - PREF: Phasorial Embedding Fields for Compact Neural Representations [54.44527545923917]
本稿では,脳神経信号モデリングと再構成作業を容易にするためのコンパクトな表現として,ファサール埋め込みフィールドemphPREFを提案する。
実験の結果,PreFをベースとしたニューラル信号処理技術は,2次元画像補完,3次元SDF表面回帰,5次元放射野再構成と同等であることがわかった。
論文 参考訳(メタデータ) (2022-05-26T17:43:03Z) - RD-Optimized Trit-Plane Coding of Deep Compressed Image Latent Tensors [40.86513649546442]
DPICTは、きめ細かいスケーラビリティをサポートする最初の学習ベースの画像である。
本稿では,トライトプレーンスライシングとRD優先伝送という,DPICTの2つの重要なコンポーネントを効率的に実装する方法について述べる。
論文 参考訳(メタデータ) (2022-03-25T06:33:16Z) - Reducing Redundancy in the Bottleneck Representation of the Autoencoders [98.78384185493624]
オートエンコーダは教師なしニューラルネットワークの一種であり、様々なタスクを解くのに使用できる。
本稿では,ボトルネック表現における特徴冗長性を明示的に罰する手法を提案する。
我々は,3つの異なるデータセットを用いた次元削減,MNISTデータセットを用いた画像圧縮,ファッションMNISTを用いた画像デノナイズという,さまざまなタスクにまたがってアプローチを検証した。
論文 参考訳(メタデータ) (2022-02-09T18:48:02Z) - Exploring Structural Sparsity in Neural Image Compression [14.106763725475469]
本稿では,各コンボリューションチャネルの重要性を判定し,トレーニング中に空間性を導入するために,ABCM(プラグイン適応型バイナリチャネルマスキング)を提案する。
推論中、重要でないチャネルをプルーニングしてスリムネットワークを得る。
実験の結果,最大7倍の計算削減と3倍の加速は無視可能な性能低下で達成できることがわかった。
論文 参考訳(メタデータ) (2022-02-09T17:46:49Z) - DeepFGS: Fine-Grained Scalable Coding for Learned Image Compression [22.933872281183497]
最初に学習したきめ細かなスケーラブルな画像圧縮モデル(DeepFGS)を提案する。
本稿では,特徴分離バックボーンを導入し,画像情報を基本的かつスケーラブルな特徴に分割し,情報再構成戦略を通じて特徴チャネルを再分割する。
実験により,私たちのDeepFGSはPSNRおよびMS-SSIMメトリクスにおいて,学習ベースでスケーラブルな画像圧縮モデルや従来型のスケーラブルな画像コーデックよりも優れていることが示された。
論文 参考訳(メタデータ) (2022-01-04T15:03:13Z) - Modeling Image Quantization Tradeoffs for Optimal Compression [0.0]
ロスシー圧縮アルゴリズムは、圧縮率を上げるために高周波データを定量化することでトレードオフを狙う。
本稿では,Deep Learningとminimax損失関数を用いた量子化テーブルの最適化手法を提案する。
論文 参考訳(メタデータ) (2021-12-14T07:35:22Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。