論文の概要: Context-Based Trit-Plane Coding for Progressive Image Compression
- arxiv url: http://arxiv.org/abs/2303.05715v2
- Date: Mon, 13 Mar 2023 07:09:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-14 11:09:01.827810
- Title: Context-Based Trit-Plane Coding for Progressive Image Compression
- Title(参考訳): プログレッシブ画像圧縮のためのコンテキストベーストライトプレーン符号化
- Authors: Seungmin Jeon, Kwang Pyo Choi, Youngo Park and Chang-Su Kim
- Abstract要約: トリトプレーン符号化は、深いプログレッシブな画像圧縮を可能にするが、自己回帰的文脈モデルを使用することはできない。
我々は,潜在要素のトライト確率を正確に推定するために,文脈に基づくレート低減モジュールを開発した。
第2に、三面体から部分潜時テンソルを精製する文脈に基づく歪み低減モジュールを開発する。
第三に、デコーダがより優れたレート歪みトレードオフを達成するための再訓練方式を提案する。
- 参考スコア(独自算出の注目度): 31.396712329965005
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Trit-plane coding enables deep progressive image compression, but it cannot
use autoregressive context models. In this paper, we propose the context-based
trit-plane coding (CTC) algorithm to achieve progressive compression more
compactly. First, we develop the context-based rate reduction module to
estimate trit probabilities of latent elements accurately and thus encode the
trit-planes compactly. Second, we develop the context-based distortion
reduction module to refine partial latent tensors from the trit-planes and
improve the reconstructed image quality. Third, we propose a retraining scheme
for the decoder to attain better rate-distortion tradeoffs. Extensive
experiments show that CTC outperforms the baseline trit-plane codec
significantly in BD-rate on the Kodak lossless dataset, while increasing the
time complexity only marginally. Our codes are available at
https://github.com/seungminjeon-github/CTC.
- Abstract(参考訳): trit-planeコーディングは、深いプログレッシブな画像圧縮を可能にするが、自己回帰的なコンテキストモデルを使用しない。
本稿では,よりコンパクトにプログレッシブ圧縮を実現するためのコンテキストベーストライトプレーン符号化(ctc)アルゴリズムを提案する。
まず, 潜在要素のトリット確率を正確に推定し, トリット平面をコンパクトに符号化する, コンテキストベースレート低減モジュールを開発した。
第2に,三面体から部分潜在テンソルを精製し,再構成した画像品質を改善するために,文脈に基づく歪み低減モジュールを開発した。
第3に,レートゆがみトレードオフを達成するために,デコーダの再トレーニング方式を提案する。
大規模な実験により、CTCはコダックロスレスデータセット上のBDレートにおいて、ベースライントリトプレーンコーデックを著しく上回るが、時間複雑性はわずかに増大する。
私たちのコードはhttps://github.com/seungminjeon-github/ctcで利用可能です。
関連論文リスト
- CALLIC: Content Adaptive Learning for Lossless Image Compression [64.47244912937204]
CALLICは、学習したロスレス画像圧縮のための新しい最先端(SOTA)を設定する。
本稿では,畳み込みゲーティング操作を利用したコンテンツ認識型自己回帰自己保持機構を提案する。
エンコーディング中、低ランク行列を用いて深度の畳み込みを含む事前学習層を分解し、レート誘導プログレッシブファインタニング(RPFT)による画像検査にインクリメンタルウェイトを適応させる。
推定エントロピーにより下位順にソートされたパッチを徐々に増加させたRPFTファインチューン,学習過程の最適化,適応時間の短縮を実現した。
論文 参考訳(メタデータ) (2024-12-23T10:41:18Z) - L3TC: Leveraging RWKV for Learned Lossless Low-Complexity Text Compression [23.179381396167084]
我々はLearned Lossless Low-complexity Text Compression Method (L3TC)を紹介する。
RWKVモデルは、適度な圧縮比で高速な復号速度を達成する。
本稿では,頻繁なトークンをカバーするために,限定語彙を用いた外部認識トークン化手法を提案する。
論文 参考訳(メタデータ) (2024-12-21T14:24:32Z) - Deep Lossy Plus Residual Coding for Lossless and Near-lossless Image
Compression [85.93207826513192]
本稿では、損失のない画像圧縮とほぼロスレス画像圧縮の両面において、統合された強力な深い損失+残差(DLPR)符号化フレームワークを提案する。
VAEのアプローチにおける連立損失と残留圧縮の問題を解く。
ほぼロスレスモードでは、元の残差を量子化し、与えられた$ell_infty$エラー境界を満たす。
論文 参考訳(メタデータ) (2022-09-11T12:11:56Z) - Cross Modal Compression: Towards Human-comprehensible Semantic
Compression [73.89616626853913]
クロスモーダル圧縮は、視覚データのためのセマンティック圧縮フレームワークである。
提案したCMCは,超高圧縮比で再現性の向上が期待できることを示す。
論文 参考訳(メタデータ) (2022-09-06T15:31:11Z) - Asymmetric Learned Image Compression with Multi-Scale Residual Block,
Importance Map, and Post-Quantization Filtering [15.056672221375104]
ディープラーニングに基づく画像圧縮は、最新のH.266/VVCよりも高いレート歪み(R-D)性能を実現している。
多くの先導的な学習スキームは、パフォーマンスと複雑さの間の良いトレードオフを維持することができません。
そこで本研究では,R-D の性能を技術状況よりも低い複雑さで実現した,効率的かつ効果的な画像符号化フレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-21T09:34:29Z) - RD-Optimized Trit-Plane Coding of Deep Compressed Image Latent Tensors [40.86513649546442]
DPICTは、きめ細かいスケーラビリティをサポートする最初の学習ベースの画像である。
本稿では,トライトプレーンスライシングとRD優先伝送という,DPICTの2つの重要なコンポーネントを効率的に実装する方法について述べる。
論文 参考訳(メタデータ) (2022-03-25T06:33:16Z) - DPICT: Deep Progressive Image Compression Using Trit-Planes [36.34865777731784]
Trit-planes (DPICT) アルゴリズムを用いた深部プログレッシブ画像圧縮
解析ネットワークを用いて,画像を潜時テンソルに変換する。
圧縮ビットストリームトリトプレーンにトリトプレーンでエンコードする。
論文 参考訳(メタデータ) (2021-12-12T22:09:33Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - MuSCLE: Multi Sweep Compression of LiDAR using Deep Entropy Models [78.93424358827528]
本稿では,LiDARセンサデータのストレージストリームを削減するための新しい圧縮アルゴリズムを提案する。
本手法は,従来のLiDAR圧縮法よりも接合形状と強度を著しく低減する。
論文 参考訳(メタデータ) (2020-11-15T17:41:14Z) - Modeling Lost Information in Lossy Image Compression [72.69327382643549]
ロスシー画像圧縮は、デジタル画像の最もよく使われる演算子の1つである。
Invertible Lossy Compression (ILC) と呼ばれる新しい非可逆的フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-22T04:04:56Z) - Deep Learning-based Image Compression with Trellis Coded Quantization [13.728517700074423]
本稿では、深層学習に基づく画像圧縮フレームワークにトレリス符号化量子化器(TCQ)を組み込むことを提案する。
トレーニング中のバック伝搬を可能にするソフト・ツー・ハード戦略が適用される。
我々は,3つのワーク(エンコーダ,デコーダ,エントロピー推定)からなる単純な画像圧縮モデルを開発し,すべてのコンポーネントをエンドツーエンドに最適化する。
論文 参考訳(メタデータ) (2020-01-26T08:00:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。