Fugu-MT 論文翻訳(概要): Context-Based Trit-Plane Coding for Progressive Image Compression

論文の概要: Context-Based Trit-Plane Coding for Progressive Image Compression

arxiv url: http://arxiv.org/abs/2303.05715v2
Date: Mon, 13 Mar 2023 07:09:03 GMT
ステータス: 翻訳完了
システム内更新日: 2023-03-14 11:09:01.827810
Title: Context-Based Trit-Plane Coding for Progressive Image Compression
Title（参考訳）: プログレッシブ画像圧縮のためのコンテキストベーストライトプレーン符号化
Authors: Seungmin Jeon, Kwang Pyo Choi, Youngo Park and Chang-Su Kim
Abstract要約: トリトプレーン符号化は、深いプログレッシブな画像圧縮を可能にするが、自己回帰的文脈モデルを使用することはできない。我々は,潜在要素のトライト確率を正確に推定するために,文脈に基づくレート低減モジュールを開発した。第2に、三面体から部分潜時テンソルを精製する文脈に基づく歪み低減モジュールを開発する。第三に、デコーダがより優れたレート歪みトレードオフを達成するための再訓練方式を提案する。
参考スコア（独自算出の注目度）: 31.396712329965005
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Trit-plane coding enables deep progressive image compression, but it cannot use autoregressive context models. In this paper, we propose the context-based trit-plane coding (CTC) algorithm to achieve progressive compression more compactly. First, we develop the context-based rate reduction module to estimate trit probabilities of latent elements accurately and thus encode the trit-planes compactly. Second, we develop the context-based distortion reduction module to refine partial latent tensors from the trit-planes and improve the reconstructed image quality. Third, we propose a retraining scheme for the decoder to attain better rate-distortion tradeoffs. Extensive experiments show that CTC outperforms the baseline trit-plane codec significantly in BD-rate on the Kodak lossless dataset, while increasing the time complexity only marginally. Our codes are available at https://github.com/seungminjeon-github/CTC.
Abstract（参考訳）: trit-planeコーディングは、深いプログレッシブな画像圧縮を可能にするが、自己回帰的なコンテキストモデルを使用しない。本稿では,よりコンパクトにプログレッシブ圧縮を実現するためのコンテキストベーストライトプレーン符号化(ctc)アルゴリズムを提案する。まず, 潜在要素のトリット確率を正確に推定し, トリット平面をコンパクトに符号化する, コンテキストベースレート低減モジュールを開発した。第2に,三面体から部分潜在テンソルを精製し,再構成した画像品質を改善するために,文脈に基づく歪み低減モジュールを開発した。第3に,レートゆがみトレードオフを達成するために,デコーダの再トレーニング方式を提案する。大規模な実験により、CTCはコダックロスレスデータセット上のBDレートにおいて、ベースライントリトプレーンコーデックを著しく上回るが、時間複雑性はわずかに増大する。私たちのコードはhttps://github.com/seungminjeon-github/ctcで利用可能です。

関連論文リスト

ProGIC: Progressive and Lightweight Generative Image Compression with Residual Vector Quantization [59.481950697968706]
残留ベクトル量子化(RVQ)に基づくコンパクトなプログレッシブ生成画像圧縮(ProGIC)を提案する。 RVQでは、ベクトル量子化器の列がステージごとに残余を符号化し、それぞれが独自のコードブックを持つ。これを奥行き分離可能な畳み込みと小さな注意ブロックに基づく軽量なバックボーンと組み合わせることで、GPUとCPUのみのデバイスに実用的なデプロイを可能にします。
論文参考訳（メタデータ） (2026-03-03T11:47:05Z)
FLaTEC: Frequency-Disentangled Latent Triplanes for Efficient Compression of LiDAR Point Clouds [52.997038111673966]
FLaTECは、圧縮率の高いフルスキャンの圧縮を可能にする周波数対応圧縮モデルである。ボキセル化埋め込みを三面体表現に変換することで、空間性、計算コスト、ストレージ要件を低減する。提案手法は,最先端の速度歪み性能を実現し,標準コーデックのBDレートを78%,94%向上させる。
論文参考訳（メタデータ） (2025-11-25T08:37:49Z)
CALLIC: Content Adaptive Learning for Lossless Image Compression [64.47244912937204]
CALLICは、学習したロスレス画像圧縮のための新しい最先端(SOTA)を設定する。本稿では,畳み込みゲーティング操作を利用したコンテンツ認識型自己回帰自己保持機構を提案する。エンコーディング中、低ランク行列を用いて深度の畳み込みを含む事前学習層を分解し、レート誘導プログレッシブファインタニング(RPFT)による画像検査にインクリメンタルウェイトを適応させる。推定エントロピーにより下位順にソートされたパッチを徐々に増加させたRPFTファインチューン,学習過程の最適化,適応時間の短縮を実現した。
論文参考訳（メタデータ） (2024-12-23T10:41:18Z)
L3TC: Leveraging RWKV for Learned Lossless Low-Complexity Text Compression [23.179381396167084]
我々はLearned Lossless Low-complexity Text Compression Method (L3TC)を紹介する。 RWKVモデルは、適度な圧縮比で高速な復号速度を達成する。本稿では,頻繁なトークンをカバーするために,限定語彙を用いた外部認識トークン化手法を提案する。
論文参考訳（メタデータ） (2024-12-21T14:24:32Z)
Deep Lossy Plus Residual Coding for Lossless and Near-lossless Image Compression [85.93207826513192]
本稿では、損失のない画像圧縮とほぼロスレス画像圧縮の両面において、統合された強力な深い損失+残差(DLPR)符号化フレームワークを提案する。 VAEのアプローチにおける連立損失と残留圧縮の問題を解く。ほぼロスレスモードでは、元の残差を量子化し、与えられた$ell_infty$エラー境界を満たす。
論文参考訳（メタデータ） (2022-09-11T12:11:56Z)
Cross Modal Compression: Towards Human-comprehensible Semantic Compression [73.89616626853913]
クロスモーダル圧縮は、視覚データのためのセマンティック圧縮フレームワークである。提案したCMCは,超高圧縮比で再現性の向上が期待できることを示す。
論文参考訳（メタデータ） (2022-09-06T15:31:11Z)
Asymmetric Learned Image Compression with Multi-Scale Residual Block, Importance Map, and Post-Quantization Filtering [15.056672221375104]
ディープラーニングに基づく画像圧縮は、最新のH.266/VVCよりも高いレート歪み(R-D)性能を実現している。多くの先導的な学習スキームは、パフォーマンスと複雑さの間の良いトレードオフを維持することができません。そこで本研究では,R-D の性能を技術状況よりも低い複雑さで実現した,効率的かつ効果的な画像符号化フレームワークを提案する。
論文参考訳（メタデータ） (2022-06-21T09:34:29Z)
RD-Optimized Trit-Plane Coding of Deep Compressed Image Latent Tensors [40.86513649546442]
DPICTは、きめ細かいスケーラビリティをサポートする最初の学習ベースの画像である。本稿では,トライトプレーンスライシングとRD優先伝送という,DPICTの2つの重要なコンポーネントを効率的に実装する方法について述べる。
論文参考訳（メタデータ） (2022-03-25T06:33:16Z)
DPICT: Deep Progressive Image Compression Using Trit-Planes [36.34865777731784]
Trit-planes (DPICT) アルゴリズムを用いた深部プログレッシブ画像圧縮解析ネットワークを用いて,画像を潜時テンソルに変換する。圧縮ビットストリームトリトプレーンにトリトプレーンでエンコードする。
論文参考訳（メタデータ） (2021-12-12T22:09:33Z)
Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文参考訳（メタデータ） (2021-12-08T13:02:53Z)
Checkerboard Context Model for Efficient Learned Image Compression [6.376339829493938]
学習された画像圧縮のために、オートレグレッシブコンテキストモデルは、レート歪み(RD)のパフォーマンスを改善するのに効果的である。本稿では,並列化可能なチェッカーボードコンテキストモデル(CCM)を提案する。実験では,復号処理を40回以上高速化し,ほぼ同じ速度歪み性能で計算効率を大幅に向上させた。
論文参考訳（メタデータ） (2021-03-29T03:25:41Z)
MuSCLE: Multi Sweep Compression of LiDAR using Deep Entropy Models [78.93424358827528]
本稿では,LiDARセンサデータのストレージストリームを削減するための新しい圧縮アルゴリズムを提案する。本手法は,従来のLiDAR圧縮法よりも接合形状と強度を著しく低減する。
論文参考訳（メタデータ） (2020-11-15T17:41:14Z)
Modeling Lost Information in Lossy Image Compression [72.69327382643549]
ロスシー画像圧縮は、デジタル画像の最もよく使われる演算子の1つである。 Invertible Lossy Compression (ILC) と呼ばれる新しい非可逆的フレームワークを提案する。
論文参考訳（メタデータ） (2020-06-22T04:04:56Z)
OctSqueeze: Octree-Structured Entropy Model for LiDAR Compression [77.8842824702423]
本稿では,LiDAR点雲のメモリフットプリントを削減するための新しいディープ圧縮アルゴリズムを提案する。本手法は,メモリフットプリントを低減するために,点間の間隔と構造的冗長性を利用する。我々のアルゴリズムは、自動運転車などのアプリケーションにおいて、LiDARポイントのオンボードおよびオフボードストレージを減らすために使用できる。
論文参考訳（メタデータ） (2020-05-14T17:48:49Z)
Deep Learning-based Image Compression with Trellis Coded Quantization [13.728517700074423]
本稿では、深層学習に基づく画像圧縮フレームワークにトレリス符号化量子化器(TCQ)を組み込むことを提案する。トレーニング中のバック伝搬を可能にするソフト・ツー・ハード戦略が適用される。我々は,3つのワーク(エンコーダ,デコーダ,エントロピー推定)からなる単純な画像圧縮モデルを開発し,すべてのコンポーネントをエンドツーエンドに最適化する。
論文参考訳（メタデータ） (2020-01-26T08:00:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。