論文の概要: CompressNet: Generative Compression at Extremely Low Bitrates
- arxiv url: http://arxiv.org/abs/2006.08003v1
- Date: Sun, 14 Jun 2020 20:03:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-21 12:57:16.285444
- Title: CompressNet: Generative Compression at Extremely Low Bitrates
- Title(参考訳): CompressNet: 極低ビットレートでの生成圧縮
- Authors: Suraj Kiran Raman (1), Aditya Ramesh (1), Vijayakrishna Naganoor (1),
Shubham Dash (1), Giridharan Kumaravelu (1), Honglak Lee (1) ((1) University
of Michigan, Ann Arbor)
- Abstract要約: スイッチ予測ネットワーク(SAESPN)によるスタックドオートエンコーダを拡張したCompressNetと呼ばれる新しいネットワークを提案する。
これにより、これらの低解像度(0.1bpp)で視覚的に喜ぶイメージの再構築に役立ちます。
特に0.07の時点で、CompressNetは深層学習SOTA法に比べて知覚障害が22%低く、Frechet Inception Distance(FID)が55%低い。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Compressing images at extremely low bitrates (< 0.1 bpp) has always been a
challenging task since the quality of reconstruction significantly reduces due
to the strong imposed constraint on the number of bits allocated for the
compressed data. With the increasing need to transfer large amounts of images
with limited bandwidth, compressing images to very low sizes is a crucial task.
However, the existing methods are not effective at extremely low bitrates. To
address this need, we propose a novel network called CompressNet which augments
a Stacked Autoencoder with a Switch Prediction Network (SAE-SPN). This helps in
the reconstruction of visually pleasing images at these low bitrates (< 0.1
bpp). We benchmark the performance of our proposed method on the Cityscapes
dataset, evaluating over different metrics at extremely low bitrates to show
that our method outperforms the other state-of-the-art. In particular, at a
bitrate of 0.07, CompressNet achieves 22% lower Perceptual Loss and 55% lower
Frechet Inception Distance (FID) compared to the deep learning SOTA methods.
- Abstract(参考訳): 圧縮されたデータに割り当てられたビット数に強い制約が課されるため、再構成の品質が著しく低下するため、非常に低いビットレート(< 0.1bpp)の圧縮画像は、常に難しい課題である。
少ない帯域幅で大量の画像を転送する必要性が高まる中、画像を非常に低いサイズに圧縮することが重要な課題である。
しかし、既存の手法は極低ビットレートでは有効ではない。
そこで本研究では,スイッチ予測ネットワーク(SAE-SPN)によるスタックドオートエンコーダを拡張したCompressNetというネットワークを提案する。
これにより、これらの低ビットレート (< 0.1 bpp) での視覚的に心地よい画像の再構成に役立つ。
提案手法の性能をCityscapesデータセットにベンチマークし,極低ビットレートで異なる測定値について評価し,提案手法が他の最先端技術よりも優れていることを示す。
特に、ビットレート0.07では、deep learning sota法と比較して22%の知覚損失と55%のfrechetインセプション距離(fid)を達成している。
関連論文リスト
- Learning Lossless Compression for High Bit-Depth Volumetric Medical Image [61.740026014860256]
本稿では,高ビット深度医用ボリューム圧縮に適したBit-DivisionベースのLosless Volumetric Image Compressionフレームワークを提案する。
BD-LVICフレームワークは、高ビット深度を2つの下位ビット深度セグメント(MSBV)とLast Significant Bit-Volume(LSBV)に巧みに分割する。
論文 参考訳(メタデータ) (2024-10-23T12:18:36Z) - MISC: Ultra-low Bitrate Image Semantic Compression Driven by Large Multimodal Model [78.4051835615796]
本稿では,マルチモーダル画像セマンティック圧縮法を提案する。
画像の意味情報を抽出するLMMエンコーダと、その意味に対応する領域を特定するマップエンコーダと、非常に圧縮されたビットストリームを生成する画像エンコーダと、前記情報に基づいて画像を再構成するデコーダとからなる。
知覚50%を節約しながら最適な一貫性と知覚結果を達成することができ、これは次世代のストレージと通信において強力な可能性を持つ。
論文 参考訳(メタデータ) (2024-02-26T17:11:11Z) - Towards image compression with perfect realism at ultra-low bitrates [28.511327714128413]
当社のモデルPerCoを"知覚圧縮"としてダブし、最先端コーデックを0.1から0.003ビット/ピクセルのレートで比較します。
FID と KID によって測定された現状の視覚的品質によって,本モデルが再構築に繋がることがわかった。
論文 参考訳(メタデータ) (2023-10-16T12:08:35Z) - Extreme Image Compression using Fine-tuned VQGANs [43.43014096929809]
本稿ではベクトル量子化(VQ)に基づく生成モデルを画像圧縮領域に導入する。
VQGANモデルによって学習されたコードブックは、強い表現能力をもたらす。
提案したフレームワークは、知覚的品質指向のメトリクスで最先端のコーデックより優れている。
論文 参考訳(メタデータ) (2023-07-17T06:14:19Z) - You Can Mask More For Extremely Low-Bitrate Image Compression [80.7692466922499]
近年,学習画像圧縮(lic)法は大きな進歩を遂げている。
licメソッドは、画像圧縮に不可欠な画像構造とテクスチャコンポーネントを明示的に探索することができない。
原画像の構造とテクスチャに基づいて可視パッチをサンプリングするDA-Maskを提案する。
極めて低ビットレート圧縮のために, lic と lic のエンドツーエンドを統一する最初のフレームワークである, 単純で効果的なマスク付き圧縮モデル (MCM) を提案する。
論文 参考訳(メタデータ) (2023-06-27T15:36:22Z) - Convolutional Neural Network (CNN) to reduce construction loss in JPEG
compression caused by Discrete Fourier Transform (DFT) [0.0]
畳み込みニューラルネットワーク(CNN)は他の多くのディープニューラルネットワークよりも注目されている。
本研究では,オートエンコーダを用いた効率的な画像圧縮手法を提案する。
論文 参考訳(メタデータ) (2022-08-26T12:46:16Z) - Crowd Counting on Heavily Compressed Images with Curriculum Pre-Training [90.76576712433595]
ディープニューラルネットワークによって処理された画像に損失圧縮を適用することで、大幅な精度低下につながる可能性がある。
カリキュラム学習のパラダイムに着想を得て,圧縮画像の群集カウントのためのカリキュラム事前学習(CPT)と呼ばれる新しいトレーニング手法を提案する。
論文 参考訳(メタデータ) (2022-08-15T08:43:21Z) - Analysis of the Effect of Low-Overhead Lossy Image Compression on the
Performance of Visual Crowd Counting for Smart City Applications [78.55896581882595]
画像圧縮技術は画像の品質を低下させ、精度を低下させる。
本稿では,低オーバヘッド損失画像圧縮法の適用が視覚的群集カウントの精度に与える影響を解析する。
論文 参考訳(メタデータ) (2022-07-20T19:20:03Z) - Analyzing and Mitigating JPEG Compression Defects in Deep Learning [69.04777875711646]
本稿では,JPEG圧縮が共通タスクやデータセットに与える影響を統一的に検討する。
高圧縮の一般的なパフォーマンス指標には大きなペナルティがあることが示される。
論文 参考訳(メタデータ) (2020-11-17T20:32:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。