論文の概要: A 1Mb mixed-precision quantized encoder for image classification and patch-based compression
- arxiv url: http://arxiv.org/abs/2501.05097v1
- Date: Thu, 09 Jan 2025 09:25:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-10 14:00:02.897339
- Title: A 1Mb mixed-precision quantized encoder for image classification and patch-based compression
- Title(参考訳): 画像分類とパッチベース圧縮のための1Mb混合精度量子化エンコーダ
- Authors: Van Thien Nguyen, William Guicquero, Gilles Sicard,
- Abstract要約: ASICニューラルネットワークアクセラレータは、異なるレベルの複数のタスクに適用可能であることを示す。
鍵となるコンポーネントは、適切な重み付けとアクティベーション量子化を利用する再構成可能、混合精度(3b/2b/1b)エンコーダである。
また,この量子化エンコーダを用いて画像パッチ・バイ・パッチを圧縮し,再構成を遠隔で行うことができることを示す。
- 参考スコア(独自算出の注目度): 2.7036595757881323
- License:
- Abstract: Even if Application-Specific Integrated Circuits (ASIC) have proven to be a relevant choice for integrating inference at the edge, they are often limited in terms of applicability. In this paper, we demonstrate that an ASIC neural network accelerator dedicated to image processing can be applied to multiple tasks of different levels: image classification and compression, while requiring a very limited hardware. The key component is a reconfigurable, mixed-precision (3b/2b/1b) encoder that takes advantage of proper weight and activation quantizations combined with convolutional layer structural pruning to lower hardware-related constraints (memory and computing). We introduce an automatic adaptation of linear symmetric quantizer scaling factors to perform quantized levels equalization, aiming at stabilizing quinary and ternary weights training. In addition, a proposed layer-shared Bit-Shift Normalization significantly simplifies the implementation of the hardware-expensive Batch Normalization. For a specific configuration in which the encoder design only requires 1Mb, the classification accuracy reaches 87.5% on CIFAR-10. Besides, we also show that this quantized encoder can be used to compress image patch-by-patch while the reconstruction can performed remotely, by a dedicated full-frame decoder. This solution typically enables an end-to-end compression almost without any block artifacts, outperforming patch-based state-of-the-art techniques employing a patch-constant bitrate.
- Abstract(参考訳): Application-Specific Integrated Circuits (ASIC) がエッジでの推論の統合に関連性があることが証明されたとしても、適用性という点では制限されることが多い。
本稿では,画像処理に特化したASICニューラルネットワークアクセラレータが,画像分類と圧縮という,さまざまなレベルのタスクに適用可能であることを実証する。
鍵となるコンポーネントは再構成可能で混合精度(3b/2b/1b)エンコーダで、適切な重みとアクティベーションの量子化と、畳み込み層構造プルーニングと組み合わせてハードウェア関連の制約(メモリとコンピューティング)を低くする。
本稿では,線形対称量子化器スケーリング因子の自動適応を導入し,量子化レベル等化を行い,第3次および第3次重みトレーニングの安定化を目指す。
さらに、層共有ビットシフト正規化の提案により、ハードウェア拡張バッチ正規化の実装が大幅に簡略化される。
エンコーダの設計が1Mbしか必要としない特定の構成の場合、分類精度はCIFAR-10で87.5%に達する。
また,この量子化エンコーダを用いて画像パッチ・バイ・パッチを圧縮し,再構成を遠隔で行うことができることを示す。
このソリューションは通常、ブロックアーティファクトをほとんど使わずにエンドツーエンドの圧縮を可能にし、パッチコンスタントビットレートを使用したパッチベースの最先端技術より優れている。
関連論文リスト
- PALQA: A Novel Parameterized Position-Aware Lossy Quantum Autoencoder using LSB Control Qubit for Efficient Image Compression [7.340017786387768]
本研究では、画像圧縮に最小のビット制御量子ビットを利用するPALQA(Parized position-aware Losy quantum autoencoder)回路を導入する。
PALQA回路は、必要なゲート数とPSNRメトリクスの点で優れた性能を示す。
論文 参考訳(メタデータ) (2025-02-04T10:08:02Z) - Accelerating Error Correction Code Transformers [56.75773430667148]
本稿では,トランスを用いたデコーダの高速化手法を提案する。
最新のハードウェアでは、90%の圧縮比を実現し、算術演算エネルギー消費を少なくとも224倍削減する。
論文 参考訳(メタデータ) (2024-10-08T11:07:55Z) - DeepHQ: Learned Hierarchical Quantizer for Progressive Deep Image Coding [27.875207681547074]
プログレッシブ画像符号化(PIC)は、画像の様々な品質を単一のビットストリームに圧縮することを目的としている。
ニューラルネットワーク(NN)に基づくPICの研究は、その初期段階にある。
本稿では,まず,学習した量子化ステップサイズを各量子化レイヤの学習により活用するNNベースのプログレッシブコーディング手法を提案する。
論文 参考訳(メタデータ) (2024-08-22T06:32:53Z) - Rate-Distortion-Cognition Controllable Versatile Neural Image Compression [47.72668401825835]
速度歪み認識制御可能な多目的画像圧縮法を提案する。
本手法は, 良好なICM性能とフレキシブルレート・ディストーション・コグニテーション制御を実現する。
論文 参考訳(メタデータ) (2024-07-16T13:17:51Z) - AdaBM: On-the-Fly Adaptive Bit Mapping for Image Super-Resolution [53.23803932357899]
我々は、処理時間を数時間から秒に短縮する最初のオンザフライ適応量子化フレームワークを導入する。
我々は,従来の適応量子化法と競合する性能を実現し,処理時間をx2000で高速化する。
論文 参考訳(メタデータ) (2024-04-04T08:37:27Z) - Wavelet Feature Maps Compression for Image-to-Image CNNs [3.1542695050861544]
本稿では,高分解能なアクティベーションマップ圧縮をポイントワイド畳み込みと統合した新しい手法を提案する。
比較的小さく、より優雅な性能劣化を伴う1-4ビットのアクティベーション量子化に匹敵する圧縮率を達成する。
論文 参考訳(メタデータ) (2022-05-24T20:29:19Z) - Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG
Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。
実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文 参考訳(メタデータ) (2022-01-27T20:20:03Z) - CBANet: Towards Complexity and Bitrate Adaptive Deep Image Compression
using a Single Network [24.418215098116335]
CBANet(Complexity and Bitrate Adaptive Network)と呼ばれる新しいディープ画像圧縮フレームワークを提案する。
我々のCBANetは、動的計算複雑性制約の下での速度と歪みのトレードオフを考察している。
その結果、CBANetでは、計算複雑性の制約によって1つのシングルが複数のデコードをサポートできるようになった。
論文 参考訳(メタデータ) (2021-05-26T08:13:56Z) - Modeling Lost Information in Lossy Image Compression [72.69327382643549]
ロスシー画像圧縮は、デジタル画像の最もよく使われる演算子の1つである。
Invertible Lossy Compression (ILC) と呼ばれる新しい非可逆的フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-22T04:04:56Z) - Quantization Guided JPEG Artifact Correction [69.04777875711646]
我々はJPEGファイル量子化行列を用いたアーティファクト修正のための新しいアーキテクチャを開発した。
これにより、特定の品質設定のためにトレーニングされたモデルに対して、単一のモデルで最先端のパフォーマンスを達成できます。
論文 参考訳(メタデータ) (2020-04-17T00:10:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。