論文の概要: Pruned Lightweight Encoders for Computer Vision
- arxiv url: http://arxiv.org/abs/2211.13137v1
- Date: Wed, 23 Nov 2022 17:11:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-24 15:31:56.350381
- Title: Pruned Lightweight Encoders for Computer Vision
- Title(参考訳): コンピュータビジョンのためのプルーニング軽量エンコーダ
- Authors: Jakub \v{Z}\'adn\'ik, Markku M\"akitalo, Pekka J\"a\"askel\"ainen
- Abstract要約: ASTC と JPEG XS の符号化構成は、低レイテンシを確保するために、近接センサエッジデバイスで使用できることを示す。
ASTC圧縮によるmIoU(mIoU)劣化の分類精度とセグメンテーション平均値は,それぞれ4.9-5.0ポイント(pp)と4.4-4.0ppに低下した。
符号化速度の面では、ASTCエンコーダの実装はJPEGよりも2.3倍高速である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Latency-critical computer vision systems, such as autonomous driving or drone
control, require fast image or video compression when offloading neural network
inference to a remote computer. To ensure low latency on a near-sensor edge
device, we propose the use of lightweight encoders with constant bitrate and
pruned encoding configurations, namely, ASTC and JPEG XS. Pruning introduces
significant distortion which we show can be recovered by retraining the neural
network with compressed data after decompression. Such an approach does not
modify the network architecture or require coding format modifications. By
retraining with compressed datasets, we reduced the classification accuracy and
segmentation mean intersection over union (mIoU) degradation due to ASTC
compression to 4.9-5.0 percentage points (pp) and 4.4-4.0 pp, respectively.
With the same method, the mIoU lost due to JPEG XS compression at the main
profile was restored to 2.7-2.3 pp. In terms of encoding speed, our ASTC
encoder implementation is 2.3x faster than JPEG. Even though the JPEG XS
reference encoder requires optimizations to reach low latency, we showed that
disabling significance flag coding saves 22-23% of encoding time at the cost of
0.4-0.3 mIoU after retraining.
- Abstract(参考訳): 自律運転やドローン制御などの遅延クリティカルなコンピュータビジョンシステムは、ニューラルネットワーク推論をリモートコンピュータにオフロードする場合、高速画像やビデオ圧縮を必要とする。
近接センサエッジデバイスにおいて低レイテンシを確保するため,ビットレートとプルーニングされた符号化構成,すなわちASTCとJPEG XSを用いた軽量エンコーダを提案する。
Pruningは、圧縮後の圧縮データでニューラルネットワークを再トレーニングすることで、回復できる重要な歪みをもたらす。
このようなアプローチは、ネットワークアーキテクチャを変更したり、コーディングフォーマットを変更したりしない。
圧縮データセットをリトレーニングすることにより,astc圧縮による分類精度と分節平均交点を,それぞれ4.9-5.0点 (pp) と4.4-4.0pp に削減した。
同じ方法で、JPEG XS圧縮で失われたmIoUは2.7-2.3 ppに復元された。
符号化速度に関しては、ASTCエンコーダの実装はJPEGよりも2.3倍高速です。
JPEG XS参照エンコーダは低レイテンシを実現するために最適化を必要とするが、無効な重要フラグ符号化では、再トレーニング後の0.4~0.3 mIoUのコストで符号化時間を22~23%節約できることを示した。
関連論文リスト
- JDEC: JPEG Decoding via Enhanced Continuous Cosine Coefficients [17.437568540883106]
本稿では,コサインの連続的定式化による局所的暗黙的ニューラル表現を用いたJPEG画像デコーディングの実践的手法を提案する。
提案するネットワークは,フレキシブルカラー画像JPEGアーティファクト削除タスクにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2024-04-03T03:28:04Z) - Deep Lossy Plus Residual Coding for Lossless and Near-lossless Image
Compression [85.93207826513192]
本稿では、損失のない画像圧縮とほぼロスレス画像圧縮の両面において、統合された強力な深い損失+残差(DLPR)符号化フレームワークを提案する。
VAEのアプローチにおける連立損失と残留圧縮の問題を解く。
ほぼロスレスモードでは、元の残差を量子化し、与えられた$ell_infty$エラー境界を満たす。
論文 参考訳(メタデータ) (2022-09-11T12:11:56Z) - Reducing Redundancy in the Bottleneck Representation of the Autoencoders [98.78384185493624]
オートエンコーダは教師なしニューラルネットワークの一種であり、様々なタスクを解くのに使用できる。
本稿では,ボトルネック表現における特徴冗長性を明示的に罰する手法を提案する。
我々は,3つの異なるデータセットを用いた次元削減,MNISTデータセットを用いた画像圧縮,ファッションMNISTを用いた画像デノナイズという,さまざまなタスクにまたがってアプローチを検証した。
論文 参考訳(メタデータ) (2022-02-09T18:48:02Z) - Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG
Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。
実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文 参考訳(メタデータ) (2022-01-27T20:20:03Z) - Deep Video Coding with Dual-Path Generative Adversarial Network [39.19042551896408]
本稿では,DGVC(Double-path Generative Adversarial Network-based Video)という,効率的なコーデックを提案する。
我々のDGVCは、PSNR/MS-SSIMで平均ビット/ピクセル(bpp)を39.39%/54.92%削減する。
論文 参考訳(メタデータ) (2021-11-29T11:39:28Z) - Image Compression with Encoder-Decoder Matched Semantic Segmentation [15.536056887418676]
レイヤー画像圧縮は有望な方向です。
セマンティックセグメントを圧縮された画像データと共に送信する作業もある。
エンコーダマッチングセマンティックセグメンテーション(EDMS)を用いた新しいレイヤー画像圧縮フレームワークを提案する。
提案されたEDMSフレームワークは、HEVCベース(BPG)エンコーディング時間よりも最大35.31%のBDレート削減を達成できる。
論文 参考訳(メタデータ) (2021-01-24T04:11:05Z) - Learning to Improve Image Compression without Changing the Standard
Decoder [100.32492297717056]
本稿では,標準デコーダによる符号化性能向上のための学習法を提案する。
具体的には、DCT係数の分布を最適化する周波数領域事前編集法を提案する。
JPEGデコーダは変更しないので、広く使われている標準JPEGデコーダで画像を見る際には、我々のアプローチが適用可能である。
論文 参考訳(メタデータ) (2020-09-27T19:24:42Z) - Content Adaptive and Error Propagation Aware Deep Video Compression [110.31693187153084]
本稿では,コンテンツ適応型・誤り伝搬対応型ビデオ圧縮システムを提案する。
本手法では, 複数フレームの圧縮性能を1フレームではなく複数フレームで考慮し, 共同学習手法を用いる。
従来の圧縮システムでは手作りのコーディングモードを使用する代わりに,オンラインエンコーダ更新方式をシステム内に設計する。
論文 参考訳(メタデータ) (2020-03-25T09:04:24Z) - Learning Better Lossless Compression Using Lossy Compression [100.50156325096611]
我々は、ロスレス画像圧縮システムを構築するために、強力なロスレス画像圧縮アルゴリズムであるBPGを利用する。
我々は,BPG再構成を条件とした畳み込みニューラルネットワークに基づく確率モデルを用いて,残差分布をモデル化する。
そして、この画像は、BPGが生成したビットストリームと学習した残留コーダの連結を用いて保存される。
論文 参考訳(メタデータ) (2020-03-23T11:21:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。