論文の概要: Machine Perception-Driven Image Compression: A Layered Generative
Approach
- arxiv url: http://arxiv.org/abs/2304.06896v1
- Date: Fri, 14 Apr 2023 02:12:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-17 14:51:11.075546
- Title: Machine Perception-Driven Image Compression: A Layered Generative
Approach
- Title(参考訳): 機械知覚による画像圧縮:階層型生成アプローチ
- Authors: Yuefeng Zhang, Chuanmin Jia, Jiannhui Chang, Siwei Ma
- Abstract要約: 階層型生成画像圧縮モデルを提案する。
タスクに依存しない学習に基づく圧縮モデルを提案し、様々な圧縮されたドメインベースの分析タスクを効果的にサポートする。
圧縮比、再構成画像品質、下流知覚性能の最良のバランス点を得るために、共同最適化スケジュールを採用する。
- 参考スコア(独自算出の注目度): 32.23554195427311
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In this age of information, images are a critical medium for storing and
transmitting information. With the rapid growth of image data amount, visual
compression and visual data perception are two important research topics
attracting a lot attention. However, those two topics are rarely discussed
together and follow separate research path. Due to the compact compressed
domain representation offered by learning-based image compression methods,
there exists possibility to have one stream targeting both efficient data
storage and compression, and machine perception tasks. In this paper, we
propose a layered generative image compression model achieving high human
vision-oriented image reconstructed quality, even at extreme compression
ratios. To obtain analysis efficiency and flexibility, a task-agnostic
learning-based compression model is proposed, which effectively supports
various compressed domain-based analytical tasks while reserves outstanding
reconstructed perceptual quality, compared with traditional and learning-based
codecs. In addition, joint optimization schedule is adopted to acquire best
balance point among compression ratio, reconstructed image quality, and
downstream perception performance. Experimental results verify that our
proposed compressed domain-based multi-task analysis method can achieve
comparable analysis results against the RGB image-based methods with up to
99.6% bit rate saving (i.e., compared with taking original RGB image as the
analysis model input). The practical ability of our model is further justified
from model size and information fidelity aspects.
- Abstract(参考訳): この情報の時代において、画像は情報の保存と送信に重要な媒体である。
画像データ量の増加に伴い、ビジュアル圧縮とビジュアルデータ知覚は、多くの注目を集める2つの重要な研究トピックである。
しかし、これら2つの話題は共に議論されることはめったになく、別々の研究経路を辿る。
学習に基づく画像圧縮手法によって提供されるコンパクトな圧縮領域表現のため、効率的なデータストレージと圧縮の両方をターゲットとした1つのストリームと、マシン認識タスクが存在する可能性がある。
本稿では,高度圧縮比でも高い人間の視覚指向画像再構成品質を達成する階層化画像圧縮モデルを提案する。
従来型や学習型コーデックと比較して,高度に再構成された知覚品質を保ちながら,様々な圧縮されたドメインベースの分析タスクを効果的にサポートするタスク非依存の学習ベース圧縮モデルを提案する。
さらに、圧縮比、再構成画像品質、下流知覚性能の最良のバランス点を得るために、共同最適化スケジュールを採用する。
実験結果から,提案手法は,最大99.6%のビットセーブ(元rgb画像を解析モデル入力として使用する場合と比較して)で,rgb画像ベース手法と同等の分析結果が得られることを確認した。
モデルの実用性は,モデルサイズと情報忠実性の観点からさらに正当化される。
関連論文リスト
- Implicit Neural Image Field for Biological Microscopy Image Compression [37.0218688308699]
Inlicit Neural Representation (INR) に基づく適応圧縮ワークフローを提案する。
このアプローチは、任意の形状の画像を圧縮し、任意のピクセル単位の圧縮が可能な、アプリケーション固有の圧縮目的を許容する。
我々は,我々のワークフローが高精細圧縮比を達成しただけでなく,下流解析に不可欠な詳細な情報も保存できることを,広範囲にわたる顕微鏡画像で実証した。
論文 参考訳(メタデータ) (2024-05-29T11:51:33Z) - A Rate-Distortion-Classification Approach for Lossy Image Compression [0.0]
損失画像圧縮では、画像を特定のビットレートに圧縮しながら、最小限の信号歪みを実現する。
画像圧縮と視覚解析のギャップを埋めるために、損失画像圧縮のためのRDCモデルを提案する。
論文 参考訳(メタデータ) (2024-05-06T14:11:36Z) - Transferable Learned Image Compression-Resistant Adversarial Perturbations [66.46470251521947]
敵対的攻撃は容易に画像分類システムを破壊し、DNNベースの認識タスクの脆弱性を明らかにする。
我々は、学習した画像圧縮機を前処理モジュールとして利用する画像分類モデルをターゲットにした新しいパイプラインを提案する。
論文 参考訳(メタデータ) (2024-01-06T03:03:28Z) - Beyond Learned Metadata-based Raw Image Reconstruction [86.1667769209103]
生画像は、線形性や微細な量子化レベルなど、sRGB画像に対して明確な利点がある。
ストレージの要求が大きいため、一般ユーザからは広く採用されていない。
本稿では,メタデータとして,潜在空間におけるコンパクトな表現を学習する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-21T06:59:07Z) - Estimating the Resize Parameter in End-to-end Learned Image Compression [50.20567320015102]
本稿では,最近の画像圧縮モデルの速度歪みトレードオフをさらに改善する検索自由化フレームワークについて述べる。
提案手法により,Bjontegaard-Deltaレート(BD-rate)を最大10%向上させることができる。
論文 参考訳(メタデータ) (2022-04-26T01:35:02Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - Learned Image Compression for Machine Perception [17.40776913809306]
人間の知覚と機械知覚の両方に適した圧縮フォーマットを生成するフレームワークを開発する。
コアビジョンタスクの圧縮と性能を同時に最適化する表現が学習可能であることを示す。
論文 参考訳(メタデータ) (2021-11-03T14:39:09Z) - Discernible Image Compression [124.08063151879173]
本稿では、外観と知覚の整合性の両方を追求し、圧縮画像を作成することを目的とする。
エンコーダ・デコーダ・フレームワークに基づいて,事前学習したCNNを用いて,オリジナル画像と圧縮画像の特徴を抽出する。
ベンチマーク実験により,提案手法を用いて圧縮した画像は,その後の視覚認識・検出モデルでもよく認識できることが示された。
論文 参考訳(メタデータ) (2020-02-17T07:35:08Z) - Learning End-to-End Lossy Image Compression: A Benchmark [90.35363142246806]
まず,学習した画像の圧縮方法に関する総合的な文献調査を行う。
本稿では,最先端の学習画像圧縮手法のマイルストーンについて述べるとともに,既存の幅広い作品について概観し,その歴史的開発ルートについて考察する。
エントロピー推定と信号再構成のための粗大な超高次モデルを導入することにより、速度歪み性能の向上を実現する。
論文 参考訳(メタデータ) (2020-02-10T13:13:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。