論文の概要: Universal Deep Image Compression via Content-Adaptive Optimization with
Adapters
- arxiv url: http://arxiv.org/abs/2211.00918v1
- Date: Wed, 2 Nov 2022 07:01:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-03 14:14:52.721577
- Title: Universal Deep Image Compression via Content-Adaptive Optimization with
Adapters
- Title(参考訳): 適応型コンテンツ適応最適化によるユニバーサル深部画像圧縮
- Authors: Koki Tsubota, Hiroaki Akutsu, Kiyoharu Aizawa
- Abstract要約: ディープイメージ圧縮は、自然画像上のJPEGのような従来のコーデックよりも優れている。
深部画像圧縮は学習ベースであり、領域外画像に対して圧縮性能が著しく低下する問題に直面する。
本研究の目的は,自然画像や線画,漫画などの任意の領域に属する画像を圧縮することである。
- 参考スコア(独自算出の注目度): 43.291753358414255
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep image compression performs better than conventional codecs, such as
JPEG, on natural images. However, deep image compression is learning-based and
encounters a problem: the compression performance deteriorates significantly
for out-of-domain images. In this study, we highlight this problem and address
a novel task: universal deep image compression. This task aims to compress
images belonging to arbitrary domains, such as natural images, line drawings,
and comics. To address this problem, we propose a content-adaptive optimization
framework; this framework uses a pre-trained compression model and adapts the
model to a target image during compression. Adapters are inserted into the
decoder of the model. For each input image, our framework optimizes the latent
representation extracted by the encoder and the adapter parameters in terms of
rate-distortion. The adapter parameters are additionally transmitted per image.
For the experiments, a benchmark dataset containing uncompressed images of four
domains (natural images, line drawings, comics, and vector arts) is constructed
and the proposed universal deep compression is evaluated. Finally, the proposed
model is compared with non-adaptive and existing adaptive compression models.
The comparison reveals that the proposed model outperforms these. The code and
dataset are publicly available at https://github.com/kktsubota/universal-dic.
- Abstract(参考訳): ディープイメージ圧縮は、自然画像上のJPEGのような従来のコーデックよりも優れている。
しかし、深部画像圧縮は学習ベースであり、ドメイン外の画像では圧縮性能が著しく低下する。
本研究では,この問題を強調し,新しい課題であるユニバーサル深部画像圧縮に対処する。
本課題は,自然画像や線画,漫画などの任意の領域に属する画像を圧縮することを目的とする。
この問題に対処するために,本フレームワークは事前学習された圧縮モデルを使用し,圧縮中に対象画像に適応するコンテント適応最適化フレームワークを提案する。
アダプタはモデルのデコーダに挿入される。
入力画像毎に,エンコーダとアダプタパラメータによって抽出された潜在表現を,レート歪みの観点から最適化する。
アダプタパラメータはイメージ毎に追加送信されます。
実験では,4領域(自然画像,線画,漫画,ベクターアーツ)の非圧縮画像を含むベンチマークデータセットを構築し,提案する普遍的深部圧縮を評価する。
最後に,提案モデルと非適応・既存適応圧縮モデルを比較した。
比較の結果,提案モデルがこれらのモデルを上回ることが明らかとなった。
コードとデータセットはhttps://github.com/kktsubota/universal-dicで公開されている。
関連論文リスト
- Map-Assisted Remote-Sensing Image Compression at Extremely Low Bitrates [47.47031054057152]
生成モデルはRS画像を極低ビットレートストリームに圧縮するために研究されている。
これらの生成モデルは、非常に低ビットレート画像圧縮の極めて不適切な性質のため、視覚的に可視な画像の再構成に苦慮している。
本研究では,高現実性再構築を実現するために,自然画像に先行した事前学習拡散モデルを用いた画像圧縮フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-03T14:29:54Z) - Estimating the Resize Parameter in End-to-end Learned Image Compression [50.20567320015102]
本稿では,最近の画像圧縮モデルの速度歪みトレードオフをさらに改善する検索自由化フレームワークについて述べる。
提案手法により,Bjontegaard-Deltaレート(BD-rate)を最大10%向上させることができる。
論文 参考訳(メタデータ) (2022-04-26T01:35:02Z) - The Devil Is in the Details: Window-based Attention for Image
Compression [58.1577742463617]
既存の学習画像圧縮モデルは畳み込みニューラルネットワーク(CNN)に基づいている。
本稿では,複数種類の注意機構が局所特徴学習に与える影響について検討し,より単純で効果的なウィンドウベースの局所的注意ブロックを提案する。
提案されたウィンドウベースのアテンションは非常に柔軟で、CNNとTransformerモデルを強化するためのプラグイン・アンド・プレイコンポーネントとして機能する可能性がある。
論文 参考訳(メタデータ) (2022-03-16T07:55:49Z) - Variable-Rate Deep Image Compression through Spatially-Adaptive Feature
Transform [58.60004238261117]
空間特徴変換(SFT arXiv:1804.02815)に基づく多目的深部画像圧縮ネットワークを提案する。
本モデルは,任意の画素単位の品質マップによって制御される単一モデルを用いて,幅広い圧縮速度をカバーしている。
提案するフレームワークにより,様々なタスクに対してタスク対応の画像圧縮を行うことができる。
論文 参考訳(メタデータ) (2021-08-21T17:30:06Z) - Enhanced Invertible Encoding for Learned Image Compression [40.21904131503064]
本稿では,改良されたインバーチブルを提案する。
非可逆ニューラルネットワーク(INN)によるネットワークは、情報損失問題を大幅に軽減し、圧縮性を向上する。
Kodak, CLIC, Tecnick のデータセットによる実験結果から,本手法は既存の学習画像圧縮法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2021-08-08T17:32:10Z) - How to Exploit the Transferability of Learned Image Compression to
Conventional Codecs [25.622863999901874]
本稿では,学習した画像の符号化をサロゲートとして利用して,画像の符号化を最適化する方法を示す。
提案手法は,MS-SSIM歪みをデコードオーバーヘッドを伴わずに20%以上の速度改善で補正するために,従来の画像を再構成することができる。
論文 参考訳(メタデータ) (2020-12-03T12:34:51Z) - Quantization Guided JPEG Artifact Correction [69.04777875711646]
我々はJPEGファイル量子化行列を用いたアーティファクト修正のための新しいアーキテクチャを開発した。
これにより、特定の品質設定のためにトレーニングされたモデルに対して、単一のモデルで最先端のパフォーマンスを達成できます。
論文 参考訳(メタデータ) (2020-04-17T00:10:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。