論文の概要: Beyond Learned Metadata-based Raw Image Reconstruction
- arxiv url: http://arxiv.org/abs/2306.12058v1
- Date: Wed, 21 Jun 2023 06:59:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-22 14:38:31.209122
- Title: Beyond Learned Metadata-based Raw Image Reconstruction
- Title(参考訳): 学習メタデータに基づく生画像再構成
- Authors: Yufei Wang, Yi Yu, Wenhan Yang, Lanqing Guo, Lap-Pui Chau, Alex C.
Kot, Bihan Wen
- Abstract要約: 生画像は、線形性や微細な量子化レベルなど、sRGB画像に対して明確な利点がある。
ストレージの要求が大きいため、一般ユーザからは広く採用されていない。
本稿では,メタデータとして,潜在空間におけるコンパクトな表現を学習する新しいフレームワークを提案する。
- 参考スコア(独自算出の注目度): 86.1667769209103
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While raw images have distinct advantages over sRGB images, e.g., linearity
and fine-grained quantization levels, they are not widely adopted by general
users due to their substantial storage requirements. Very recent studies
propose to compress raw images by designing sampling masks within the pixel
space of the raw image. However, these approaches often leave space for
pursuing more effective image representations and compact metadata. In this
work, we propose a novel framework that learns a compact representation in the
latent space, serving as metadata, in an end-to-end manner. Compared with lossy
image compression, we analyze the intrinsic difference of the raw image
reconstruction task caused by rich information from the sRGB image. Based on
the analysis, a novel backbone design with asymmetric and hybrid spatial
feature resolutions is proposed, which significantly improves the
rate-distortion performance. Besides, we propose a novel design of the context
model, which can better predict the order masks of encoding/decoding based on
both the sRGB image and the masks of already processed features. Benefited from
the better modeling of the correlation between order masks, the already
processed information can be better utilized. Moreover, a novel sRGB-guided
adaptive quantization precision strategy, which dynamically assigns varying
levels of quantization precision to different regions, further enhances the
representation ability of the model. Finally, based on the iterative properties
of the proposed context model, we propose a novel strategy to achieve variable
bit rates using a single model. This strategy allows for the continuous
convergence of a wide range of bit rates. Extensive experimental results
demonstrate that the proposed method can achieve better reconstruction quality
with a smaller metadata size.
- Abstract(参考訳): 生画像は線形性や細かな量子化レベルといったsrgb画像と異なるアドバンテージを持つが、大きなストレージ要件のため一般には広く採用されていない。
近年,生画像の画素空間内におけるサンプリングマスクの設計により生画像を圧縮する手法が提案されている。
しかし、これらのアプローチは、より効果的な画像表現とコンパクトなメタデータを追求する余地をしばしば残している。
本研究では,潜在空間において,メタデータとして機能するコンパクト表現をエンドツーエンドで学習する新しいフレームワークを提案する。
画像圧縮に比較して,SRGB画像からのリッチな情報による生画像再構成タスクの本質的な差異を分析する。
解析に基づき,非対称・ハイブリッド空間特徴分解能を有する新しいバックボーン設計を提案し,速度歪み特性を著しく改善した。
また,srgb画像と既に処理された特徴のマスクの両方に基づいて,符号化/復号の順序マスクを精度良く予測できるコンテキストモデルの新たな設計を提案する。
秩序マスク間の相関関係のより優れたモデリングにより、既に処理済みの情報がより有効に利用できる。
さらに、異なる領域に様々なレベルの量子化精度を動的に割り当てる新しいsRGB誘導適応量子化精度戦略により、モデルの表現能力が向上する。
最後に,提案したコンテキストモデルの反復特性に基づいて,単一モデルを用いて可変ビットレートを実現する新しい手法を提案する。
この戦略は、幅広いビットレートの連続収束を可能にする。
大規模な実験結果から,提案手法はメタデータサイズを小さくすることで,再現性の向上を図っている。
関連論文リスト
- You Can Mask More For Extremely Low-Bitrate Image Compression [80.7692466922499]
近年,学習画像圧縮(lic)法は大きな進歩を遂げている。
licメソッドは、画像圧縮に不可欠な画像構造とテクスチャコンポーネントを明示的に探索することができない。
原画像の構造とテクスチャに基づいて可視パッチをサンプリングするDA-Maskを提案する。
極めて低ビットレート圧縮のために, lic と lic のエンドツーエンドを統一する最初のフレームワークである, 単純で効果的なマスク付き圧縮モデル (MCM) を提案する。
論文 参考訳(メタデータ) (2023-06-27T15:36:22Z) - Compression with Bayesian Implicit Neural Representations [16.593537431810237]
本稿では,データに変分ニューラルネットワークをオーバーフィッティングし,相対エントロピー符号化を用いて近似後重みサンプルを圧縮し,量子化やエントロピー符号化を行う。
実験により,本手法は単純さを維持しつつ,画像および音声の圧縮に強い性能を発揮することが示された。
論文 参考訳(メタデータ) (2023-05-30T16:29:52Z) - Raw Image Reconstruction with Learned Compact Metadata [61.62454853089346]
本稿では,メタデータとしての潜在空間におけるコンパクトな表現をエンドツーエンドで学習するための新しいフレームワークを提案する。
提案する生画像圧縮方式は,グローバルな視点から重要な画像領域に適応的により多くのビットを割り当てることができることを示す。
論文 参考訳(メタデータ) (2023-02-25T05:29:45Z) - Rank-Enhanced Low-Dimensional Convolution Set for Hyperspectral Image
Denoising [50.039949798156826]
本稿では,ハイパースペクトル(HS)画像の難解化問題に対処する。
ランク付き低次元畳み込み集合(Re-ConvSet)を提案する。
次に、Re-ConvSetを広く使われているU-Netアーキテクチャに組み込んで、HS画像復号法を構築する。
論文 参考訳(メタデータ) (2022-07-09T13:35:12Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - Generating Images with Sparse Representations [21.27273495926409]
画像の高次元化は、確率に基づく生成モデルのアーキテクチャとサンプリング効率の課題を示す。
JPEGのような一般的な画像圧縮法に触発された代替手法を提示し、画像を量子化された離散コサイン変換(DCT)ブロックに変換する。
本稿では,次の要素の条件分布を逐次的に予測するトランスフォーマに基づく自己回帰型アーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-03-05T17:56:03Z) - Learning Enriched Features for Real Image Restoration and Enhancement [166.17296369600774]
畳み込みニューラルネットワーク(CNN)は、画像復元作業における従来のアプローチよりも劇的に改善されている。
ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とした,新しいアーキテクチャを提案する。
提案手法は,高解像度の空間的詳細を同時に保存しながら,複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
論文 参考訳(メタデータ) (2020-03-15T11:04:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。