論文の概要: Enhancing Perception Quality in Remote Sensing Image Compression via Invertible Neural Network
- arxiv url: http://arxiv.org/abs/2405.10518v2
- Date: Sun, 25 Aug 2024 07:40:36 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-27 23:27:05.706234
- Title: Enhancing Perception Quality in Remote Sensing Image Compression via Invertible Neural Network
- Title(参考訳): 可逆ニューラルネットワークを用いたリモートセンシング画像圧縮における知覚品質向上
- Authors: Junhui Li, Xingsong Hou,
- Abstract要約: リモートセンシング画像をデコードして、特に低解像度で高い知覚品質を実現することは、依然として大きな課題である。
Invertible Neural Network-based Remote Sensor Image compression (INN-RSIC)法を提案する。
我々の INN-RSIC は、認識品質の観点から、既存の最先端のディープラーニングベースの画像圧縮手法よりも優れています。
- 参考スコア(独自算出の注目度): 10.427300958330816
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Decoding remote sensing images to achieve high perceptual quality, particularly at low bitrates, remains a significant challenge. To address this problem, we propose the invertible neural network-based remote sensing image compression (INN-RSIC) method. Specifically, we capture compression distortion from an existing image compression algorithm and encode it as a set of Gaussian-distributed latent variables via INN. This ensures that the compression distortion in the decoded image becomes independent of the ground truth. Therefore, by leveraging the inverse mapping of INN, we can input the decoded image along with a set of randomly resampled Gaussian distributed variables into the inverse network, effectively generating enhanced images with better perception quality. To effectively learn compression distortion, channel expansion, Haar transformation, and invertible blocks are employed to construct the INN. Additionally, we introduce a quantization module (QM) to mitigate the impact of format conversion, thus enhancing the framework's generalization and improving the perceptual quality of enhanced images. Extensive experiments demonstrate that our INN-RSIC significantly outperforms the existing state-of-the-art traditional and deep learning-based image compression methods in terms of perception quality.
- Abstract(参考訳): リモートセンシング画像をデコードして、特に低ビットレートで高い知覚品質を実現することは、依然として大きな課題である。
この問題に対処するために,インバータブルニューラルネットワークを用いたリモートセンシング画像圧縮法(INN-RSIC)を提案する。
具体的には、既存の画像圧縮アルゴリズムから圧縮歪みをキャプチャし、それをINNを介してガウス分布の潜在変数の集合として符号化する。
これにより、デコードされた画像の圧縮歪みが、基底真理から独立することを保証する。
したがって, INNの逆写像を利用することで, ランダムに再サンプリングされたガウス分布変数の集合を逆ネットワークに入力し, 知覚品質を向上した拡張画像を効果的に生成することができる。
圧縮歪みを効果的に学習するために、チャネル展開、ハール変換、および可逆ブロックを用いて INN を構築する。
さらに、フォーマット変換の影響を軽減するために量子化モジュール(QM)を導入し、フレームワークの一般化を強化し、画像の知覚品質を向上させる。
広汎な実験により,我々の INN-RSIC は従来の画像圧縮法と深層学習による画像圧縮法を,知覚品質の観点から大きく上回っていることが明らかとなった。
関連論文リスト
- Approximately Invertible Neural Network for Learned Image Compression [19.330720001489937]
本稿では,学習画像圧縮のための約可逆ニューラルネットワーク(A-INN)フレームワークを提案する。
INNと量子化を用いた場合、損失画像圧縮における速度歪みの最適化を定式化する。
大規模な実験により,提案したA-INNは既存の学習画像圧縮法よりも優れていた。
論文 参考訳(メタデータ) (2024-08-30T07:57:47Z) - Neural Image Compression with Quantization Rectifier [7.097091519502871]
我々は,画像特徴相関を利用した画像圧縮のための新しい量子化法(QR)を開発し,量子化の影響を緩和する。
提案手法は,量子化された特徴量から未知の特徴量を予測するニューラルネットワークアーキテクチャを設計する。
評価では、QRを最先端のニューラルイメージコーデックに統合し、広く使用されているKodakベンチマークの強化モデルとベースラインを比較する。
論文 参考訳(メタデータ) (2024-03-25T22:26:09Z) - Semantic Ensemble Loss and Latent Refinement for High-Fidelity Neural Image Compression [58.618625678054826]
本研究は、最適な視覚的忠実度のために設計された強化されたニューラル圧縮手法を提案する。
我々は,洗練されたセマンティック・アンサンブル・ロス,シャルボニエ・ロス,知覚的損失,スタイル・ロス,非バイナリ・ディバイザ・ロスを組み込んだモデルを構築した。
実験により,本手法は神経画像圧縮の統計的忠実度を著しく向上させることが示された。
論文 参考訳(メタデータ) (2024-01-25T08:11:27Z) - Transferable Learned Image Compression-Resistant Adversarial Perturbations [66.46470251521947]
敵対的攻撃は容易に画像分類システムを破壊し、DNNベースの認識タスクの脆弱性を明らかにする。
我々は、学習した画像圧縮機を前処理モジュールとして利用する画像分類モデルをターゲットにした新しいパイプラインを提案する。
論文 参考訳(メタデータ) (2024-01-06T03:03:28Z) - Neural Image Compression Using Masked Sparse Visual Representation [17.229601298529825]
本研究では,Sparse Visual Representation (SVR) に基づくニューラル画像圧縮について検討し,学習されたビジュアルコードブックにまたがる離散潜在空間に画像が埋め込まれた。
コードブックをデコーダと共有することにより、エンコーダは効率的でクロスプラットフォームなコードワードインデックスを転送する。
本稿では,マスクを潜在機能部分空間に適用して品質のバランスと再構築を行うMasked Adaptive Codebook Learning (M-AdaCode)法を提案する。
論文 参考訳(メタデータ) (2023-09-20T21:59:23Z) - Reducing Redundancy in the Bottleneck Representation of the Autoencoders [98.78384185493624]
オートエンコーダは教師なしニューラルネットワークの一種であり、様々なタスクを解くのに使用できる。
本稿では,ボトルネック表現における特徴冗長性を明示的に罰する手法を提案する。
我々は,3つの異なるデータセットを用いた次元削減,MNISTデータセットを用いた画像圧縮,ファッションMNISTを用いた画像デノナイズという,さまざまなタスクにまたがってアプローチを検証した。
論文 参考訳(メタデータ) (2022-02-09T18:48:02Z) - Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG
Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。
実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文 参考訳(メタデータ) (2022-01-27T20:20:03Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - Modeling Lost Information in Lossy Image Compression [72.69327382643549]
ロスシー画像圧縮は、デジタル画像の最もよく使われる演算子の1つである。
Invertible Lossy Compression (ILC) と呼ばれる新しい非可逆的フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-22T04:04:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。