論文の概要: Image Compression with Recurrent Neural Network and Generalized Divisive
Normalization
- arxiv url: http://arxiv.org/abs/2109.01999v1
- Date: Sun, 5 Sep 2021 05:31:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-08 07:22:09.588781
- Title: Image Compression with Recurrent Neural Network and Generalized Divisive
Normalization
- Title(参考訳): リカレントニューラルネットワークによる画像圧縮と一般化分割正規化
- Authors: Khawar Islam, L. Minh Dang, Sujin Lee, Hyeonjoon Moon
- Abstract要約: 深層学習は研究コミュニティから大きな注目を集め、将来有望な画像再構成結果を生み出している。
近年の手法は、ネットワークの複雑さを大幅に増大させる、より深い複雑なネットワークの開発に焦点を当てている。
本稿では、畳み込み層を用いた解析とブロック合成と、可変レートエンコーダとデコーダ側における一般化分割正規化(GDN)の2つの有効な新しいブロックを開発する。
- 参考スコア(独自算出の注目度): 3.0204520109309843
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Image compression is a method to remove spatial redundancy between adjacent
pixels and reconstruct a high-quality image. In the past few years, deep
learning has gained huge attention from the research community and produced
promising image reconstruction results. Therefore, recent methods focused on
developing deeper and more complex networks, which significantly increased
network complexity. In this paper, two effective novel blocks are developed:
analysis and synthesis block that employs the convolution layer and Generalized
Divisive Normalization (GDN) in the variable-rate encoder and decoder side. Our
network utilizes a pixel RNN approach for quantization. Furthermore, to improve
the whole network, we encode a residual image using LSTM cells to reduce
unnecessary information. Experimental results demonstrated that the proposed
variable-rate framework with novel blocks outperforms existing methods and
standard image codecs, such as George's ~\cite{002} and JPEG in terms of image
similarity. The project page along with code and models are available at
https://khawar512.github.io/cvpr/
- Abstract(参考訳): 画像圧縮は、隣接画素間の空間的冗長性を除去し、高品質な画像の再構成を行う方法である。
近年, 深層学習は研究コミュニティから大きな注目を集め, 有望な画像再構成結果を生み出している。
そのため、近年の手法は、ネットワークの複雑さを大幅に増大させるより深い複雑なネットワークの開発に焦点を当てている。
本稿では、畳み込み層を用いた解析と合成ブロックと、可変レートエンコーダとデコーダ側における一般化分割正規化(GDN)の2つの有効な新しいブロックを開発する。
我々のネットワークは、量子化のためのピクセルRNNアプローチを利用している。
さらに,ネットワーク全体を改善するため,LSTMセルを用いて残像を符号化し,不要な情報を削減する。
実験の結果,新しいブロックを持つ可変レートフレームワークは,George の ~\cite{002} やJPEG など,既存の手法や標準画像コーデックよりも画像類似性が高いことがわかった。
プロジェクトページとコードとモデルはhttps://khawar512.github.io/cvpr/で入手できる。
関連論文リスト
- Enhancing Perception Quality in Remote Sensing Image Compression via Invertible Neural Network [10.427300958330816]
リモートセンシング画像をデコードして、特に低解像度で高い知覚品質を実現することは、依然として大きな課題である。
Invertible Neural Network-based Remote Sensor Image compression (INN-RSIC)法を提案する。
我々の INN-RSIC は、認識品質の観点から、既存の最先端のディープラーニングベースの画像圧縮手法よりも優れています。
論文 参考訳(メタデータ) (2024-05-17T03:52:37Z) - T-former: An Efficient Transformer for Image Inpainting [50.43302925662507]
トランスフォーマーと呼ばれる注目に基づくネットワークアーキテクチャのクラスは、自然言語処理の分野で大きなパフォーマンスを示している。
本稿では,Taylorの展開に応じて,解像度に線形に関連付けられた新たな注意を設計し,この注意に基づいて,画像インペイントのためのネットワークである$T$-formerを設計する。
いくつかのベンチマークデータセットの実験により,提案手法は比較的少ないパラメータ数と計算複雑性を維持しつつ,最先端の精度を達成できることが示されている。
論文 参考訳(メタデータ) (2023-05-12T04:10:42Z) - Accurate Image Restoration with Attention Retractable Transformer [50.05204240159985]
画像復元のためのアテンション・リトラクタブル・トランス (ART) を提案する。
ARTはネットワーク内の密集モジュールと疎開モジュールの両方を提示する。
画像超解像、デノナイジング、JPEG圧縮アーティファクト削減タスクについて広範な実験を行った。
論文 参考訳(メタデータ) (2022-10-04T07:35:01Z) - Learning Enriched Features for Fast Image Restoration and Enhancement [166.17296369600774]
本稿では,ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とする。
我々は、高解像度の空間的詳細を同時に保存しながら、複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
提案手法は,デフォーカス・デブロアリング,画像デノイング,超解像,画像強調など,さまざまな画像処理タスクに対して,最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2022-04-19T17:59:45Z) - End-to-End Learned Block-Based Image Compression with Block-Level Masked
Convolutions and Asymptotic Closed Loop Training [2.741266294612776]
本稿では,明示的内部予測ニューラルネットワークと明示的遮断ニューラルネットワークを併用しない,学習されたブロックベース画像圧縮手法を提案する。
実験結果から, 競合画像圧縮性能が示唆された。
論文 参考訳(メタデータ) (2022-03-22T13:01:59Z) - The Devil Is in the Details: Window-based Attention for Image
Compression [58.1577742463617]
既存の学習画像圧縮モデルは畳み込みニューラルネットワーク(CNN)に基づいている。
本稿では,複数種類の注意機構が局所特徴学習に与える影響について検討し,より単純で効果的なウィンドウベースの局所的注意ブロックを提案する。
提案されたウィンドウベースのアテンションは非常に柔軟で、CNNとTransformerモデルを強化するためのプラグイン・アンド・プレイコンポーネントとして機能する可能性がある。
論文 参考訳(メタデータ) (2022-03-16T07:55:49Z) - Restormer: Efficient Transformer for High-Resolution Image Restoration [118.9617735769827]
畳み込みニューラルネットワーク(CNN)は、大規模データから一般化可能な画像の事前学習をうまく行う。
トランスフォーマーは、自然言語とハイレベルな視覚タスクにおいて、顕著なパフォーマンス向上を示している。
我々のモデルであるRecovery Transformer (Restormer) は、いくつかの画像復元タスクにおいて最先端の結果を得る。
論文 参考訳(メタデータ) (2021-11-18T18:59:10Z) - Learned Multi-Resolution Variable-Rate Image Compression with
Octave-based Residual Blocks [15.308823742699039]
一般化オクターブ畳み込み(GoConv)と一般化オクターブ畳み込み(GoTConv)を用いた新しい可変レート画像圧縮フレームワークを提案する。
単一モデルが異なるビットレートで動作し、複数レートの画像特徴を学習できるようにするため、新しい目的関数が導入される。
実験結果から,H.265/HEVCベースのBPGや最先端の学習に基づく可変レート法などの標準コーデックよりも高い性能を示した。
論文 参考訳(メタデータ) (2020-12-31T06:26:56Z) - End-to-End JPEG Decoding and Artifacts Suppression Using Heterogeneous
Residual Convolutional Neural Network [0.0]
既存のディープラーニングモデルは、デコードプロトコルからJPEGアーティファクトを独立したタスクとして分離する。
我々は、スペクトル分解とヘテロジニアス再構成機構を備えた真のエンド・ツー・エンドヘテロジニアス残畳み込みニューラルネットワーク(HR-CNN)を設計する。
論文 参考訳(メタデータ) (2020-07-01T17:44:00Z) - Neural Sparse Representation for Image Restoration [116.72107034624344]
スパース符号化に基づく画像復元モデルの堅牢性と効率に触発され,深部ネットワークにおけるニューロンの空間性について検討した。
本手法は,隠れたニューロンに対する空間的制約を構造的に強制する。
実験により、複数の画像復元タスクのためのディープニューラルネットワークではスパース表現が不可欠であることが示されている。
論文 参考訳(メタデータ) (2020-06-08T05:15:17Z) - Large Hole Image Inpainting With Compress-Decompression Network [0.0]
既存の方法では、破損した画像の修復のための畳み込みニューラルネットワークが提案されている。
既存の手法を考察し,圧縮圧縮ネットワークという新しいネットワークを提案する。
残差ネットワークを用いた圧縮ネットワークを構築し,画像の拡張に類似したテクスチャ選択アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-02-01T12:39:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。