論文の概要: Generalized Octave Convolutions for Learned Multi-Frequency Image
Compression
- arxiv url: http://arxiv.org/abs/2002.10032v3
- Date: Thu, 31 Dec 2020 06:34:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-29 03:49:08.584942
- Title: Generalized Octave Convolutions for Learned Multi-Frequency Image
Compression
- Title(参考訳): 学習型多周波数画像圧縮のための一般化オクターブ畳み込み
- Authors: Mohammad Akbari and Jie Liang and Jingning Han and Chengjie Tu
- Abstract要約: 本稿では,初めて学習されたマルチ周波数画像圧縮とエントロピー符号化手法を提案する。
これは最近開発されたオクターブの畳み込みに基づいて、潜水剤を高周波(高分解能)成分に分解する。
提案した一般化オクターブ畳み込みは、他のオートエンコーダベースのコンピュータビジョンタスクの性能を向上させることができることを示す。
- 参考スコア(独自算出の注目度): 20.504561050200365
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learned image compression has recently shown the potential to outperform the
standard codecs. State-of-the-art rate-distortion (R-D) performance has been
achieved by context-adaptive entropy coding approaches in which hyperprior and
autoregressive models are jointly utilized to effectively capture the spatial
dependencies in the latent representations. However, the latents are feature
maps of the same spatial resolution in previous works, which contain some
redundancies that affect the R-D performance. In this paper, we propose the
first learned multi-frequency image compression and entropy coding approach
that is based on the recently developed octave convolutions to factorize the
latents into high and low frequency (resolution) components, where the low
frequency is represented by a lower resolution. Therefore, its spatial
redundancy is reduced, which improves the R-D performance. Novel generalized
octave convolution and octave transposed-convolution architectures with
internal activation layers are also proposed to preserve more spatial structure
of the information. Experimental results show that the proposed scheme not only
outperforms all existing learned methods as well as standard codecs such as the
next-generation video coding standard VVC (4:2:0) on the Kodak dataset in both
PSNR and MS-SSIM. We also show that the proposed generalized octave convolution
can improve the performance of other auto-encoder-based computer vision tasks
such as semantic segmentation and image denoising.
- Abstract(参考訳): 学習された画像圧縮は、最近標準コーデックを上回る性能を示す。
ハイパープリアーモデルと自己回帰モデルを用いて潜在表現の空間依存性を効果的に捉えるコンテキスト適応エントロピー符号化手法により,最先端のr-d性能が達成されている。
しかし、ラテントは前作と同じ空間分解能を持つ特徴写像であり、R-D性能に影響を与える冗長性を含んでいる。
本稿では、最近開発されたオクターブ畳み込みに基づいて、低周波を低分解能で表す高分解能成分と低分解能成分に分解する、初めて学習された多周波画像圧縮エントロピー符号化手法を提案する。
そのため、空間冗長性が低下し、R-D性能が向上する。
内部活性化層を有する新しい一般化オクターブ畳み込みとオクターブ転置畳み込みアーキテクチャも,情報のより空間的構造を保存するために提案されている。
実験の結果,提案手法はPSNRおよびMS-SSIMのKodakデータセット上で,既存の学習方法や次世代ビデオ符号化標準VVC(4:2:0)などの標準コーデックよりも優れていた。
また,提案する一般化オクターブ畳み込みにより,セマンティクスセグメンテーションや画像デノージングといった他のオートエンコーダベースのコンピュータビジョンタスクの性能が向上することを示す。
関連論文リスト
- Compression-Realized Deep Structural Network for Video Quality Enhancement [78.13020206633524]
本稿では,圧縮ビデオの品質向上の課題に焦点をあてる。
既存の手法のほとんどは、圧縮コーデック内での事前処理を最適に活用するための構造設計を欠いている。
新しいパラダイムは、より意識的な品質向上プロセスのために緊急に必要である。
論文 参考訳(メタデータ) (2024-05-10T09:18:17Z) - Unifying Generation and Compression: Ultra-low bitrate Image Coding Via
Multi-stage Transformer [35.500720262253054]
本稿では,新しい画像生成圧縮(UIGC)パラダイムを導入し,生成と圧縮のプロセスを統合する。
UIGCフレームワークの重要な特徴は、トークン化にベクトル量子化(VQ)イメージモデルを採用することである。
実験では、既存のコーデックよりも知覚品質と人間の知覚において、提案されたUIGCフレームワークが優れていることを示した。
論文 参考訳(メタデータ) (2024-03-06T14:27:02Z) - ConvNeXt-ChARM: ConvNeXt-based Transform for Efficient Neural Image
Compression [18.05997169440533]
ConvNeXt-ChARMは,効率的なConvNeXtベースのトランスフォーメーションコーディングフレームワークである。
ConvNeXt-ChARMは、VVC参照エンコーダ(VTM-18.0)と最先端の学習画像圧縮手法であるSwinT-ChARMに対して、平均5.24%と1.22%と、一貫したBDレート(PSNR)の低下をもたらすことを示した。
論文 参考訳(メタデータ) (2023-07-12T11:45:54Z) - Modality-Agnostic Variational Compression of Implicit Neural
Representations [96.35492043867104]
Inlicit Neural Representation (INR) としてパラメータ化されたデータの関数的ビューに基づくモーダリティ非依存型ニューラル圧縮アルゴリズムを提案する。
潜時符号化と疎性の間のギャップを埋めて、ソフトゲーティング機構に非直線的にマッピングされたコンパクト潜時表現を得る。
このような潜在表現のデータセットを得た後、ニューラル圧縮を用いてモーダリティ非依存空間におけるレート/歪みトレードオフを直接最適化する。
論文 参考訳(メタデータ) (2023-01-23T15:22:42Z) - Learned Image Compression with Generalized Octave Convolution and
Cross-Resolution Parameter Estimation [5.238765582868391]
本稿では,オクターブの畳み込みを利用して,遅延表現を高分解能 (HR) と低分解能 (LR) に分解する多分解能画像圧縮フレームワークを提案する。
実験結果から,本手法は,最先端の学習画像圧縮法と比較して,復号時間を約73.35 %,93.44 %削減できることがわかった。
論文 参考訳(メタデータ) (2022-09-07T08:21:52Z) - Learned Video Compression via Heterogeneous Deformable Compensation
Network [78.72508633457392]
不安定な圧縮性能の問題に対処するために,不均一変形補償戦略(HDCVC)を用いた学習ビデオ圧縮フレームワークを提案する。
より具体的には、提案アルゴリズムは隣接する2つのフレームから特徴を抽出し、コンテンツ近傍の不均一な変形(HetDeform)カーネルオフセットを推定する。
実験結果から,HDCVCは最近の最先端の学習ビデオ圧縮手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2022-07-11T02:31:31Z) - Rank-Enhanced Low-Dimensional Convolution Set for Hyperspectral Image
Denoising [50.039949798156826]
本稿では,ハイパースペクトル(HS)画像の難解化問題に対処する。
ランク付き低次元畳み込み集合(Re-ConvSet)を提案する。
次に、Re-ConvSetを広く使われているU-Netアーキテクチャに組み込んで、HS画像復号法を構築する。
論文 参考訳(メタデータ) (2022-07-09T13:35:12Z) - Reducing Redundancy in the Bottleneck Representation of the Autoencoders [98.78384185493624]
オートエンコーダは教師なしニューラルネットワークの一種であり、様々なタスクを解くのに使用できる。
本稿では,ボトルネック表現における特徴冗長性を明示的に罰する手法を提案する。
我々は,3つの異なるデータセットを用いた次元削減,MNISTデータセットを用いた画像圧縮,ファッションMNISTを用いた画像デノナイズという,さまざまなタスクにまたがってアプローチを検証した。
論文 参考訳(メタデータ) (2022-02-09T18:48:02Z) - LC-FDNet: Learned Lossless Image Compression with Frequency
Decomposition Network [14.848279912686948]
近年の学習に基づく画像圧縮法では,高周波領域の性能低下は考慮されていない。
本稿では,低周波領域と高周波領域を分離処理するために,粗大な方法で符号化を進める新しい手法を提案する。
実験により,提案手法はベンチマーク高解像度データセットの最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2021-12-13T04:49:34Z) - UltraSR: Spatial Encoding is a Missing Key for Implicit Image
Function-based Arbitrary-Scale Super-Resolution [74.82282301089994]
本研究では,暗黙的イメージ関数に基づく,シンプルで効果的な新しいネットワーク設計であるUltraSRを提案する。
空間符号化は,次の段階の高精度暗黙的画像機能に対する欠落鍵であることを示す。
UltraSRは、すべての超解像スケールでDIV2Kベンチマークに最新のパフォーマンスを設定します。
論文 参考訳(メタデータ) (2021-03-23T17:36:42Z) - Learned Multi-Resolution Variable-Rate Image Compression with
Octave-based Residual Blocks [15.308823742699039]
一般化オクターブ畳み込み(GoConv)と一般化オクターブ畳み込み(GoTConv)を用いた新しい可変レート画像圧縮フレームワークを提案する。
単一モデルが異なるビットレートで動作し、複数レートの画像特徴を学習できるようにするため、新しい目的関数が導入される。
実験結果から,H.265/HEVCベースのBPGや最先端の学習に基づく可変レート法などの標準コーデックよりも高い性能を示した。
論文 参考訳(メタデータ) (2020-12-31T06:26:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。