論文の概要: Fast Implicit Neural Representation Image Codec in Resource-limited
Devices
- arxiv url: http://arxiv.org/abs/2401.12587v1
- Date: Tue, 23 Jan 2024 09:37:58 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-24 16:18:04.995293
- Title: Fast Implicit Neural Representation Image Codec in Resource-limited
Devices
- Title(参考訳): 資源制限デバイスにおける高速暗黙的ニューラル表現画像コーデック
- Authors: Xiang Liu, Jiahong Chen, Bin Chen, Zimo Liu, Baoyi An, Shu-Tao Xia
- Abstract要約: 画像圧縮のためのインプシットニューラル表現(INR)は、最先端のオートエンコーダモデルと比較して2つの重要な利点を提供する新興技術である。
我々は、現在のINRの復号時間を大幅に削減するために、新しいMixed Autoregressive Model(MARM)を導入する。
MARMには提案したオートレグレッシブ・アップサンプラー(ARU)ブロックが含まれており、これは計算効率が高い。
- 参考スコア(独自算出の注目度): 45.06963991604724
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Displaying high-quality images on edge devices, such as augmented reality
devices, is essential for enhancing the user experience. However, these devices
often face power consumption and computing resource limitations, making it
challenging to apply many deep learning-based image compression algorithms in
this field. Implicit Neural Representation (INR) for image compression is an
emerging technology that offers two key benefits compared to cutting-edge
autoencoder models: low computational complexity and parameter-free decoding.
It also outperforms many traditional and early neural compression methods in
terms of quality. In this study, we introduce a new Mixed Autoregressive Model
(MARM) to significantly reduce the decoding time for the current INR codec,
along with a new synthesis network to enhance reconstruction quality. MARM
includes our proposed Autoregressive Upsampler (ARU) blocks, which are highly
computationally efficient, and ARM from previous work to balance decoding time
and reconstruction quality. We also propose enhancing ARU's performance using a
checkerboard two-stage decoding strategy. Moreover, the ratio of different
modules can be adjusted to maintain a balance between quality and speed.
Comprehensive experiments demonstrate that our method significantly improves
computational efficiency while preserving image quality. With different
parameter settings, our method can outperform popular AE-based codecs in
constrained environments in terms of both quality and decoding time, or achieve
state-of-the-art reconstruction quality compared to other INR codecs.
- Abstract(参考訳): 拡張現実デバイスなどのエッジデバイスに高品質な画像を表示することは,ユーザエクスペリエンスの向上に不可欠である。
しかし、これらのデバイスは、しばしば消費電力やリソースの制限に直面するため、ディープラーニングベースの画像圧縮アルゴリズムをこの分野に適用するのは困難である。
画像圧縮のためのインプシットニューラル表現(INR)は、最先端のオートエンコーダモデルと比較して2つの重要な利点を提供する新興技術である。
また、多くの従来の、初期のニューラル圧縮手法よりも品質が優れている。
本研究では,現行のinrコーデックの復号時間を著しく短縮する新しい混合自己回帰モデル(marm)と,再構成品質を向上させる新しい合成ネットワークを提案する。
marmには,高度に計算効率の高いautoregressive upsampler (aru)ブロックと,デコード時間と復元品質のバランスをとるための以前の作業からのarmが含まれている。
また、チェッカーボード2段復号方式を用いてARUの性能向上も提案する。
さらに、異なるモジュールの比率を調整して、品質と速度のバランスを維持することができる。
本手法は画像品質を保ちながら計算効率を大幅に向上することを示した。
パラメータ設定の違いにより,本手法は他のINRコーデックと比較して,品質と復号時間の両方の制約のある環境において,一般的なAEコーデックよりも優れる。
関連論文リスト
- Compression-Realized Deep Structural Network for Video Quality Enhancement [78.13020206633524]
本稿では,圧縮ビデオの品質向上の課題に焦点をあてる。
既存の手法のほとんどは、圧縮コーデック内での事前処理を最適に活用するための構造設計を欠いている。
新しいパラダイムは、より意識的な品質向上プロセスのために緊急に必要である。
論文 参考訳(メタデータ) (2024-05-10T09:18:17Z) - Neural Image Compression Using Masked Sparse Visual Representation [17.229601298529825]
本研究では,Sparse Visual Representation (SVR) に基づくニューラル画像圧縮について検討し,学習されたビジュアルコードブックにまたがる離散潜在空間に画像が埋め込まれた。
コードブックをデコーダと共有することにより、エンコーダは効率的でクロスプラットフォームなコードワードインデックスを転送する。
本稿では,マスクを潜在機能部分空間に適用して品質のバランスと再構築を行うMasked Adaptive Codebook Learning (M-AdaCode)法を提案する。
論文 参考訳(メタデータ) (2023-09-20T21:59:23Z) - ConvNeXt-ChARM: ConvNeXt-based Transform for Efficient Neural Image
Compression [18.05997169440533]
ConvNeXt-ChARMは,効率的なConvNeXtベースのトランスフォーメーションコーディングフレームワークである。
ConvNeXt-ChARMは、VVC参照エンコーダ(VTM-18.0)と最先端の学習画像圧縮手法であるSwinT-ChARMに対して、平均5.24%と1.22%と、一貫したBDレート(PSNR)の低下をもたらすことを示した。
論文 参考訳(メタデータ) (2023-07-12T11:45:54Z) - Joint Hierarchical Priors and Adaptive Spatial Resolution for Efficient
Neural Image Compression [11.25130799452367]
ニューラル画像圧縮(NIC)のための絶対画像圧縮変換器(ICT)を提案する。
ICTは、潜在表現からグローバルコンテキストとローカルコンテキストの両方をキャプチャし、量子化された潜在表現の分布をパラメータ化する。
我々のフレームワークは、多目的ビデオ符号化(VVC)参照符号化(VTM-18.0)とニューラルスウィンT-ChARMに対する符号化効率とデコーダ複雑性のトレードオフを大幅に改善する。
論文 参考訳(メタデータ) (2023-07-05T13:17:14Z) - HiNeRV: Video Compression with Hierarchical Encoding-based Neural
Representation [14.088444622391501]
Implicit Representations (INRs) は画像やビデオのコンテントの表現や圧縮に使われてきた。
既存のINRベースの手法は、ビデオ圧縮の最先端技術に匹敵する速度性能を達成できなかった。
軽量層と階層的位置符号化を組み合わせたINRであるHiNeRVを提案する。
論文 参考訳(メタデータ) (2023-06-16T12:59:52Z) - Asymmetric Learned Image Compression with Multi-Scale Residual Block,
Importance Map, and Post-Quantization Filtering [15.056672221375104]
ディープラーニングに基づく画像圧縮は、最新のH.266/VVCよりも高いレート歪み(R-D)性能を実現している。
多くの先導的な学習スキームは、パフォーマンスと複雑さの間の良いトレードオフを維持することができません。
そこで本研究では,R-D の性能を技術状況よりも低い複雑さで実現した,効率的かつ効果的な画像符号化フレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-21T09:34:29Z) - Neural Data-Dependent Transform for Learned Image Compression [72.86505042102155]
ニューラルデータに依存した変換を構築し,各画像の符号化効率を最適化する連続オンラインモード決定機構を導入する。
実験の結果,提案したニューラルシンタクス設計と連続オンラインモード決定機構の有効性が示された。
論文 参考訳(メタデータ) (2022-03-09T14:56:48Z) - Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG
Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。
実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文 参考訳(メタデータ) (2022-01-27T20:20:03Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - Adaptive Gradient Balancing for UndersampledMRI Reconstruction and
Image-to-Image Translation [60.663499381212425]
本研究では,新しい適応勾配バランス手法を併用したwasserstein生成逆ネットワークを用いて,画質の向上を図る。
MRIでは、他の技術よりも鮮明な画像を生成する高品質の再構築を維持しながら、アーティファクトを最小限に抑えます。
論文 参考訳(メタデータ) (2021-04-05T13:05:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。