論文の概要: LoC-LIC: Low Complexity Learned Image Coding Using Hierarchical Feature Transforms
- arxiv url: http://arxiv.org/abs/2504.21778v1
- Date: Wed, 30 Apr 2025 16:30:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-09 17:45:47.578622
- Title: LoC-LIC: Low Complexity Learned Image Coding Using Hierarchical Feature Transforms
- Title(参考訳): LoC-LIC:階層的特徴変換を用いた低複雑性学習画像符号化
- Authors: Ayman A. Ameen, Thomas Richter, André Kaup,
- Abstract要約: 本稿では,階層的特徴抽出変換を用いて,複雑性を大幅に低減する革新的な手法を提案する。
我々の新しいアーキテクチャは、高空間分解能インプット/フィーチャーマップのチャネルを減らし、これを実現する。
結果として、複雑性を低減したモデルは、学習した画像圧縮モデルが様々なデバイスで効率的に動作する方法を開くことができる。
- 参考スコア(独自算出の注目度): 16.428925911432344
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Current learned image compression models typically exhibit high complexity, which demands significant computational resources. To overcome these challenges, we propose an innovative approach that employs hierarchical feature extraction transforms to significantly reduce complexity while preserving bit rate reduction efficiency. Our novel architecture achieves this by using fewer channels for high spatial resolution inputs/feature maps. On the other hand, feature maps with a large number of channels have reduced spatial dimensions, thereby cutting down on computational load without sacrificing performance. This strategy effectively reduces the forward pass complexity from \(1256 \, \text{kMAC/Pixel}\) to just \(270 \, \text{kMAC/Pixel}\). As a result, the reduced complexity model can open the way for learned image compression models to operate efficiently across various devices and pave the way for the development of new architectures in image compression technology.
- Abstract(参考訳): 現在の学習画像圧縮モデルは、通常、高い複雑さを示し、かなりの計算資源を必要とする。
これらの課題を克服するため,ビットレート削減効率を保ちながら,階層的特徴抽出変換を用いて複雑性を著しく低減する革新的な手法を提案する。
我々の新しいアーキテクチャは、高空間分解能インプット/フィーチャーマップのチャネルを減らし、これを実現する。
一方、多数のチャネルを持つ特徴写像は空間次元を小さくし、性能を犠牲にすることなく計算負荷を削減できる。
この戦略は、フォワードパスの複雑性を \(1256 \, \text{kMAC/Pixel}\) から単に \(270 \, \text{kMAC/Pixel}\) に効果的に還元する。
その結果、複雑性の低減により、学習した画像圧縮モデルが様々なデバイスで効率的に動作し、画像圧縮技術で新しいアーキテクチャを開発するための道を開くことができる。
関連論文リスト
- Multi-Scale Invertible Neural Network for Wide-Range Variable-Rate Learned Image Compression [90.59962443790593]
本稿では,制限を克服するために,可逆変換に基づく可変レート画像圧縮モデルを提案する。
具体的には、入力画像をマルチスケールの潜在表現にマッピングする、軽量なマルチスケール非可逆ニューラルネットワークを設計する。
実験結果から,提案手法は既存の可変レート法と比較して最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2025-03-27T09:08:39Z) - MambaIC: State Space Models for High-Performance Learned Image Compression [53.991726013454695]
多数のフィールドをまたいだリアルタイム情報伝送には,高性能な画像圧縮アルゴリズムが不可欠である。
状態空間モデル(SSM)の長距離依存性の捕捉効果に着想を得て,SSMを利用して既存手法の計算不効率に対処する。
そこで本稿では,MambaICと呼ばれる洗練されたコンテキストモデリングによる画像圧縮手法を提案する。
論文 参考訳(メタデータ) (2025-03-16T11:32:34Z) - Serpent: Scalable and Efficient Image Restoration via Multi-scale Structured State Space Models [22.702352459581434]
サーペントは高解像度画像復元のための効率的なアーキテクチャである。
本稿では,Serpentが最先端技術に匹敵する再現性が得られることを示す。
論文 参考訳(メタデータ) (2024-03-26T17:43:15Z) - Efficient Contextformer: Spatio-Channel Window Attention for Fast
Context Modeling in Learned Image Compression [1.9249287163937978]
学習画像に対する変換器に基づく自己回帰的文脈モデルである、効率的なコンテキストフォーマ(eContextformer)を導入する。
並列コンテキストモデリングのためのパッチワイド、チェッカー、チャンネルワイドのグルーピングテクニックを融合する。
モデル複雑性が145倍、デコード速度が210Cx向上し、Kodak、CLI、Tecnickデータセット上での平均ビット節約を実現している。
論文 参考訳(メタデータ) (2023-06-25T16:29:51Z) - Beyond Learned Metadata-based Raw Image Reconstruction [86.1667769209103]
生画像は、線形性や微細な量子化レベルなど、sRGB画像に対して明確な利点がある。
ストレージの要求が大きいため、一般ユーザからは広く採用されていない。
本稿では,メタデータとして,潜在空間におけるコンパクトな表現を学習する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-21T06:59:07Z) - Exploring Effective Mask Sampling Modeling for Neural Image Compression [171.35596121939238]
既存のニューラルイメージ圧縮手法の多くは、空間的冗長性を排除するために、ハイパープライアモデルやコンテキストモデルからのサイド情報に依存している。
近年の自然言語処理と高次視覚のための自己教師付き学習手法におけるマスクサンプリングモデルに着想を得て,ニューラル画像圧縮のための新しい事前学習戦略を提案する。
提案手法は,最先端画像圧縮法と比較して計算複雑性の低い競合性能を実現する。
論文 参考訳(メタデータ) (2023-06-09T06:50:20Z) - Wavelet Feature Maps Compression for Image-to-Image CNNs [3.1542695050861544]
本稿では,高分解能なアクティベーションマップ圧縮をポイントワイド畳み込みと統合した新しい手法を提案する。
比較的小さく、より優雅な性能劣化を伴う1-4ビットのアクティベーション量子化に匹敵する圧縮率を達成する。
論文 参考訳(メタデータ) (2022-05-24T20:29:19Z) - Modeling Image Quantization Tradeoffs for Optimal Compression [0.0]
ロスシー圧縮アルゴリズムは、圧縮率を上げるために高周波データを定量化することでトレードオフを狙う。
本稿では,Deep Learningとminimax損失関数を用いた量子化テーブルの最適化手法を提案する。
論文 参考訳(メタデータ) (2021-12-14T07:35:22Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - Modeling Lost Information in Lossy Image Compression [72.69327382643549]
ロスシー画像圧縮は、デジタル画像の最もよく使われる演算子の1つである。
Invertible Lossy Compression (ILC) と呼ばれる新しい非可逆的フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-22T04:04:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。