論文の概要: Learning-Driven Lossy Image Compression; A Comprehensive Survey
- arxiv url: http://arxiv.org/abs/2201.09240v1
- Date: Sun, 23 Jan 2022 12:11:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-26 11:14:40.736413
- Title: Learning-Driven Lossy Image Compression; A Comprehensive Survey
- Title(参考訳): 学習駆動型損失画像圧縮 : 包括的調査
- Authors: Sonain Jamil, Md. Jalil Piran, and MuhibUrRahman
- Abstract要約: 本稿では、機械学習(ML)アーキテクチャを用いて、画像圧縮の損失を主に生かした最近の技術について調査することを目的とする。
すべてのアルゴリズムをアーキテクチャに基づいて複数のグループに分けます。
研究者の様々な発見が強調され、研究者の今後の方向性が示唆されている。
- 参考スコア(独自算出の注目度): 3.1761172592339375
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the realm of image processing and computer vision (CV), machine learning
(ML) architectures are widely applied. Convolutional neural networks (CNNs)
solve a wide range of image processing issues and can solve image compression
problem. Compression of images is necessary due to bandwidth and memory
constraints. Helpful, redundant, and irrelevant information are three different
forms of information found in images. This paper aims to survey recent
techniques utilizing mostly lossy image compression using ML architectures
including different auto-encoders (AEs) such as convolutional auto-encoders
(CAEs), variational auto-encoders (VAEs), and AEs with hyper-prior models,
recurrent neural networks (RNNs), CNNs, generative adversarial networks (GANs),
principal component analysis (PCA) and fuzzy means clustering. We divide all of
the algorithms into several groups based on architecture. We cover still image
compression in this survey. Various discoveries for the researchers are
emphasized and possible future directions for researchers. The open research
problems such as out of memory (OOM), striped region distortion (SRD),
aliasing, and compatibility of the frameworks with central processing unit
(CPU) and graphics processing unit (GPU) simultaneously are explained. The
majority of the publications in the compression domain surveyed are from the
previous five years and use a variety of approaches.
- Abstract(参考訳): 画像処理とコンピュータビジョン(CV)の分野では、機械学習(ML)アーキテクチャが広く採用されている。
畳み込みニューラルネットワーク(CNN)は、幅広い画像処理問題を解き、画像圧縮問題を解くことができる。
画像の圧縮は帯域幅とメモリ制約のため必要である。
ヘルプで冗長で無関係な情報は、画像に見られる3種類の情報である。
本稿では、畳み込みオートエンコーダ(CAE)、変分オートエンコーダ(VAE)、高次モデルを持つAE、リカレントニューラルネットワーク(RNN)、CNN、生成逆数ネットワーク(GAN)、主成分分析(PCA)、ファジィ平均クラスタリングなど、MLアーキテクチャを用いて、主に損失の多い画像圧縮を利用した最近の技術を検討することを目的とする。
すべてのアルゴリズムをアーキテクチャに基づいて複数のグループに分けます。
この調査では静止画像圧縮について取り上げる。
研究者の様々な発見が強調され、研究者の今後の方向性が示唆されている。
out of memory(oom)、ストライプ領域歪み(srd)、エイリアス(エイリアス)、中央処理ユニット(cpu)とgpu(gpu)を同時に使用するフレームワークの互換性といったオープンリサーチの問題について解説する。
調査対象となった圧縮ドメインの出版物の大部分は,過去5年間のもので,さまざまなアプローチを採用している。
関連論文リスト
- Bottleneck-based Encoder-decoder ARchitecture (BEAR) for Learning Unbiased Consumer-to-Consumer Image Representations [0.6990493129893112]
本稿では,残差接続と連携して自動エンコーダ構成の知覚画像情報を符号化する,異なる画像特徴抽出機構を提案する。
予備的な結果は、提案アーキテクチャが、識別される重要な課題を解決するために、我々のデータや他の画像データセットを用いてリッチな空間を学習できることを示唆している。
論文 参考訳(メタデータ) (2024-09-10T03:31:18Z) - Computer Vision Model Compression Techniques for Embedded Systems: A Survey [75.38606213726906]
本稿では,コンピュータビジョンタスクに適用される主モデル圧縮技術について述べる。
本稿では,圧縮サブ領域の特性について述べるとともに,異なるアプローチを比較し,最適な手法を選択する方法について論じる。
初期の実装課題を克服する上で、研究者や新しい実践者を支援するためのコードも共有しています。
論文 参考訳(メタデータ) (2024-08-15T16:41:55Z) - UniCompress: Enhancing Multi-Data Medical Image Compression with Knowledge Distillation [59.3877309501938]
Inlicit Neural Representation (INR) ネットワークは、その柔軟な圧縮比のため、顕著な汎用性を示している。
周波数領域情報を含むコードブックをINRネットワークへの事前入力として導入する。
これにより、INRの表現力が向上し、異なる画像ブロックに対して特異な条件付けが提供される。
論文 参考訳(メタデータ) (2024-05-27T05:52:13Z) - Deep learning based Image Compression for Microscopy Images: An
Empirical Study [3.915183869199319]
本研究では,古典的および深層学習に基づく画像圧縮法とその深層学習に基づく画像処理モデルへの影響について分析する。
このような所望の方法で画像を圧縮するには、複数の古典的損失画像圧縮技術と、複数のAIベースの圧縮モデルを比較する。
その結果、AIベースの圧縮技術は従来の圧縮技術よりも優れており、2Dケースでは下流のラベルなしタスクに最小限の影響を及ぼすことがわかった。
論文 参考訳(メタデータ) (2023-11-02T16:00:32Z) - Convolutional Neural Network (CNN) to reduce construction loss in JPEG
compression caused by Discrete Fourier Transform (DFT) [0.0]
畳み込みニューラルネットワーク(CNN)は他の多くのディープニューラルネットワークよりも注目されている。
本研究では,オートエンコーダを用いた効率的な画像圧縮手法を提案する。
論文 参考訳(メタデータ) (2022-08-26T12:46:16Z) - Learning Enriched Features for Fast Image Restoration and Enhancement [166.17296369600774]
本稿では,ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とする。
我々は、高解像度の空間的詳細を同時に保存しながら、複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
提案手法は,デフォーカス・デブロアリング,画像デノイング,超解像,画像強調など,さまざまな画像処理タスクに対して,最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2022-04-19T17:59:45Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - Image Compression with Recurrent Neural Network and Generalized Divisive
Normalization [3.0204520109309843]
深層学習は研究コミュニティから大きな注目を集め、将来有望な画像再構成結果を生み出している。
近年の手法は、ネットワークの複雑さを大幅に増大させる、より深い複雑なネットワークの開発に焦点を当てている。
本稿では、畳み込み層を用いた解析とブロック合成と、可変レートエンコーダとデコーダ側における一般化分割正規化(GDN)の2つの有効な新しいブロックを開発する。
論文 参考訳(メタデータ) (2021-09-05T05:31:55Z) - An Implementation of Vector Quantization using the Genetic Algorithm
Approach [0.0]
本稿では,ニューラルネットワーク,残留学習,ファジィニューラルネットワーク,畳み込みニューラルネットワーク,ディープラーニング,遺伝的アルゴリズムなどの手法を用いた画像圧縮アルゴリズムの実装について述べる。
また,Lossy画像圧縮に用いるコードブックを生成するために,GAを用いたベクトル量子化の実装についても述べる。
論文 参考訳(メタデータ) (2021-02-16T03:57:13Z) - CNNs for JPEGs: A Study in Computational Cost [49.97673761305336]
畳み込みニューラルネットワーク(CNN)は過去10年間で驚くべき進歩を遂げてきた。
CNNはRGBピクセルから直接データの堅牢な表現を学習することができる。
近年,圧縮領域から直接学習できる深層学習手法が注目されている。
論文 参考訳(メタデータ) (2020-12-26T15:00:10Z) - Learning End-to-End Lossy Image Compression: A Benchmark [90.35363142246806]
まず,学習した画像の圧縮方法に関する総合的な文献調査を行う。
本稿では,最先端の学習画像圧縮手法のマイルストーンについて述べるとともに,既存の幅広い作品について概観し,その歴史的開発ルートについて考察する。
エントロピー推定と信号再構成のための粗大な超高次モデルを導入することにより、速度歪み性能の向上を実現する。
論文 参考訳(メタデータ) (2020-02-10T13:13:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。