論文の概要: Learning-Driven Lossy Image Compression; A Comprehensive Survey
- arxiv url: http://arxiv.org/abs/2201.09240v1
- Date: Sun, 23 Jan 2022 12:11:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-26 11:14:40.736413
- Title: Learning-Driven Lossy Image Compression; A Comprehensive Survey
- Title(参考訳): 学習駆動型損失画像圧縮 : 包括的調査
- Authors: Sonain Jamil, Md. Jalil Piran, and MuhibUrRahman
- Abstract要約: 本稿では、機械学習(ML)アーキテクチャを用いて、画像圧縮の損失を主に生かした最近の技術について調査することを目的とする。
すべてのアルゴリズムをアーキテクチャに基づいて複数のグループに分けます。
研究者の様々な発見が強調され、研究者の今後の方向性が示唆されている。
- 参考スコア(独自算出の注目度): 3.1761172592339375
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the realm of image processing and computer vision (CV), machine learning
(ML) architectures are widely applied. Convolutional neural networks (CNNs)
solve a wide range of image processing issues and can solve image compression
problem. Compression of images is necessary due to bandwidth and memory
constraints. Helpful, redundant, and irrelevant information are three different
forms of information found in images. This paper aims to survey recent
techniques utilizing mostly lossy image compression using ML architectures
including different auto-encoders (AEs) such as convolutional auto-encoders
(CAEs), variational auto-encoders (VAEs), and AEs with hyper-prior models,
recurrent neural networks (RNNs), CNNs, generative adversarial networks (GANs),
principal component analysis (PCA) and fuzzy means clustering. We divide all of
the algorithms into several groups based on architecture. We cover still image
compression in this survey. Various discoveries for the researchers are
emphasized and possible future directions for researchers. The open research
problems such as out of memory (OOM), striped region distortion (SRD),
aliasing, and compatibility of the frameworks with central processing unit
(CPU) and graphics processing unit (GPU) simultaneously are explained. The
majority of the publications in the compression domain surveyed are from the
previous five years and use a variety of approaches.
- Abstract(参考訳): 画像処理とコンピュータビジョン(CV)の分野では、機械学習(ML)アーキテクチャが広く採用されている。
畳み込みニューラルネットワーク(CNN)は、幅広い画像処理問題を解き、画像圧縮問題を解くことができる。
画像の圧縮は帯域幅とメモリ制約のため必要である。
ヘルプで冗長で無関係な情報は、画像に見られる3種類の情報である。
本稿では、畳み込みオートエンコーダ(CAE)、変分オートエンコーダ(VAE)、高次モデルを持つAE、リカレントニューラルネットワーク(RNN)、CNN、生成逆数ネットワーク(GAN)、主成分分析(PCA)、ファジィ平均クラスタリングなど、MLアーキテクチャを用いて、主に損失の多い画像圧縮を利用した最近の技術を検討することを目的とする。
すべてのアルゴリズムをアーキテクチャに基づいて複数のグループに分けます。
この調査では静止画像圧縮について取り上げる。
研究者の様々な発見が強調され、研究者の今後の方向性が示唆されている。
out of memory(oom)、ストライプ領域歪み(srd)、エイリアス(エイリアス)、中央処理ユニット(cpu)とgpu(gpu)を同時に使用するフレームワークの互換性といったオープンリサーチの問題について解説する。
調査対象となった圧縮ドメインの出版物の大部分は,過去5年間のもので,さまざまなアプローチを採用している。
関連論文リスト
- Deep learning based Image Compression for Microscopy Images: An
Empirical Study [3.915183869199319]
本研究では,古典的および深層学習に基づく画像圧縮法とその深層学習に基づく画像処理モデルへの影響について分析する。
このような所望の方法で画像を圧縮するには、複数の古典的損失画像圧縮技術と、複数のAIベースの圧縮モデルを比較する。
その結果、AIベースの圧縮技術は従来の圧縮技術よりも優れており、2Dケースでは下流のラベルなしタスクに最小限の影響を及ぼすことがわかった。
論文 参考訳(メタデータ) (2023-11-02T16:00:32Z) - Convolutional Neural Network (CNN) to reduce construction loss in JPEG
compression caused by Discrete Fourier Transform (DFT) [0.0]
畳み込みニューラルネットワーク(CNN)は他の多くのディープニューラルネットワークよりも注目されている。
本研究では,オートエンコーダを用いた効率的な画像圧縮手法を提案する。
論文 参考訳(メタデータ) (2022-08-26T12:46:16Z) - Meta-Learning Sparse Compression Networks [44.30642520752235]
近年のDeep Learningの研究は、座標空間から基礎となる連続信号への写像としてのデータ表現を再定義している。
Inlicit Neural Representation (INRs) に関する最近の研究は、アーキテクチャ探索に注意を払って、INRが確立された圧縮手法より優れていることを示した。
論文 参考訳(メタデータ) (2022-05-18T14:31:43Z) - Learning Enriched Features for Fast Image Restoration and Enhancement [166.17296369600774]
本稿では,ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とする。
我々は、高解像度の空間的詳細を同時に保存しながら、複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
提案手法は,デフォーカス・デブロアリング,画像デノイング,超解像,画像強調など,さまざまな画像処理タスクに対して,最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2022-04-19T17:59:45Z) - The Devil Is in the Details: Window-based Attention for Image
Compression [58.1577742463617]
既存の学習画像圧縮モデルは畳み込みニューラルネットワーク(CNN)に基づいている。
本稿では,複数種類の注意機構が局所特徴学習に与える影響について検討し,より単純で効果的なウィンドウベースの局所的注意ブロックを提案する。
提案されたウィンドウベースのアテンションは非常に柔軟で、CNNとTransformerモデルを強化するためのプラグイン・アンド・プレイコンポーネントとして機能する可能性がある。
論文 参考訳(メタデータ) (2022-03-16T07:55:49Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - Image Compression with Recurrent Neural Network and Generalized Divisive
Normalization [3.0204520109309843]
深層学習は研究コミュニティから大きな注目を集め、将来有望な画像再構成結果を生み出している。
近年の手法は、ネットワークの複雑さを大幅に増大させる、より深い複雑なネットワークの開発に焦点を当てている。
本稿では、畳み込み層を用いた解析とブロック合成と、可変レートエンコーダとデコーダ側における一般化分割正規化(GDN)の2つの有効な新しいブロックを開発する。
論文 参考訳(メタデータ) (2021-09-05T05:31:55Z) - An Implementation of Vector Quantization using the Genetic Algorithm
Approach [0.0]
本稿では,ニューラルネットワーク,残留学習,ファジィニューラルネットワーク,畳み込みニューラルネットワーク,ディープラーニング,遺伝的アルゴリズムなどの手法を用いた画像圧縮アルゴリズムの実装について述べる。
また,Lossy画像圧縮に用いるコードブックを生成するために,GAを用いたベクトル量子化の実装についても述べる。
論文 参考訳(メタデータ) (2021-02-16T03:57:13Z) - CNNs for JPEGs: A Study in Computational Cost [49.97673761305336]
畳み込みニューラルネットワーク(CNN)は過去10年間で驚くべき進歩を遂げてきた。
CNNはRGBピクセルから直接データの堅牢な表現を学習することができる。
近年,圧縮領域から直接学習できる深層学習手法が注目されている。
論文 参考訳(メタデータ) (2020-12-26T15:00:10Z) - Analyzing and Mitigating JPEG Compression Defects in Deep Learning [69.04777875711646]
本稿では,JPEG圧縮が共通タスクやデータセットに与える影響を統一的に検討する。
高圧縮の一般的なパフォーマンス指標には大きなペナルティがあることが示される。
論文 参考訳(メタデータ) (2020-11-17T20:32:57Z) - Learning End-to-End Lossy Image Compression: A Benchmark [90.35363142246806]
まず,学習した画像の圧縮方法に関する総合的な文献調査を行う。
本稿では,最先端の学習画像圧縮手法のマイルストーンについて述べるとともに,既存の幅広い作品について概観し,その歴史的開発ルートについて考察する。
エントロピー推定と信号再構成のための粗大な超高次モデルを導入することにより、速度歪み性能の向上を実現する。
論文 参考訳(メタデータ) (2020-02-10T13:13:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。