論文の概要: Image Compression using only Attention based Neural Networks
- arxiv url: http://arxiv.org/abs/2310.11265v1
- Date: Tue, 17 Oct 2023 13:38:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-18 15:38:16.024408
- Title: Image Compression using only Attention based Neural Networks
- Title(参考訳): 注意型ニューラルネットワークのみを用いた画像圧縮
- Authors: Natacha Luka, Romain Negrel and David Picard
- Abstract要約: クロスアテンションによりパッチ情報を集約する学習画像クエリの概念を導入し,次いで量子化と符号化手法を提案する。
我々の研究は、人気のあるKodak、DIV2K、CLICデータセット間の畳み込みのないアーキテクチャによって達成された競合性能を示しています。
- 参考スコア(独自算出の注目度): 13.126014437648612
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent research, Learned Image Compression has gained prominence for its
capacity to outperform traditional handcrafted pipelines, especially at low
bit-rates. While existing methods incorporate convolutional priors with
occasional attention blocks to address long-range dependencies, recent advances
in computer vision advocate for a transformative shift towards fully
transformer-based architectures grounded in the attention mechanism. This paper
investigates the feasibility of image compression exclusively using attention
layers within our novel model, QPressFormer. We introduce the concept of
learned image queries to aggregate patch information via cross-attention,
followed by quantization and coding techniques. Through extensive evaluations,
our work demonstrates competitive performance achieved by convolution-free
architectures across the popular Kodak, DIV2K, and CLIC datasets.
- Abstract(参考訳): 最近の研究で、Learned Image Compressionは従来の手作りパイプライン、特に低ビットレートのパイプラインを上回る能力で有名になった。
既存の手法では畳み込み前処理と時折アテンションブロックを組み込んで長距離依存に対処するが、コンピュータビジョンの最近の進歩はアテンション機構に基づく完全トランスフォーマーベースのアーキテクチャへの転換を提唱している。
本稿では,新しいモデルQPressFormerにおける注目層のみを用いた画像圧縮の実現可能性について検討する。
クロスアテンションによりパッチ情報を集約する学習画像クエリの概念を導入し,次いで量子化と符号化手法を提案する。
広範な評価を通じて,我々の研究は,人気のkodak,div2k,clicデータセットにわたる畳み込みフリーアーキテクチャによって達成された競合性能を示す。
関連論文リスト
- UniCompress: Enhancing Multi-Data Medical Image Compression with Knowledge Distillation [59.3877309501938]
Inlicit Neural Representation (INR) ネットワークは、その柔軟な圧縮比のため、顕著な汎用性を示している。
周波数領域情報を含むコードブックをINRネットワークへの事前入力として導入する。
これにより、INRの表現力が向上し、異なる画像ブロックに対して特異な条件付けが提供される。
論文 参考訳(メタデータ) (2024-05-27T05:52:13Z) - Transferable Learned Image Compression-Resistant Adversarial Perturbations [66.46470251521947]
敵対的攻撃は容易に画像分類システムを破壊し、DNNベースの認識タスクの脆弱性を明らかにする。
我々は、学習した画像圧縮機を前処理モジュールとして利用する画像分類モデルをターゲットにした新しいパイプラインを提案する。
論文 参考訳(メタデータ) (2024-01-06T03:03:28Z) - Cross Modal Compression: Towards Human-comprehensible Semantic
Compression [73.89616626853913]
クロスモーダル圧縮は、視覚データのためのセマンティック圧縮フレームワークである。
提案したCMCは,超高圧縮比で再現性の向上が期待できることを示す。
論文 参考訳(メタデータ) (2022-09-06T15:31:11Z) - The Devil Is in the Details: Window-based Attention for Image
Compression [58.1577742463617]
既存の学習画像圧縮モデルは畳み込みニューラルネットワーク(CNN)に基づいている。
本稿では,複数種類の注意機構が局所特徴学習に与える影響について検討し,より単純で効果的なウィンドウベースの局所的注意ブロックを提案する。
提案されたウィンドウベースのアテンションは非常に柔軟で、CNNとTransformerモデルを強化するためのプラグイン・アンド・プレイコンポーネントとして機能する可能性がある。
論文 参考訳(メタデータ) (2022-03-16T07:55:49Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - Joint Global and Local Hierarchical Priors for Learned Image Compression [30.44884350320053]
近年,従来の手書き画像コーデックと比較して,学習画像圧縮法の性能が向上している。
本稿では,ローカル情報とグローバル情報の両方をコンテンツに依存した方法で活用する,情報変換(Information Transformer, Informer)と呼ばれる新しいエントロピーモデルを提案する。
実験により,Informer はKodak および Tecnick データセットの最先端手法よりも速度歪み性能が向上することを示した。
論文 参考訳(メタデータ) (2021-12-08T06:17:37Z) - Enhanced Invertible Encoding for Learned Image Compression [40.21904131503064]
本稿では,改良されたインバーチブルを提案する。
非可逆ニューラルネットワーク(INN)によるネットワークは、情報損失問題を大幅に軽減し、圧縮性を向上する。
Kodak, CLIC, Tecnick のデータセットによる実験結果から,本手法は既存の学習画像圧縮法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2021-08-08T17:32:10Z) - Learning End-to-End Lossy Image Compression: A Benchmark [90.35363142246806]
まず,学習した画像の圧縮方法に関する総合的な文献調査を行う。
本稿では,最先端の学習画像圧縮手法のマイルストーンについて述べるとともに,既存の幅広い作品について概観し,その歴史的開発ルートについて考察する。
エントロピー推定と信号再構成のための粗大な超高次モデルを導入することにより、速度歪み性能の向上を実現する。
論文 参考訳(メタデータ) (2020-02-10T13:13:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。