論文の概要: What's in the Image? Explorable Decoding of Compressed Images
- arxiv url: http://arxiv.org/abs/2006.09332v2
- Date: Sat, 27 Mar 2021 09:01:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2022-11-20 21:32:44.576295
- Title: What's in the Image? Explorable Decoding of Compressed Images
- Title(参考訳): イメージに何が入ってるの?
圧縮画像の探索可能な復号
- Authors: Yuval Bahat and Tomer Michaeli
- Abstract要約: ユビキタスJPEG標準のための新しいデコーダアーキテクチャを開発し、圧縮された画像の集合をトラバースする。
我々は、グラフィカル、医学的、法医学的なユースケースに関する我々のフレームワークを例示し、その幅広い潜在的な応用を実証する。
- 参考スコア(独自算出の注目度): 45.22726784749359
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The ever-growing amounts of visual contents captured on a daily basis
necessitate the use of lossy compression methods in order to save storage space
and transmission bandwidth. While extensive research efforts are devoted to
improving compression techniques, every method inevitably discards information.
Especially at low bit rates, this information often corresponds to semantically
meaningful visual cues, so that decompression involves significant ambiguity.
In spite of this fact, existing decompression algorithms typically produce only
a single output, and do not allow the viewer to explore the set of images that
map to the given compressed code. In this work we propose the first image
decompression method to facilitate user-exploration of the diverse set of
natural images that could have given rise to the compressed input code, thus
granting users the ability to determine what could and what could not have been
there in the original scene. Specifically, we develop a novel deep-network
based decoder architecture for the ubiquitous JPEG standard, which allows
traversing the set of decompressed images that are consistent with the
compressed JPEG file. To allow for simple user interaction, we develop a
graphical user interface comprising several intuitive exploration tools,
including an automatic tool for examining specific solutions of interest. We
exemplify our framework on graphical, medical and forensic use cases,
demonstrating its wide range of potential applications.
- Abstract(参考訳): 記憶容量と伝送帯域幅を節約するためには、日常的にキャプチャされる視覚的コンテンツの増加は、損失のある圧縮方法を使用する必要がある。
幅広い研究が圧縮技術の改善に費やされている一方で、あらゆる方法が必然的に情報を破棄する。
特に低ビットレートでは、この情報はしばしば意味的に意味のある視覚的手がかりに対応するため、減圧にはかなりの曖昧さが伴う。
この事実にもかかわらず、既存の除圧縮アルゴリズムは、通常、単一の出力しか生成せず、ビューアが与えられた圧縮コードにマップするイメージのセットを探索することができない。
そこで本研究では,圧縮された入力コードに起因した可能性のある多様な自然画像のユーザ展開を容易にする最初の画像除圧縮手法を提案する。
具体的には、ユビキタスJPEG標準のための新しいディープネットワークベースのデコーダアーキテクチャを開発し、圧縮JPEGファイルと整合した圧縮画像のセットをトラバースする。
簡単なユーザインタラクションを可能にするために,我々は,いくつかの直感的な探索ツールを含むグラフィカルユーザインタフェースを開発した。
我々は、グラフィカル、医療、法医学のユースケースに関する我々のフレームワークを例示し、その幅広い潜在的な応用を実証する。
関連論文リスト
- Multiple Latent Space Mapping for Compressed Dark Image Enhancement [51.112925890246444]
既存の暗黒画像強調手法は、圧縮された暗黒画像を入力とし、優れた性能を実現する。
可変オートエンコーダ(VAE)に基づく新しい潜時マッピングネットワークを提案する。
総合的な実験により,提案手法は圧縮暗画像強調における最先端性能を実現することを示した。
論文 参考訳(メタデータ) (2024-03-12T13:05:51Z) - A study on the use of perceptual hashing to detect manipulation of
embedded messages in images [0.0]
この研究は、画像圧縮の損失による意図しない変更と、埋め込みメッセージの悪意的な操作を区別できる埋め込み原理を探索する。
この研究は、整数ウェーブレット変換によるメッセージの埋め込みと、Karhunen-Loeve-transformによる圧縮が最良の結果をもたらすことを示した。
論文 参考訳(メタデータ) (2023-02-28T21:32:49Z) - Metric Learning for Anti-Compression Facial Forgery Detection [32.33501564446107]
新規な抗圧縮顔面フォージェリー検出フレームワークを提案する。
オリジナル版と圧縮版の両方を使って、圧縮に敏感な埋め込み機能空間を学習する。
論文 参考訳(メタデータ) (2021-03-15T14:11:14Z) - Towards Robust Data Hiding Against (JPEG) Compression: A
Pseudo-Differentiable Deep Learning Approach [78.05383266222285]
これらの圧縮に対抗できるデータ隠蔽の目標を達成することは、依然としてオープンな課題である。
ディープラーニングはデータの隠蔽に大きな成功を収めていますが、JPEGの非差別化性は、損失のある圧縮に対する堅牢性を改善するための深いパイプラインのトレーニングを困難にしています。
本稿では,上記の制約をすべて一度に解決するための,単純かつ効果的なアプローチを提案する。
論文 参考訳(メタデータ) (2020-12-30T12:30:09Z) - Soft Compression for Lossless Image Coding [17.714164324169037]
画像に関する新しい概念である圧縮可能なインジケータ関数を提案する。
ソフト圧縮を施すことにより、同じ種類の画像の送受信に必要となる帯域幅とストレージスペースを大幅に削減することが期待される。
論文 参考訳(メタデータ) (2020-12-11T10:59:47Z) - Analyzing and Mitigating JPEG Compression Defects in Deep Learning [69.04777875711646]
本稿では,JPEG圧縮が共通タスクやデータセットに与える影響を統一的に検討する。
高圧縮の一般的なパフォーマンス指標には大きなペナルティがあることが示される。
論文 参考訳(メタデータ) (2020-11-17T20:32:57Z) - Lossy Image Compression with Normalizing Flows [19.817005399746467]
ディープ・イメージ・圧縮のための最先端のソリューションは、通常、入力を低次元の潜在空間にマッピングするオートエンコーダを用いる。
対照的に、画像圧縮における従来のアプローチは、より幅広い品質レベルを実現する。
論文 参考訳(メタデータ) (2020-08-24T14:46:23Z) - Modeling Lost Information in Lossy Image Compression [72.69327382643549]
ロスシー画像圧縮は、デジタル画像の最もよく使われる演算子の1つである。
Invertible Lossy Compression (ILC) と呼ばれる新しい非可逆的フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-22T04:04:56Z) - Discernible Image Compression [124.08063151879173]
本稿では、外観と知覚の整合性の両方を追求し、圧縮画像を作成することを目的とする。
エンコーダ・デコーダ・フレームワークに基づいて,事前学習したCNNを用いて,オリジナル画像と圧縮画像の特徴を抽出する。
ベンチマーク実験により,提案手法を用いて圧縮した画像は,その後の視覚認識・検出モデルでもよく認識できることが示された。
論文 参考訳(メタデータ) (2020-02-17T07:35:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。