論文の概要: Deep Image Compression using Decoder Side Information
- arxiv url: http://arxiv.org/abs/2001.04753v2
- Date: Wed, 29 Jul 2020 15:13:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-11 13:18:10.654061
- Title: Deep Image Compression using Decoder Side Information
- Title(参考訳): デコーダ側情報を用いた深部画像圧縮
- Authors: Sharon Ayzik and Shai Avidan
- Abstract要約: 本稿では,デコーダでのみ利用できるサイド情報に依存するディープイメージ圧縮ニューラルネットワークを提案する。
提案アルゴリズムを複数の画像圧縮アルゴリズムと比較し,デコーダのみの側情報の追加が結果を改善することを示す。
- 参考スコア(独自算出の注目度): 23.237308265907377
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a Deep Image Compression neural network that relies on side
information, which is only available to the decoder. We base our algorithm on
the assumption that the image available to the encoder and the image available
to the decoder are correlated, and we let the network learn these correlations
in the training phase.
Then, at run time, the encoder side encodes the input image without knowing
anything about the decoder side image and sends it to the decoder. The decoder
then uses the encoded input image and the side information image to reconstruct
the original image.
This problem is known as Distributed Source Coding in Information Theory, and
we discuss several use cases for this technology. We compare our algorithm to
several image compression algorithms and show that adding decoder-only side
information does indeed improve results. Our code is publicly available at
https://github.com/ayziksha/DSIN.
- Abstract(参考訳): 本稿では,デコーダにのみ使用可能な,サイド情報に依存するディープイメージ圧縮ニューラルネットワークを提案する。
我々は,エンコーダに利用可能な画像とデコーダに利用可能な画像が相関しているという仮定に基づいて,これらの相関関係をトレーニング段階でネットワークに学習させる。
そして、実行時に、デコーダ側がデコーダ側画像について何も知らずに入力画像をエンコードし、デコーダに送信する。
そして、デコーダは、符号化された入力画像と側情報画像を用いて元の画像を再構成する。
この問題は情報理論における分散ソース符号化(Distributed Source Coding in Information Theory)として知られている。
提案アルゴリズムを複数の画像圧縮アルゴリズムと比較し,デコーダのみの側情報の追加が結果を改善することを示す。
私たちのコードはhttps://github.com/ayziksha/dsinで公開されています。
関連論文リスト
- MISC: Ultra-low Bitrate Image Semantic Compression Driven by Large Multimodal Model [78.4051835615796]
本稿では,マルチモーダル画像セマンティック圧縮法を提案する。
画像の意味情報を抽出するLMMエンコーダと、その意味に対応する領域を特定するマップエンコーダと、非常に圧縮されたビットストリームを生成する画像エンコーダと、前記情報に基づいて画像を再構成するデコーダとからなる。
知覚50%を節約しながら最適な一貫性と知覚結果を達成することができ、これは次世代のストレージと通信において強力な可能性を持つ。
論文 参考訳(メタデータ) (2024-02-26T17:11:11Z) - Perceptual Image Compression with Cooperative Cross-Modal Side
Information [53.356714177243745]
本稿では,テキスト誘導側情報を用いた新しい深層画像圧縮手法を提案する。
具体的には,CLIPテキストエンコーダとSemantic-Spatial Awareブロックを用いてテキストと画像の特徴を融合する。
論文 参考訳(メタデータ) (2023-11-23T08:31:11Z) - Computationally-Efficient Neural Image Compression with Shallow Decoders [43.115831685920114]
本稿では,JPEGに類似した浅い,あるいは線形な復号変換を用いることで,復号化複雑性のギャップを解消する。
我々は、より強力なエンコーダネットワークと反復符号化を採用することにより、符号化と復号の間のしばしば非対称な予算を利用する。
論文 参考訳(メタデータ) (2023-04-13T03:38:56Z) - Neural Distributed Image Compression with Cross-Attention Feature
Alignment [1.2234742322758418]
一対のステレオ画像は、重なり合う視野を持ち、同期および校正された一対のカメラによってキャプチャされる。
1つの画像は圧縮・送信され、もう1つの画像はデコーダでのみ利用できると仮定する。
提案アーキテクチャでは、入力画像をDNNを用いて潜時空間にマッピングし、潜時表現を定量化し、エントロピー符号化を用いて無害に圧縮する。
論文 参考訳(メタデータ) (2022-07-18T10:15:04Z) - COIN++: Data Agnostic Neural Compression [55.27113889737545]
COIN++は、幅広いデータモダリティをシームレスに扱うニューラルネットワーク圧縮フレームワークである。
様々なデータモダリティを圧縮することで,本手法の有効性を示す。
論文 参考訳(メタデータ) (2022-01-30T20:12:04Z) - Small Lesion Segmentation in Brain MRIs with Subpixel Embedding [105.1223735549524]
ヒト脳のMRIスキャンを虚血性脳梗塞と正常組織に分割する方法を提案する。
本稿では,空間展開埋め込みネットワークによって予測を導出する標準エンコーダデコーダの形式でニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-09-18T00:21:17Z) - EncoderMI: Membership Inference against Pre-trained Encoders in
Contrastive Learning [27.54202989524394]
コントラスト学習によって事前訓練された画像エンコーダに対する最初のメンバーシップ推論手法であるMIを提案する。
複数のデータセットで事前学習した画像エンコーダと、OpenAIが収集した4億(画像、テキスト)のペアで事前学習したContrastive Language- Image Pre-training (CLIP)画像エンコーダの評価を行った。
論文 参考訳(メタデータ) (2021-08-25T03:00:45Z) - Deep Stereo Image Compression with Decoder Side Information using Wyner
Common Information [1.5293427903448022]
一対のステレオ画像は、一般的に、重なり合う視野によって互いに高い相関関係を持ち、その対の1つの画像が圧縮され送信されると仮定する。
提案したアーキテクチャでは、エンコーダは入力画像を潜在空間にマッピングし、潜在表現を定量化し、エントロピー符号化を用いて圧縮する。
デコーダは、入力画像と相関画像との間のワイナーの共通情報を後者から抽出するように訓練される。
論文 参考訳(メタデータ) (2021-06-22T12:46:31Z) - Neural Distributed Source Coding [59.630059301226474]
相関構造に依存せず,高次元までスケール可能な損失DSCのためのフレームワークを提案する。
提案手法は,複数のデータセット上で評価し,複雑な相関関係と最先端PSNRを扱えることを示す。
論文 参考訳(メタデータ) (2021-06-05T04:50:43Z) - How to Exploit the Transferability of Learned Image Compression to
Conventional Codecs [25.622863999901874]
本稿では,学習した画像の符号化をサロゲートとして利用して,画像の符号化を最適化する方法を示す。
提案手法は,MS-SSIM歪みをデコードオーバーヘッドを伴わずに20%以上の速度改善で補正するために,従来の画像を再構成することができる。
論文 参考訳(メタデータ) (2020-12-03T12:34:51Z) - Modeling Lost Information in Lossy Image Compression [72.69327382643549]
ロスシー画像圧縮は、デジタル画像の最もよく使われる演算子の1つである。
Invertible Lossy Compression (ILC) と呼ばれる新しい非可逆的フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-22T04:04:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。