論文の概要: Deep Stereo Image Compression with Decoder Side Information using Wyner
Common Information
- arxiv url: http://arxiv.org/abs/2106.11723v1
- Date: Tue, 22 Jun 2021 12:46:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-23 14:39:45.989274
- Title: Deep Stereo Image Compression with Decoder Side Information using Wyner
Common Information
- Title(参考訳): ワイナー共通情報を用いたデコーダ側情報を用いた深部ステレオ画像圧縮
- Authors: Nitish Mital, Ezgi Ozyilkan, Ali Garjani, Deniz Gunduz
- Abstract要約: 一対のステレオ画像は、一般的に、重なり合う視野によって互いに高い相関関係を持ち、その対の1つの画像が圧縮され送信されると仮定する。
提案したアーキテクチャでは、エンコーダは入力画像を潜在空間にマッピングし、潜在表現を定量化し、エントロピー符号化を用いて圧縮する。
デコーダは、入力画像と相関画像との間のワイナーの共通情報を後者から抽出するように訓練される。
- 参考スコア(独自算出の注目度): 1.5293427903448022
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a novel deep neural network (DNN) architecture for compressing an
image when a correlated image is available as side information only at the
decoder. This problem is known as distributed source coding (DSC) in
information theory. In particular, we consider a pair of stereo images, which
generally have high correlation with each other due to overlapping fields of
view, and assume that one image of the pair is to be compressed and
transmitted, while the other image is available only at the decoder. In the
proposed architecture, the encoder maps the input image to a latent space,
quantizes the latent representation, and compresses it using entropy coding.
The decoder is trained to extract the Wyner's common information between the
input image and the correlated image from the latter. The received latent
representation and the locally generated common information are passed through
a decoder network to obtain an enhanced reconstruction of the input image. The
common information provides a succinct representation of the relevant
information at the receiver. We train and demonstrate the effectiveness of the
proposed approach on the KITTI dataset of stereo image pairs. Our results show
that the proposed architecture is capable of exploiting the decoder-only side
information, and outperforms previous work on stereo image compression with
decoder side information.
- Abstract(参考訳): 本稿では,デコーダの側情報として相関画像が利用できる場合に,画像の圧縮を行う新しいディープニューラルネットワーク(DNN)アーキテクチャを提案する。
この問題は情報理論において分散ソース符号化(DSC)として知られている。
特に、重なり合う視野のため、一般的に互いに高い相関関係を持つ一対のステレオ画像を検討し、ペアの一方の画像を圧縮して送信し、もう一方のイメージはデコーダでのみ利用可能であると仮定する。
提案するアーキテクチャでは、エンコーダは入力画像を潜在空間にマッピングし、潜在表現を量子化し、エントロピー符号化を用いて圧縮する。
デコーダは、入力画像と相関画像との間のワイナーの共通情報を後者から抽出するように訓練される。
受信した潜在表現とローカルに生成された共通情報はデコーダネットワークに渡され、入力画像の再構成が強化される。
共通情報は、受信機における関連情報の簡潔な表現を提供する。
ステレオ画像ペアのKITTIデータセット上で,提案手法の有効性を訓練し,実証する。
この結果から,提案アーキテクチャはデコーダのみの側情報を利用することができ,デコーダ側情報を用いたステレオ画像圧縮において,従来よりも優れた性能を示した。
関連論文リスト
- Content-aware Masked Image Modeling Transformer for Stereo Image Compression [15.819672238043786]
本稿では,CAMSICというステレオ画像圧縮フレームワークを提案する。
CAMSICは各画像を潜在表現に変換し、強力なデコーダフリートランスフォーマーエントロピーモデルを用いる。
実験により,本フレームワークは2つのステレオ画像データセット上で,最先端の速度歪み性能を実現することが示された。
論文 参考訳(メタデータ) (2024-03-13T13:12:57Z) - MISC: Ultra-low Bitrate Image Semantic Compression Driven by Large Multimodal Model [78.4051835615796]
本稿では,マルチモーダル画像セマンティック圧縮法を提案する。
画像の意味情報を抽出するLMMエンコーダと、その意味に対応する領域を特定するマップエンコーダと、非常に圧縮されたビットストリームを生成する画像エンコーダと、前記情報に基づいて画像を再構成するデコーダとからなる。
知覚50%を節約しながら最適な一貫性と知覚結果を達成することができ、これは次世代のストレージと通信において強力な可能性を持つ。
論文 参考訳(メタデータ) (2024-02-26T17:11:11Z) - Neural Distributed Image Compression with Cross-Attention Feature
Alignment [1.2234742322758418]
一対のステレオ画像は、重なり合う視野を持ち、同期および校正された一対のカメラによってキャプチャされる。
1つの画像は圧縮・送信され、もう1つの画像はデコーダでのみ利用できると仮定する。
提案アーキテクチャでは、入力画像をDNNを用いて潜時空間にマッピングし、潜時表現を定量化し、エントロピー符号化を用いて無害に圧縮する。
論文 参考訳(メタデータ) (2022-07-18T10:15:04Z) - Reducing Redundancy in the Bottleneck Representation of the Autoencoders [98.78384185493624]
オートエンコーダは教師なしニューラルネットワークの一種であり、様々なタスクを解くのに使用できる。
本稿では,ボトルネック表現における特徴冗長性を明示的に罰する手法を提案する。
我々は,3つの異なるデータセットを用いた次元削減,MNISTデータセットを用いた画像圧縮,ファッションMNISTを用いた画像デノナイズという,さまざまなタスクにまたがってアプローチを検証した。
論文 参考訳(メタデータ) (2022-02-09T18:48:02Z) - A New Image Codec Paradigm for Human and Machine Uses [53.48873918537017]
本研究では,人間用と機械用の両方にスケーラブルな画像パラダイムを提案する。
高レベルのインスタンスセグメンテーションマップと低レベルの信号特徴をニューラルネットワークで抽出する。
画像は16ビットのグレースケールプロファイルと信号特徴を持つ一般的な画質のイメージ再構成を実現するために設計および訓練される。
論文 参考訳(メタデータ) (2021-12-19T06:17:38Z) - Transformer-based Image Compression [18.976159633970177]
Transformer-based Image Compression (TIC) アプローチは、標準変分オートエンコーダ(VAE)アーキテクチャをメインおよびハイパーエンコーダデコーダのペアで再利用する。
TICは、Deep Convolutional Neural Network(CNN)ベースの学習画像符号化(lic)メソッドや、最近承認されたVersatile Video Coding(VVC)標準のハンドクラフトルールベースの内部プロファイルなど、最先端のアプローチと競合する。
論文 参考訳(メタデータ) (2021-11-12T13:13:20Z) - Small Lesion Segmentation in Brain MRIs with Subpixel Embedding [105.1223735549524]
ヒト脳のMRIスキャンを虚血性脳梗塞と正常組織に分割する方法を提案する。
本稿では,空間展開埋め込みネットワークによって予測を導出する標準エンコーダデコーダの形式でニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-09-18T00:21:17Z) - Neural Distributed Source Coding [59.630059301226474]
相関構造に依存せず,高次元までスケール可能な損失DSCのためのフレームワークを提案する。
提案手法は,複数のデータセット上で評価し,複雑な相関関係と最先端PSNRを扱えることを示す。
論文 参考訳(メタデータ) (2021-06-05T04:50:43Z) - Modeling Lost Information in Lossy Image Compression [72.69327382643549]
ロスシー画像圧縮は、デジタル画像の最もよく使われる演算子の1つである。
Invertible Lossy Compression (ILC) と呼ばれる新しい非可逆的フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-22T04:04:56Z) - Deep Image Compression using Decoder Side Information [23.237308265907377]
本稿では,デコーダでのみ利用できるサイド情報に依存するディープイメージ圧縮ニューラルネットワークを提案する。
提案アルゴリズムを複数の画像圧縮アルゴリズムと比較し,デコーダのみの側情報の追加が結果を改善することを示す。
論文 参考訳(メタデータ) (2020-01-14T12:55:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。