論文の概要: Image Compression with Encoder-Decoder Matched Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2101.09642v2
- Date: Sat, 30 Jan 2021 05:50:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-16 09:08:56.145171
- Title: Image Compression with Encoder-Decoder Matched Semantic Segmentation
- Title(参考訳): Encoder-Decoder Matched Semantic Segmentation による画像圧縮
- Authors: Trinh Man Hoang, Jinjia Zhou, Yibo Fan
- Abstract要約: レイヤー画像圧縮は有望な方向です。
セマンティックセグメントを圧縮された画像データと共に送信する作業もある。
エンコーダマッチングセマンティックセグメンテーション(EDMS)を用いた新しいレイヤー画像圧縮フレームワークを提案する。
提案されたEDMSフレームワークは、HEVCベース(BPG)エンコーディング時間よりも最大35.31%のBDレート削減を達成できる。
- 参考スコア(独自算出の注目度): 15.536056887418676
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, layered image compression is demonstrated to be a promising
direction, which encodes a compact representation of the input image and apply
an up-sampling network to reconstruct the image. To further improve the quality
of the reconstructed image, some works transmit the semantic segment together
with the compressed image data. Consequently, the compression ratio is also
decreased because extra bits are required for transmitting the semantic
segment. To solve this problem, we propose a new layered image compression
framework with encoder-decoder matched semantic segmentation (EDMS). And then,
followed by the semantic segmentation, a special convolution neural network is
used to enhance the inaccurate semantic segment. As a result, the accurate
semantic segment can be obtained in the decoder without requiring extra bits.
The experimental results show that the proposed EDMS framework can get up to
35.31% BD-rate reduction over the HEVC-based (BPG) codec, 5% bitrate, and 24%
encoding time saving compare to the state-of-the-art semantic-based image
codec.
- Abstract(参考訳): 近年,層状画像圧縮は,入力画像のコンパクトな表現を符号化し,アップサンプリングネットワークを用いて画像再構成を行う,有望な方向であることが実証されている。
再構成画像の品質をさらに向上するため、圧縮画像データとともに意味セグメントを送信する作業もある。
これにより、セマンティックセグメントの送信に余分なビットを必要とするため、圧縮比も低下する。
そこで本研究では,エンコーダ・デコーダマッチングセマンティックセグメンテーション(EDMS)を用いた新しい層画像圧縮フレームワークを提案する。
そして、セマンティックセグメンテーションに続いて、不正確なセマンティックセグメンテーションを強化するために特別な畳み込みニューラルネットワークが使用される。
これにより、余分なビットを必要とせずに、正確な意味セグメントをデコーダで得ることができる。
実験結果から,提案したEDMSフレームワークはHEVC(BPG)コーデックよりも最大35.31%のBDレートを削減でき,5%ビットレート,24%エンコーディング時間は最先端のセマンティックベース画像コーデックと比較できることがわかった。
関連論文リスト
- MISC: Ultra-low Bitrate Image Semantic Compression Driven by Large Multimodal Model [78.4051835615796]
本稿では,マルチモーダル画像セマンティック圧縮法を提案する。
画像の意味情報を抽出するLMMエンコーダと、その意味に対応する領域を特定するマップエンコーダと、非常に圧縮されたビットストリームを生成する画像エンコーダと、前記情報に基づいて画像を再構成するデコーダとからなる。
知覚50%を節約しながら最適な一貫性と知覚結果を達成することができ、これは次世代のストレージと通信において強力な可能性を持つ。
論文 参考訳(メタデータ) (2024-02-26T17:11:11Z) - Extreme Image Compression using Fine-tuned VQGANs [43.43014096929809]
本稿ではベクトル量子化(VQ)に基づく生成モデルを画像圧縮領域に導入する。
VQGANモデルによって学習されたコードブックは、強い表現能力をもたらす。
提案したフレームワークは、知覚的品質指向のメトリクスで最先端のコーデックより優れている。
論文 参考訳(メタデータ) (2023-07-17T06:14:19Z) - Cross Modal Compression: Towards Human-comprehensible Semantic
Compression [73.89616626853913]
クロスモーダル圧縮は、視覚データのためのセマンティック圧縮フレームワークである。
提案したCMCは,超高圧縮比で再現性の向上が期待できることを示す。
論文 参考訳(メタデータ) (2022-09-06T15:31:11Z) - Semantic Segmentation in Learned Compressed Domain [21.53261818914534]
セグメント化タスクを改善するために,圧縮された領域に基づく手法を提案する。
2つの異なるモジュールを探索、解析し、圧縮された表現をセグメンテーションネットワークの特徴として変換するのに役立つ。
論文 参考訳(メタデータ) (2022-09-03T07:59:34Z) - Reducing Redundancy in the Bottleneck Representation of the Autoencoders [98.78384185493624]
オートエンコーダは教師なしニューラルネットワークの一種であり、様々なタスクを解くのに使用できる。
本稿では,ボトルネック表現における特徴冗長性を明示的に罰する手法を提案する。
我々は,3つの異なるデータセットを用いた次元削減,MNISTデータセットを用いた画像圧縮,ファッションMNISTを用いた画像デノナイズという,さまざまなタスクにまたがってアプローチを検証した。
論文 参考訳(メタデータ) (2022-02-09T18:48:02Z) - A New Image Codec Paradigm for Human and Machine Uses [53.48873918537017]
本研究では,人間用と機械用の両方にスケーラブルな画像パラダイムを提案する。
高レベルのインスタンスセグメンテーションマップと低レベルの信号特徴をニューラルネットワークで抽出する。
画像は16ビットのグレースケールプロファイルと信号特徴を持つ一般的な画質のイメージ再構成を実現するために設計および訓練される。
論文 参考訳(メタデータ) (2021-12-19T06:17:38Z) - Enhanced Standard Compatible Image Compression Framework based on
Auxiliary Codec Networks [8.440333621142226]
Auxiliary Codec Networks (ACNs) に基づく新しい標準互換画像圧縮フレームワークを提案する。
ACNは、既存の画像劣化操作を模倣するように設計されており、コンパクトな表現ネットワークにより正確な勾配を提供する。
本稿では,JPEGおよび高効率ビデオ符号化(HEVC)標準に基づく提案フレームワークが,既存の画像圧縮アルゴリズムを標準互換性で大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2020-09-30T15:42:06Z) - Modeling Lost Information in Lossy Image Compression [72.69327382643549]
ロスシー画像圧縮は、デジタル画像の最もよく使われる演算子の1つである。
Invertible Lossy Compression (ILC) と呼ばれる新しい非可逆的フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-22T04:04:56Z) - Learning Better Lossless Compression Using Lossy Compression [100.50156325096611]
我々は、ロスレス画像圧縮システムを構築するために、強力なロスレス画像圧縮アルゴリズムであるBPGを利用する。
我々は,BPG再構成を条件とした畳み込みニューラルネットワークに基づく確率モデルを用いて,残差分布をモデル化する。
そして、この画像は、BPGが生成したビットストリームと学習した残留コーダの連結を用いて保存される。
論文 参考訳(メタデータ) (2020-03-23T11:21:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。