論文の概要: Deep Optimized Multiple Description Image Coding via Scalar Quantization
Learning
- arxiv url: http://arxiv.org/abs/2001.03851v1
- Date: Sun, 12 Jan 2020 05:03:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-12 04:59:25.570466
- Title: Deep Optimized Multiple Description Image Coding via Scalar Quantization
Learning
- Title(参考訳): スカラー量子化学習による深層最適化多重記述画像符号化
- Authors: Lijun Zhao, Huihui Bai, Anhong Wang, Yao Zhao
- Abstract要約: 多重記述(MD)圧縮損失を最小限に抑えることで最適化された深層多重記述符号化(MDC)フレームワークを提案する。
これら2種類のネットワークからなる自動エンコーダネットワークを対称パラメータ共有構造として設計する。
我々のフレームワークは、いくつかの一般的なデータセットでテストした場合、画像符号化効率に関する最先端のMDCアプローチよりも優れている。
- 参考スコア(独自算出の注目度): 37.00592782976494
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: In this paper, we introduce a deep multiple description coding (MDC)
framework optimized by minimizing multiple description (MD) compressive loss.
First, MD multi-scale-dilated encoder network generates multiple description
tensors, which are discretized by scalar quantizers, while these quantized
tensors are decompressed by MD cascaded-ResBlock decoder networks. To greatly
reduce the total amount of artificial neural network parameters, an
auto-encoder network composed of these two types of network is designed as a
symmetrical parameter sharing structure. Second, this autoencoder network and a
pair of scalar quantizers are simultaneously learned in an end-to-end
self-supervised way. Third, considering the variation in the image spatial
distribution, each scalar quantizer is accompanied by an importance-indicator
map to generate MD tensors, rather than using direct quantization. Fourth, we
introduce the multiple description structural similarity distance loss, which
implicitly regularizes the diversified multiple description generations, to
explicitly supervise multiple description diversified decoding in addition to
MD reconstruction loss. Finally, we demonstrate that our MDC framework performs
better than several state-of-the-art MDC approaches regarding image coding
efficiency when tested on several commonly available datasets.
- Abstract(参考訳): 本稿では,多重記述(md)圧縮損失を最小化することで最適化した深層多重記述符号化(mdc)フレームワークを提案する。
第一に、mdマルチスケール拡張エンコーダネットワークは複数の記述テンソルを生成し、スカラー量子化子によって離散化されるが、これらの量子化テンソルはmdカスケードブロックデコーダネットワークによってデ圧縮される。
人工ニューラルネットワークパラメータの総量を大幅に削減するために、これらの2種類のネットワークからなるオートエンコーダネットワークを対称パラメータ共有構造として設計する。
第2に、このオートエンコーダネットワークと一対のスカラー量子化器を、エンドツーエンドのセルフ教師方式で同時に学習する。
第3に、画像空間分布の変化を考慮すると、各スカラー量子化器は直接量子化ではなく、mdテンソルを生成するために重要指数マップを伴っている。
第4に,複数記述の多様化を暗黙的に規則化する多重記述構造類似性距離損失を導入し,MD再構成の他,多様化復号化を明示的に監督する。
最後に、我々のMDCフレームワークは、複数の一般的なデータセットでテストした場合、画像符号化効率について、最先端のMDCアプローチよりも優れた性能を示すことを示す。
関連論文リスト
- ESDMR-Net: A Lightweight Network With Expand-Squeeze and Dual Multiscale
Residual Connections for Medical Image Segmentation [7.921517156237902]
本稿では,拡張型マルチスケール残差ネットワーク(ESDMR-Net)を提案する。
完全な畳み込みネットワークであり、モバイルデバイスのようなリソースに制約のあるコンピューティングハードウェアに適している。
5つの異なる応用例から7つのデータセットについて実験を行った。
論文 参考訳(メタデータ) (2023-12-17T02:15:49Z) - M$^{2}$SNet: Multi-scale in Multi-scale Subtraction Network for Medical
Image Segmentation [73.10707675345253]
医用画像から多様なセグメンテーションを仕上げるマルチスケールサブトラクションネットワーク(M$2$SNet)を提案する。
本手法は,4つの異なる医用画像セグメンテーションタスクの11つのデータセットに対して,異なる評価基準の下で,ほとんどの最先端手法に対して好意的に機能する。
論文 参考訳(メタデータ) (2023-03-20T06:26:49Z) - Perceptual Video Coding for Machines via Satisfied Machine Ratio
Modeling [66.56355316611598]
Satisfied Machine Ratio (SMR) は、圧縮された画像やビデオの知覚的品質を評価するメトリクスである。
SMRは機械の知覚的コーディングを可能にし、機械のためのビデオ符号化を特異性から一般性まで推進する。
論文 参考訳(メタデータ) (2022-11-13T03:16:36Z) - String-based Molecule Generation via Multi-decoder VAE [56.465033997245776]
可変オートエンコーダ(VAE)による文字列型分子生成の問題点について検討する。
本稿では,そのタスクに対するVAEの性能を改善するための,シンプルで効果的なアイデアを提案する。
実験では,提案するVAEモデルを用いて,領域外分布からサンプルを生成する。
論文 参考訳(メタデータ) (2022-08-23T03:56:30Z) - Reducing Redundancy in the Bottleneck Representation of the Autoencoders [98.78384185493624]
オートエンコーダは教師なしニューラルネットワークの一種であり、様々なタスクを解くのに使用できる。
本稿では,ボトルネック表現における特徴冗長性を明示的に罰する手法を提案する。
我々は,3つの異なるデータセットを用いた次元削減,MNISTデータセットを用いた画像圧縮,ファッションMNISTを用いた画像デノナイズという,さまざまなタスクにまたがってアプローチを検証した。
論文 参考訳(メタデータ) (2022-02-09T18:48:02Z) - UNETR: Transformers for 3D Medical Image Segmentation [8.59571749685388]
UNEt TRansformers(UNETR)と呼ばれる新しいアーキテクチャを導入し、純粋なトランスフォーマーをエンコーダとして入力ボリュームのシーケンス表現を学習します。
提案モデルの性能を様々なイメージング手法で広く検証しています。
論文 参考訳(メタデータ) (2021-03-18T20:17:15Z) - Semantic Features Aided Multi-Scale Reconstruction of Inter-Modality
Magnetic Resonance Images [12.39341163725669]
本稿では,エンコーダデコーダアーキテクチャを用いて,T1W画像からT2W画像を再構成する,新しいディープ・ネットワーク・ベース・ソリューションを提案する。
提案した学習は,2方向の強調値と画像の勾配を持つマルチチャネル入力を用いて,意味的特徴によって支援される。
論文 参考訳(メタデータ) (2020-06-22T19:53:50Z) - Modeling Lost Information in Lossy Image Compression [72.69327382643549]
ロスシー画像圧縮は、デジタル画像の最もよく使われる演算子の1つである。
Invertible Lossy Compression (ILC) と呼ばれる新しい非可逆的フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-22T04:04:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。