論文の概要: Cascade Decoders-Based Autoencoders for Image Reconstruction
- arxiv url: http://arxiv.org/abs/2107.00002v1
- Date: Tue, 29 Jun 2021 23:40:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-03 05:19:31.248391
- Title: Cascade Decoders-Based Autoencoders for Image Reconstruction
- Title(参考訳): カスケードデコーダを用いた画像再構成用オートエンコーダ
- Authors: Honggui Li, Dimitri Galayko, Maria Trocan, Mohamad Sawan
- Abstract要約: 本稿では,カスケードデコーダを用いたオートエンコーダの画像再構成を目的とする。
提案したシリアルデコーダベースのオートエンコーダは、マルチレベルデコーダのアーキテクチャと関連する最適化アルゴリズムを含む。
提案するオートエンコーダは,画像再構成の性能において,従来のオートエンコーダよりも優れていた。
- 参考スコア(独自算出の注目度): 2.924868086534434
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autoencoders are composed of coding and decoding units, hence they hold the
inherent potential of high-performance data compression and signal compressed
sensing. The main disadvantages of current autoencoders comprise the following
several aspects: the research objective is not data reconstruction but feature
representation; the performance evaluation of data recovery is neglected; it is
hard to achieve lossless data reconstruction by pure autoencoders, even by pure
deep learning. This paper aims for image reconstruction of autoencoders,
employs cascade decoders-based autoencoders, perfects the performance of image
reconstruction, approaches gradually lossless image recovery, and provides
solid theory and application basis for autoencoders-based image compression and
compressed sensing. The proposed serial decoders-based autoencoders include the
architectures of multi-level decoders and the related optimization algorithms.
The cascade decoders consist of general decoders, residual decoders,
adversarial decoders and their combinations. It is evaluated by the
experimental results that the proposed autoencoders outperform the classical
autoencoders in the performance of image reconstruction.
- Abstract(参考訳): オートエンコーダは符号化ユニットと復号ユニットで構成されるため、高性能なデータ圧縮と信号圧縮センシングの本質的な可能性を秘めている。
現在のオートエンコーダの主な欠点は、データ再構成ではなく特徴表現である、データ復元のパフォーマンス評価は無視される、純粋なディープラーニングによっても純粋なオートエンコーダによるロスレスデータ再構成を達成するのは難しい、といった点である。
本稿では, オートエンコーダの画像再構成, カスケードデコーダに基づくオートエンコーダの利用, 画像再構成の性能向上, 徐々にロスレスな画像復元へのアプローチ, オートエンコーダに基づく画像圧縮および圧縮センシングのためのソリッド理論と応用基盤を提供する。
提案したシリアルデコーダベースのオートエンコーダは、マルチレベルデコーダのアーキテクチャと関連する最適化アルゴリズムを含む。
カスケードデコーダは、一般的なデコーダ、残留デコーダ、逆デコーダとそれらの組み合わせで構成される。
提案するオートエンコーダは,画像再構成の性能において,従来のオートエンコーダよりも優れていた。
関連論文リスト
- $ε$-VAE: Denoising as Visual Decoding [61.29255979767292]
生成モデリングにおいて、トークン化は複雑なデータをコンパクトで構造化された表現に単純化し、より効率的で学習可能な空間を作り出す。
現在の視覚的トークン化手法は従来のオートエンコーダフレームワークに依存しており、エンコーダはデータを潜在表現に圧縮し、デコーダは元の入力を再構築する。
具体的には,デコーダを拡散処理に置き換え,ノイズを反復的に除去して元のイメージを復元し,エンコーダが提供する潜伏者によって誘導される。
再建(rFID)と生成品質(ジェネレーション品質)の両面からアプローチを評価する。
論文 参考訳(メタデータ) (2024-10-05T08:27:53Z) - Neural Image Compression Using Masked Sparse Visual Representation [17.229601298529825]
本研究では,Sparse Visual Representation (SVR) に基づくニューラル画像圧縮について検討し,学習されたビジュアルコードブックにまたがる離散潜在空間に画像が埋め込まれた。
コードブックをデコーダと共有することにより、エンコーダは効率的でクロスプラットフォームなコードワードインデックスを転送する。
本稿では,マスクを潜在機能部分空間に適用して品質のバランスと再構築を行うMasked Adaptive Codebook Learning (M-AdaCode)法を提案する。
論文 参考訳(メタデータ) (2023-09-20T21:59:23Z) - VNVC: A Versatile Neural Video Coding Framework for Efficient
Human-Machine Vision [59.632286735304156]
コード化された表現をピクセルに復号することなく直接拡張・解析することがより効率的である。
再構成と直接拡張/分析の両方をサポートするために,コンパクト表現の学習を目標とする汎用型ニューラルビデオ符号化(VNVC)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-19T03:04:57Z) - Deep Lossy Plus Residual Coding for Lossless and Near-lossless Image
Compression [85.93207826513192]
本稿では、損失のない画像圧縮とほぼロスレス画像圧縮の両面において、統合された強力な深い損失+残差(DLPR)符号化フレームワークを提案する。
VAEのアプローチにおける連立損失と残留圧縮の問題を解く。
ほぼロスレスモードでは、元の残差を量子化し、与えられた$ell_infty$エラー境界を満たす。
論文 参考訳(メタデータ) (2022-09-11T12:11:56Z) - On a Mechanism Framework of Autoencoders [0.0]
本稿では,オートエンコーダの機構に関する理論的枠組みを提案する。
ReLUオートエンコーダの結果は、いくつかの非ReLUケースに一般化される。
PCAや決定木と比較して,次元の縮小と分類における(一般化された)オートエンコーダの利点が示された。
論文 参考訳(メタデータ) (2022-08-15T03:51:40Z) - Reducing Redundancy in the Bottleneck Representation of the Autoencoders [98.78384185493624]
オートエンコーダは教師なしニューラルネットワークの一種であり、様々なタスクを解くのに使用できる。
本稿では,ボトルネック表現における特徴冗長性を明示的に罰する手法を提案する。
我々は,3つの異なるデータセットを用いた次元削減,MNISTデータセットを用いた画像圧縮,ファッションMNISTを用いた画像デノナイズという,さまざまなタスクにまたがってアプローチを検証した。
論文 参考訳(メタデータ) (2022-02-09T18:48:02Z) - Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG
Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。
実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文 参考訳(メタデータ) (2022-01-27T20:20:03Z) - HARP-Net: Hyper-Autoencoded Reconstruction Propagation for Scalable
Neural Audio Coding [25.51661602383911]
オートエンコーダベースのデコーダは、そのボトルネック層活性化をビットストリングに変換するために量子化を使用する。
この問題を回避するために、対応するエンコーダ・デコーダ層間のスキップ接続を追加する。
提案するハイパー・オートエンコーダ・アーキテクチャは,通常のオートエンコーダ・ベースラインに比べて音質の向上を実証的に検証する。
論文 参考訳(メタデータ) (2021-07-22T17:57:53Z) - Modeling Lost Information in Lossy Image Compression [72.69327382643549]
ロスシー画像圧縮は、デジタル画像の最もよく使われる演算子の1つである。
Invertible Lossy Compression (ILC) と呼ばれる新しい非可逆的フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-22T04:04:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。