論文の概要: Laplacian Pyramid-like Autoencoder
- arxiv url: http://arxiv.org/abs/2208.12484v1
- Date: Fri, 26 Aug 2022 07:45:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-29 12:49:10.644374
- Title: Laplacian Pyramid-like Autoencoder
- Title(参考訳): ラプラシアピラミッド型オートエンコーダ
- Authors: Sangjun Han, Taeil Hur, Youngmi Hur
- Abstract要約: 我々は,信号処理における画像解析に広く用いられているラプラシアンピラミッド (LP) の概念を付加することにより,ラプラシアンピラミッドライクオートエンコーダ (LPAE) を開発した。
LPAEを用いて分類と超解像領域の実験を行った。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we develop the Laplacian pyramid-like autoencoder (LPAE) by
adding the Laplacian pyramid (LP) concept widely used to analyze images in
Signal Processing. LPAE decomposes an image into the approximation image and
the detail image in the encoder part and then tries to reconstruct the original
image in the decoder part using the two components. We use LPAE for experiments
on classifications and super-resolution areas. Using the detail image and the
smaller-sized approximation image as inputs of a classification network, our
LPAE makes the model lighter. Moreover, we show that the performance of the
connected classification networks has remained substantially high. In a
super-resolution area, we show that the decoder part gets a high-quality
reconstruction image by setting to resemble the structure of LP. Consequently,
LPAE improves the original results by combining the decoder part of the
autoencoder and the super-resolution network.
- Abstract(参考訳): 本稿では,信号処理における画像解析に広く用いられるラプラシアンピラミッド (lp) の概念を付加することにより,ラプラシアンピラミッドライクオートエンコーダ (lpae) を開発した。
LPAEは、エンコーダ部における近似画像と詳細画像とに画像を分解し、2つの成分を用いてデコーダ部における原画像の再構成を試みる。
LPAEを用いて分類と超解像領域の実験を行った。
細部画像と小サイズ近似画像を分類ネットワークの入力として用いることで,lpaeはモデルをより軽量にする。
さらに,接続された分類ネットワークの性能は依然として著しく高い。
超分解能領域では、デコーダ部がLPの構造に類似するように設定することで高品質な再構成画像が得られることを示す。
これにより、LPAEは、オートエンコーダのデコーダ部と超解像ネットワークを組み合わせることにより、元の結果を改善する。
関連論文リスト
- $ε$-VAE: Denoising as Visual Decoding [61.29255979767292]
生成モデリングにおいて、トークン化は複雑なデータをコンパクトで構造化された表現に単純化し、より効率的で学習可能な空間を作り出す。
現在の視覚的トークン化手法は従来のオートエンコーダフレームワークに依存しており、エンコーダはデータを潜在表現に圧縮し、デコーダは元の入力を再構築する。
具体的には,デコーダを拡散処理に置き換え,ノイズを反復的に除去して元のイメージを復元し,エンコーダが提供する潜伏者によって誘導される。
再建(rFID)と生成品質(ジェネレーション品質)の両面からアプローチを評価する。
論文 参考訳(メタデータ) (2024-10-05T08:27:53Z) - Deformable Image Registration with Multi-scale Feature Fusion from Shared Encoder, Auxiliary and Pyramid Decoders [2.6089354079273512]
教師なし画像登録のための新しい変形可能な畳み込みピラミッドネットワークを提案する。
提案するネットワークは、画像ペア用の共有補助デコーダを追加することにより、従来のピラミッドネットワークを強化する。
以上の結果から, 高い登録精度を達成し, 円滑かつ可塑性変形を維持しつつ, 複雑な変形を捉えることが可能であることが示唆された。
論文 参考訳(メタデータ) (2024-08-11T08:02:28Z) - In-Domain GAN Inversion for Faithful Reconstruction and Editability [132.68255553099834]
ドメイン誘導型ドメイン正規化とエンコーダで構成されたドメイン内GANインバージョンを提案し、事前学習されたGANモデルのネイティブ潜在空間における反転コードを正規化する。
エンコーダ構造,開始反転点,および逆パラメータ空間の効果を総合的に解析し,再構成品質と編集特性とのトレードオフを観察する。
論文 参考訳(メタデータ) (2023-09-25T08:42:06Z) - More complex encoder is not all you need [0.882348769487259]
我々は,強力なデコーダを構築するために,新しいサブピクセル・コンボリューションを組み込んだneU-Net(複雑なエンコーダではないU-Net)を導入する。
我々のモデル設計は、SynapseとACDCの両方のデータセット上で、最先端の手法を上回る優れた結果が得られる。
論文 参考訳(メタデータ) (2023-09-20T08:34:38Z) - VNVC: A Versatile Neural Video Coding Framework for Efficient
Human-Machine Vision [59.632286735304156]
コード化された表現をピクセルに復号することなく直接拡張・解析することがより効率的である。
再構成と直接拡張/分析の両方をサポートするために,コンパクト表現の学習を目標とする汎用型ニューラルビデオ符号化(VNVC)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-19T03:04:57Z) - Super-Resolution of License Plate Images Using Attention Modules and
Sub-Pixel Convolution Layers [3.8831062015253055]
監視画像における構造的特徴およびテクスチャ的特徴の検出を強化するために,Single-Image Super-Resolution (SISR) アプローチを導入する。
提案手法は,サブピクセルの畳み込み層と,光学的文字認識(OCR)モデルを用いて特徴抽出を行うロス関数を含む。
以上の結果から, これらの低解像度合成画像の再構成手法は, 定量化と定性化の両面で, 既存の画像よりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2023-05-27T00:17:19Z) - GAN-Based Multi-View Video Coding with Spatio-Temporal EPI
Reconstruction [19.919826392704472]
GAN(Generative Adrial Network)の画像生成機能を活用した新しい多視点ビデオ符号化手法を提案する。
エンコーダでは,時空間平面画像(EPI)デコーダを構築し,さらに畳み込みネットワークを用いてGANの潜時符号をサイド情報(SI)として抽出する。
側面では、SIと隣接する視点を組み合わせて、GANジェネレータを用いて中間ビューを再構築する。
論文 参考訳(メタデータ) (2022-05-07T08:52:54Z) - Small Lesion Segmentation in Brain MRIs with Subpixel Embedding [105.1223735549524]
ヒト脳のMRIスキャンを虚血性脳梗塞と正常組織に分割する方法を提案する。
本稿では,空間展開埋め込みネットワークによって予測を導出する標準エンコーダデコーダの形式でニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-09-18T00:21:17Z) - Transformer Meets DCFAM: A Novel Semantic Segmentation Scheme for
Fine-Resolution Remote Sensing Images [6.171417925832851]
Swin Transformerをバックボーンとして導入し、コンテキスト情報を完全に抽出します。
また、高密度接続特徴集合モジュール(DCFAM)と呼ばれる新しいデコーダを設計し、解像度を復元し、セグメンテーションマップを生成する。
論文 参考訳(メタデータ) (2021-04-25T11:34:22Z) - Beyond Single Stage Encoder-Decoder Networks: Deep Decoders for Semantic
Image Segmentation [56.44853893149365]
セマンティックセグメンテーションのための単一エンコーダ-デコーダ手法は、セマンティックセグメンテーションの品質とレイヤー数あたりの効率の観点からピークに達している。
そこで本研究では,より多くの情報コンテンツを取得するために,浅層ネットワークの集合を用いたデコーダに基づく新しいアーキテクチャを提案する。
アーキテクチャをさらに改善するために,ネットワークの注目度を高めるために,クラスの再バランスを目的とした重み関数を導入する。
論文 参考訳(メタデータ) (2020-07-19T18:44:34Z) - Modeling Lost Information in Lossy Image Compression [72.69327382643549]
ロスシー画像圧縮は、デジタル画像の最もよく使われる演算子の1つである。
Invertible Lossy Compression (ILC) と呼ばれる新しい非可逆的フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-22T04:04:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。