論文の概要: Super-resolution Variational Auto-Encoders
- arxiv url: http://arxiv.org/abs/2006.05218v2
- Date: Tue, 30 Jun 2020 13:06:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-23 13:24:26.200842
- Title: Super-resolution Variational Auto-Encoders
- Title(参考訳): 超解像可変オートエンコーダ
- Authors: Ioannis Gatopoulos, Maarten Stol, Jakub M. Tomczak
- Abstract要約: 本稿では、元の画像のダウンスケール版であるランダム変数を追加することで、VAEを強化することを提案する。
提案手法は, 負の対数類似度の観点から, VAEと相容れない性能を示すことを実証的に示す。
- 参考スコア(独自算出の注目度): 8.873449722727026
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The framework of variational autoencoders (VAEs) provides a principled method
for jointly learning latent-variable models and corresponding inference models.
However, the main drawback of this approach is the blurriness of the generated
images. Some studies link this effect to the objective function, namely, the
(negative) log-likelihood. Here, we propose to enhance VAEs by adding a random
variable that is a downscaled version of the original image and still use the
log-likelihood function as the learning objective. Further, by providing the
downscaled image as an input to the decoder, it can be used in a manner similar
to the super-resolution. We present empirically that the proposed approach
performs comparably to VAEs in terms of the negative log-likelihood, but it
obtains a better FID score in data synthesis.
- Abstract(参考訳): 変分オートエンコーダ(VAE)のフレームワークは、潜在変数モデルと対応する推論モデルを共同で学習するための原則付き手法を提供する。
しかし、このアプローチの主な欠点は、生成された画像のぼかしである。
この効果を目的関数、すなわち(負の)対数類似度と結びつける研究もある。
本稿では,原画像の縮小版である確率変数を付加し,さらに学習目的としてログライク度関数を用いたvaes強化を提案する。
さらに、デコーダへの入力としてダウンスケール画像を提供することにより、超解像と同様の方法で使用することができる。
提案手法は負の対数類似度の観点から,VAEと同等に機能するが,データ合成におけるFIDスコアが向上することを示す。
関連論文リスト
- CR-VAE: Contrastive Regularization on Variational Autoencoders for
Preventing Posterior Collapse [1.0044057719679085]
変分オートエンコーダ(VAE)は, テクスト後部崩壊現象に悩まされていることが知られている
変分オートエンコーダ(CR-VAE)のコントラスト正規化という新しい解を提案する。
論文 参考訳(メタデータ) (2023-09-06T13:05:42Z) - Reflected Diffusion Models [93.26107023470979]
本稿では,データのサポートに基づいて進化する反射微分方程式を逆転する反射拡散モデルを提案する。
提案手法は,一般化されたスコアマッチング損失を用いてスコア関数を学習し,標準拡散モデルの主要成分を拡張する。
論文 参考訳(メタデータ) (2023-04-10T17:54:38Z) - Masked Images Are Counterfactual Samples for Robust Fine-tuning [77.82348472169335]
微調整の深層学習モデルは、分布内(ID)性能と分布外(OOD)堅牢性の間のトレードオフにつながる可能性がある。
そこで本研究では,マスク付き画像を対物サンプルとして用いて,ファインチューニングモデルのロバスト性を向上させる新しいファインチューニング手法を提案する。
論文 参考訳(メタデータ) (2023-03-06T11:51:28Z) - Optimizing Hierarchical Image VAEs for Sample Quality [0.0]
階層的変動オートエンコーダ (VAE) は, 画像モデリングタスクにおいて, 高精度な密度推定を実現している。
これは、画像の非知覚的な詳細を圧縮する過度に強調する学習表現によるものである。
我々は,各潜伏群におけるインフォメーション量を制御するKL重み付け戦略を導入し,学習目標のシャープネスを低減するためにガウス出力層を用いる。
論文 参考訳(メタデータ) (2022-10-18T23:10:58Z) - Lossy Image Compression with Conditional Diffusion Models [25.158390422252097]
本稿では,拡散生成モデルを用いた画像圧縮のエンドツーエンド最適化について概説する。
VAEベースのニューラル圧縮とは対照的に、(平均)デコーダは決定論的ニューラルネットワークであり、私たちのデコーダは条件付き拡散モデルである。
提案手法では,GANモデルよりもFIDスコアが強く,VAEモデルとの競合性能も高い。
論文 参考訳(メタデータ) (2022-09-14T21:53:27Z) - CCLF: A Contrastive-Curiosity-Driven Learning Framework for
Sample-Efficient Reinforcement Learning [56.20123080771364]
我々は、強化学習のためのモデルに依存しないコントラスト駆動学習フレームワーク(CCLF)を開発した。
CCLFは、サンプルの重要性を完全に活用し、自己管理的な学習効率を向上させる。
このアプローチをDeepMind Control Suite、Atari、MiniGridベンチマークで評価する。
論文 参考訳(メタデータ) (2022-05-02T14:42:05Z) - Neural Data-Dependent Transform for Learned Image Compression [72.86505042102155]
ニューラルデータに依存した変換を構築し,各画像の符号化効率を最適化する連続オンラインモード決定機構を導入する。
実験の結果,提案したニューラルシンタクス設計と連続オンラインモード決定機構の有効性が示された。
論文 参考訳(メタデータ) (2022-03-09T14:56:48Z) - Anomaly detection through latent space restoration using
vector-quantized variational autoencoders [0.8122270502556374]
本稿では,密度と復元に基づく手法を用いた分散検出手法を提案する。
VQ-VAEモデルは、分類的潜在空間で画像をエンコードすることを学ぶ。
潜在コードの事前分布は、オートリグレッシブ(ar)モデルを使用してモデル化される。
論文 参考訳(メタデータ) (2020-12-12T09:19:59Z) - Autoencoding Variational Autoencoder [56.05008520271406]
我々は,この行動が学習表現に与える影響と,自己整合性の概念を導入することでそれを修正する結果について検討する。
自己整合性アプローチで訓練されたエンコーダは、敵攻撃による入力の摂動に対して頑健な(無神経な)表現につながることを示す。
論文 参考訳(メタデータ) (2020-12-07T14:16:14Z) - A Flexible Framework for Designing Trainable Priors with Adaptive
Smoothing and Game Encoding [57.1077544780653]
我々は、前方通過を非滑らかな凸最適化問題として解釈できるニューラルネットワーク層の設計とトレーニングのための一般的なフレームワークを紹介する。
グラフのノードに代表されるローカルエージェントによって解決され、正規化関数を介して相互作用する凸ゲームに焦点を当てる。
このアプローチは、訓練可能なエンドツーエンドのディープモデル内で、古典的な画像の事前使用を可能にするため、画像の問題を解決するために魅力的である。
論文 参考訳(メタデータ) (2020-06-26T08:34:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。