論文の概要: Super-resolution Variational Auto-Encoders
- arxiv url: http://arxiv.org/abs/2006.05218v2
- Date: Tue, 30 Jun 2020 13:06:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-23 13:24:26.200842
- Title: Super-resolution Variational Auto-Encoders
- Title(参考訳): 超解像可変オートエンコーダ
- Authors: Ioannis Gatopoulos, Maarten Stol, Jakub M. Tomczak
- Abstract要約: 本稿では、元の画像のダウンスケール版であるランダム変数を追加することで、VAEを強化することを提案する。
提案手法は, 負の対数類似度の観点から, VAEと相容れない性能を示すことを実証的に示す。
- 参考スコア(独自算出の注目度): 8.873449722727026
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The framework of variational autoencoders (VAEs) provides a principled method
for jointly learning latent-variable models and corresponding inference models.
However, the main drawback of this approach is the blurriness of the generated
images. Some studies link this effect to the objective function, namely, the
(negative) log-likelihood. Here, we propose to enhance VAEs by adding a random
variable that is a downscaled version of the original image and still use the
log-likelihood function as the learning objective. Further, by providing the
downscaled image as an input to the decoder, it can be used in a manner similar
to the super-resolution. We present empirically that the proposed approach
performs comparably to VAEs in terms of the negative log-likelihood, but it
obtains a better FID score in data synthesis.
- Abstract(参考訳): 変分オートエンコーダ(VAE)のフレームワークは、潜在変数モデルと対応する推論モデルを共同で学習するための原則付き手法を提供する。
しかし、このアプローチの主な欠点は、生成された画像のぼかしである。
この効果を目的関数、すなわち(負の)対数類似度と結びつける研究もある。
本稿では,原画像の縮小版である確率変数を付加し,さらに学習目的としてログライク度関数を用いたvaes強化を提案する。
さらに、デコーダへの入力としてダウンスケール画像を提供することにより、超解像と同様の方法で使用することができる。
提案手法は負の対数類似度の観点から,VAEと同等に機能するが,データ合成におけるFIDスコアが向上することを示す。
関連論文リスト
- Image Harmonization using Robust Restricted CDF Matching [0.0]
曲線フィッティングに基づく累積分布関数(CDF)マッチングを用いた画像調和方式を提案する。
画像強度の変換は、他の既知のヒストグラムマッチングアルゴリズムと比較して、非線形であるが、まだ滑らかで弾力的である」。
我々はMRI画像の手法を実証するが、他の種類の画像データに適用できるほど汎用的である。
論文 参考訳(メタデータ) (2024-11-20T12:12:47Z) - CR-VAE: Contrastive Regularization on Variational Autoencoders for
Preventing Posterior Collapse [1.0044057719679085]
変分オートエンコーダ(VAE)は, テクスト後部崩壊現象に悩まされていることが知られている
変分オートエンコーダ(CR-VAE)のコントラスト正規化という新しい解を提案する。
論文 参考訳(メタデータ) (2023-09-06T13:05:42Z) - Masked Images Are Counterfactual Samples for Robust Fine-tuning [77.82348472169335]
微調整の深層学習モデルは、分布内(ID)性能と分布外(OOD)堅牢性の間のトレードオフにつながる可能性がある。
そこで本研究では,マスク付き画像を対物サンプルとして用いて,ファインチューニングモデルのロバスト性を向上させる新しいファインチューニング手法を提案する。
論文 参考訳(メタデータ) (2023-03-06T11:51:28Z) - Lossy Image Compression with Conditional Diffusion Models [25.158390422252097]
本稿では,拡散生成モデルを用いた画像圧縮のエンドツーエンド最適化について概説する。
VAEベースのニューラル圧縮とは対照的に、(平均)デコーダは決定論的ニューラルネットワークであり、私たちのデコーダは条件付き拡散モデルである。
提案手法では,GANモデルよりもFIDスコアが強く,VAEモデルとの競合性能も高い。
論文 参考訳(メタデータ) (2022-09-14T21:53:27Z) - CCLF: A Contrastive-Curiosity-Driven Learning Framework for
Sample-Efficient Reinforcement Learning [56.20123080771364]
我々は、強化学習のためのモデルに依存しないコントラスト駆動学習フレームワーク(CCLF)を開発した。
CCLFは、サンプルの重要性を完全に活用し、自己管理的な学習効率を向上させる。
このアプローチをDeepMind Control Suite、Atari、MiniGridベンチマークで評価する。
論文 参考訳(メタデータ) (2022-05-02T14:42:05Z) - Neural Data-Dependent Transform for Learned Image Compression [72.86505042102155]
ニューラルデータに依存した変換を構築し,各画像の符号化効率を最適化する連続オンラインモード決定機構を導入する。
実験の結果,提案したニューラルシンタクス設計と連続オンラインモード決定機構の有効性が示された。
論文 参考訳(メタデータ) (2022-03-09T14:56:48Z) - Diffusion-Based Representation Learning [65.55681678004038]
教師付き信号のない表現学習を実現するために,デノナイズスコアマッチングフレームワークを拡張した。
対照的に、拡散に基づく表現学習は、デノナイジングスコアマッチング目的の新しい定式化に依存している。
同じ手法を用いて,半教師付き画像分類における最先端モデルの改善を実現する無限次元潜在符号の学習を提案する。
論文 参考訳(メタデータ) (2021-05-29T09:26:02Z) - Anomaly detection through latent space restoration using
vector-quantized variational autoencoders [0.8122270502556374]
本稿では,密度と復元に基づく手法を用いた分散検出手法を提案する。
VQ-VAEモデルは、分類的潜在空間で画像をエンコードすることを学ぶ。
潜在コードの事前分布は、オートリグレッシブ(ar)モデルを使用してモデル化される。
論文 参考訳(メタデータ) (2020-12-12T09:19:59Z) - Autoencoding Variational Autoencoder [56.05008520271406]
我々は,この行動が学習表現に与える影響と,自己整合性の概念を導入することでそれを修正する結果について検討する。
自己整合性アプローチで訓練されたエンコーダは、敵攻撃による入力の摂動に対して頑健な(無神経な)表現につながることを示す。
論文 参考訳(メタデータ) (2020-12-07T14:16:14Z) - A Flexible Framework for Designing Trainable Priors with Adaptive
Smoothing and Game Encoding [57.1077544780653]
我々は、前方通過を非滑らかな凸最適化問題として解釈できるニューラルネットワーク層の設計とトレーニングのための一般的なフレームワークを紹介する。
グラフのノードに代表されるローカルエージェントによって解決され、正規化関数を介して相互作用する凸ゲームに焦点を当てる。
このアプローチは、訓練可能なエンドツーエンドのディープモデル内で、古典的な画像の事前使用を可能にするため、画像の問題を解決するために魅力的である。
論文 参考訳(メタデータ) (2020-06-26T08:34:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。