論文の概要: AS-IntroVAE: Adversarial Similarity Distance Makes Robust IntroVAE
- arxiv url: http://arxiv.org/abs/2206.13903v1
- Date: Tue, 28 Jun 2022 11:40:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-29 14:41:26.690467
- Title: AS-IntroVAE: Adversarial Similarity Distance Makes Robust IntroVAE
- Title(参考訳): AS-IntroVAE: 逆の類似性距離がロバストなIntroVAEを作る
- Authors: Changjie Lu, Shen Zheng, Zirui Wang, Omar Dib, Gaurav Gupta
- Abstract要約: IntroVAEやS-IntroVAEのようなイントロスペクティブモデルは、画像生成や再構成タスクに優れています。
我々は、AS-IntroVAE(Adversarial similarity Distance Introspective Variational Autoencoder)と呼ばれるIntroVAEの新しいバリエーションを提案する。
- 参考スコア(独自算出の注目度): 8.294692832460546
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Recently, introspective models like IntroVAE and S-IntroVAE have excelled in
image generation and reconstruction tasks. The principal characteristic of
introspective models is the adversarial learning of VAE, where the encoder
attempts to distinguish between the real and the fake (i.e., synthesized)
images. However, due to the unavailability of an effective metric to evaluate
the difference between the real and the fake images, the posterior collapse and
the vanishing gradient problem still exist, reducing the fidelity of the
synthesized images. In this paper, we propose a new variation of IntroVAE
called Adversarial Similarity Distance Introspective Variational Autoencoder
(AS-IntroVAE). We theoretically analyze the vanishing gradient problem and
construct a new Adversarial Similarity Distance (AS-Distance) using the
2-Wasserstein distance and the kernel trick. With weight annealing on
AS-Distance and KL-Divergence, the AS-IntroVAE are able to generate stable and
high-quality images. The posterior collapse problem is addressed by making
per-batch attempts to transform the image so that it better fits the prior
distribution in the latent space. Compared with the per-image approach, this
strategy fosters more diverse distributions in the latent space, allowing our
model to produce images of great diversity. Comprehensive experiments on
benchmark datasets demonstrate the effectiveness of AS-IntroVAE on image
generation and reconstruction tasks.
- Abstract(参考訳): 近年,introvaeやs-introvaeなどのイントロスペクティブモデルが画像生成や再構成に優れている。
内観モデルの主な特徴はVAEの対角学習であり、エンコーダは実画像と偽画像(つまり合成画像)を区別しようとする。
しかし、実画像と偽画像との差を評価するための有効な指標が得られないため、後方崩壊や消滅勾配問題が存在し、合成画像の忠実性が低下する。
本稿では,AS-IntroVAE(Adversarial similarity Distance Introspective Variational Autoencoder)と呼ばれる,IntroVAEの新しいバリエーションを提案する。
理論的には、消失する勾配問題を解析し、2-ワッサーシュタイン距離とカーネルトリックを用いて新しい逆類似距離(AS-Distance)を構築する。
AS-DistanceとKL-Divergenceの重み付けにより、AS-IntroVAEは安定かつ高品質な画像を生成することができる。
後部崩壊問題は、バッチごとのイメージ変換を、遅延空間における前の分布に適合するように試みることによって解決される。
画像ごとのアプローチと比較して、この戦略は潜伏空間におけるより多様な分布を育み、我々のモデルは大きな多様性のイメージを生成できる。
ベンチマークデータセットに関する総合実験は、画像生成および再構成タスクにおけるAS-IntroVAEの有効性を示す。
関連論文リスト
- Semantic-Aligned Adversarial Evolution Triangle for High-Transferability Vision-Language Attack [51.16384207202798]
視覚言語事前学習モデルは多モーダル逆例(AE)に対して脆弱である
従来のアプローチでは、画像とテキストのペアを拡大して、敵対的なサンプル生成プロセス内での多様性を高めている。
本稿では, 敵の多様性を高めるために, クリーン, ヒストリ, および現在の敵の例からなる敵の進化三角形からのサンプリングを提案する。
論文 参考訳(メタデータ) (2024-11-04T23:07:51Z) - Anomaly Score: Evaluating Generative Models and Individual Generated Images based on Complexity and Vulnerability [21.355484227864466]
生成した画像の表現空間と入力空間の関係について検討する。
異常スコア(AS)と呼ばれる画像生成モデルを評価するための新しい指標を提案する。
論文 参考訳(メタデータ) (2023-12-17T07:33:06Z) - RANRAC: Robust Neural Scene Representations via Random Ray Consensus [12.161889666145127]
RANRAC(RANdom RAy Consensus)は、一貫性のないデータの影響を排除するための効率的な手法である。
我々はRANSACパラダイムのファジィ適応を定式化し、大規模モデルへの適用を可能にした。
その結果, 新規な視点合成のための最先端のロバストな手法と比較して, 顕著な改善が見られた。
論文 参考訳(メタデータ) (2023-12-15T13:33:09Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - Deep Equilibrium Diffusion Restoration with Parallel Sampling [120.15039525209106]
拡散モデルに基づく画像復元(IR)は、拡散モデルを用いて劣化した画像から高品質な(本社)画像を復元し、有望な性能を達成することを目的としている。
既存のほとんどの手法では、HQイメージをステップバイステップで復元するために長いシリアルサンプリングチェーンが必要であるため、高価なサンプリング時間と高い計算コストがかかる。
本研究では,拡散モデルに基づくIRモデルを異なる視点,すなわちDeqIRと呼ばれるDeQ(Deep equilibrium)固定点系で再考することを目的とする。
論文 参考訳(メタデータ) (2023-11-20T08:27:56Z) - Image Restoration with Mean-Reverting Stochastic Differential Equations [9.245782611878752]
本稿では,汎用画像復元のための微分方程式(SDE)を提案する。
対応する逆時間SDEをシミュレートすることにより、低画質画像の起源を復元することができる。
実験の結果,提案手法は画像の劣化, 劣化, 騒音の定量的比較において, 高い競争性能を示すことがわかった。
論文 参考訳(メタデータ) (2023-01-27T13:20:48Z) - ADIR: Adaptive Diffusion for Image Reconstruction [46.838084286784195]
本研究では,拡散モデルによる事前学習を利用した条件付きサンプリング手法を提案する。
次に、事前学習した拡散分極ネットワークを入力に適応させる新しいアプローチと組み合わせる。
画像再構成手法の適応拡散は,超高解像度,デブロアリング,テキストベースの編集タスクにおいて,大幅な改善が達成されていることを示す。
論文 参考訳(メタデータ) (2022-12-06T18:39:58Z) - Auto-regressive Image Synthesis with Integrated Quantization [55.51231796778219]
本稿では,条件付き画像生成のための多目的フレームワークを提案する。
CNNの帰納バイアスと自己回帰の強力なシーケンスモデリングが組み込まれている。
提案手法は,最先端技術と比較して,優れた多彩な画像生成性能を実現する。
論文 参考訳(メタデータ) (2022-07-21T22:19:17Z) - Hierarchical Similarity Learning for Aliasing Suppression Image
Super-Resolution [64.15915577164894]
エイリアスの影響を抑制するために階層画像超解像ネットワーク(HSRNet)を提案する。
HSRNetは、他の作品よりも定量的かつ視覚的なパフォーマンスを向上し、エイリアスをより効果的に再送信する。
論文 参考訳(メタデータ) (2022-06-07T14:55:32Z) - Robust Single Image Dehazing Based on Consistent and Contrast-Assisted
Reconstruction [95.5735805072852]
画像復調モデルのロバスト性を改善するための新しい密度変分学習フレームワークを提案する。
具体的には、デハジングネットワークは、一貫性の規則化されたフレームワークの下で最適化されている。
我々の手法は最先端のアプローチを大きく上回っている。
論文 参考訳(メタデータ) (2022-03-29T08:11:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。