論文の概要: Normalizing Flows with Multi-Scale Autoregressive Priors
- arxiv url: http://arxiv.org/abs/2004.03891v1
- Date: Wed, 8 Apr 2020 09:07:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-15 07:50:25.039247
- Title: Normalizing Flows with Multi-Scale Autoregressive Priors
- Title(参考訳): マルチスケール自己回帰前処理を用いた正規化流れ
- Authors: Shweta Mahajan, Apratim Bhattacharyya, Mario Fritz, Bernt Schiele,
Stefan Roth
- Abstract要約: マルチスケール自己回帰前処理(mAR)を通した遅延空間におけるチャネルワイド依存性を導入する。
我々のmARは、分割結合フロー層(mAR-SCF)を持つモデルに先立って、複雑なマルチモーダルデータの依存関係をよりよく捉えます。
我々は,mAR-SCFにより画像生成品質が向上し,FIDとインセプションのスコアは最先端のフローベースモデルと比較して向上したことを示す。
- 参考スコア(独自算出の注目度): 131.895570212956
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Flow-based generative models are an important class of exact inference models
that admit efficient inference and sampling for image synthesis. Owing to the
efficiency constraints on the design of the flow layers, e.g. split coupling
flow layers in which approximately half the pixels do not undergo further
transformations, they have limited expressiveness for modeling long-range data
dependencies compared to autoregressive models that rely on conditional
pixel-wise generation. In this work, we improve the representational power of
flow-based models by introducing channel-wise dependencies in their latent
space through multi-scale autoregressive priors (mAR). Our mAR prior for models
with split coupling flow layers (mAR-SCF) can better capture dependencies in
complex multimodal data. The resulting model achieves state-of-the-art density
estimation results on MNIST, CIFAR-10, and ImageNet. Furthermore, we show that
mAR-SCF allows for improved image generation quality, with gains in FID and
Inception scores compared to state-of-the-art flow-based models.
- Abstract(参考訳): フローベース生成モデルは、画像合成のための効率的な推論とサンプリングを許容する正確な推論モデルの重要なクラスである。
フロー層の設計における効率上の制約、例えば、約半分のピクセルがさらなる変換を行わない分割結合フロー層は、条件付きピクセル単位の生成に依存する自己回帰モデルと比較して、長距離データ依存をモデル化する表現力に制限がある。
本研究では,マルチスケール自己回帰前処理 (mAR) を用いて,チャネル依存性を潜在空間に導入することにより,フローベースモデルの表現力を向上させる。
我々のmARは、分割結合フロー層(mAR-SCF)を持つモデルに先立って、複雑なマルチモーダルデータの依存関係をよりよく捉えます。
得られたモデルは、MNIST、CIFAR-10、ImageNetの最先端密度推定結果を達成する。
さらに,mAR-SCFにより画像生成品質が向上し,FIDとインセプションスコアは最先端のフローベースモデルと比較して向上することを示した。
関連論文リスト
- Poisson flow consistency models for low-dose CT image denoising [3.6218104434936658]
本稿では,Poisson Flow Generative Model (PFGM)++で得られる柔軟性と,高品質で単一ステップの一貫性モデルのサンプリングを併用した新しい画像復調手法を提案する。
この結果から,PFGM++における拡張変数の次元性であるハイパーパラメータDのチューニングの柔軟性が,一貫性モデルよりも優れることが示唆された。
論文 参考訳(メタデータ) (2024-02-13T01:39:56Z) - Guided Flows for Generative Modeling and Decision Making [55.42634941614435]
その結果,ガイドフローは条件付き画像生成やゼロショット音声合成におけるサンプル品質を著しく向上させることがわかった。
特に、我々は、拡散モデルと比較して、オフライン強化学習設定axスピードアップにおいて、まず、計画生成にフローモデルを適用する。
論文 参考訳(メタデータ) (2023-11-22T15:07:59Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Hierarchical Integration Diffusion Model for Realistic Image Deblurring [71.76410266003917]
拡散モデル (DM) は画像劣化に導入され, 有望な性能を示した。
本稿では,階層型統合拡散モデル(HI-Diff)を提案する。
人工的および実世界のぼかしデータセットの実験は、HI-Diffが最先端の手法より優れていることを示した。
論文 参考訳(メタデータ) (2023-05-22T12:18:20Z) - Implicit Diffusion Models for Continuous Super-Resolution [65.45848137914592]
本稿では,高忠実度連続画像超解像のためのインプリシティ拡散モデル(IDM)を提案する。
IDMは暗黙のニューラル表現とデノナイジング拡散モデルを統合されたエンドツーエンドフレームワークに統合する。
スケーリング係数は分解能を調節し、最終出力におけるLR情報と生成された特徴の比率を変調する。
論文 参考訳(メタデータ) (2023-03-29T07:02:20Z) - Improving the Reconstruction of Disentangled Representation Learners via
Multi-Stage Modelling [36.511724015405036]
現在の自己エンコーダに基づく非絡み合い表現学習法は、(集合体)後部をペナルティ化し、潜伏因子の統計的独立を促進することで、非絡み合いを実現する。
モデルが相関変数を学習するのに十分な能力を持っていないため,不整合表現学習と再構成品質のトレードオフがもたらされる。
本稿では,既存の不整合表現学習手法を用いて,非整合因子をまず学習する,新しい多段階モデリング手法を提案する。
提案するマルチステージモデルは,複数の標準ベンチマークにおいて等価なアンタングル性能を有する現在の最先端手法よりも,はるかに高い再現性を有することを示す。
論文 参考訳(メタデータ) (2020-10-25T18:51:15Z) - RG-Flow: A hierarchical and explainable flow model based on
renormalization group and sparse prior [2.274915755738124]
フローベース生成モデルは、教師なし学習アプローチの重要なクラスとなっている。
本研究では, 階層型フローベース生成モデル RG-Flow の設計のために, 再正規化群 (RG) とスパース事前分布の鍵となる概念を取り入れた。
提案手法は, エッジ長が$L$の画像の描画に$O(log L)$の複雑さを伴っているが, 従来より$O(L2)$の複雑性を持つ生成モデルに比べれば, エッジ長が$L$の画像の描画には$O(log L)$の複雑さがある。
論文 参考訳(メタデータ) (2020-09-30T18:04:04Z) - Closing the Dequantization Gap: PixelCNN as a Single-Layer Flow [16.41460104376002]
有限体積を変換し、離散データに対する確率の正確な計算を可能にするサブセットフローを導入する。
我々は、WaveNets、PixelCNNs、Transformersを含む通常の離散自己回帰モデルを単層フローとして識別する。
我々は, CIFAR-10 を用いて, 脱量子化を訓練した流れモデルについて, 実測結果を示す。
論文 参考訳(メタデータ) (2020-02-06T22:58:51Z) - Model Fusion via Optimal Transport [64.13185244219353]
ニューラルネットワークのための階層モデル融合アルゴリズムを提案する。
これは、不均一な非i.d.データに基づいてトレーニングされたニューラルネットワーク間での"ワンショット"な知識伝達に成功していることを示す。
論文 参考訳(メタデータ) (2019-10-12T22:07:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。