論文の概要: Closing the Dequantization Gap: PixelCNN as a Single-Layer Flow
- arxiv url: http://arxiv.org/abs/2002.02547v3
- Date: Fri, 30 Oct 2020 17:05:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-03 09:44:26.452073
- Title: Closing the Dequantization Gap: PixelCNN as a Single-Layer Flow
- Title(参考訳): 量子化ギャップの閉鎖:シングル層流としてのPixelCNN
- Authors: Didrik Nielsen, Ole Winther
- Abstract要約: 有限体積を変換し、離散データに対する確率の正確な計算を可能にするサブセットフローを導入する。
我々は、WaveNets、PixelCNNs、Transformersを含む通常の離散自己回帰モデルを単層フローとして識別する。
我々は, CIFAR-10 を用いて, 脱量子化を訓練した流れモデルについて, 実測結果を示す。
- 参考スコア(独自算出の注目度): 16.41460104376002
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Flow models have recently made great progress at modeling ordinal discrete
data such as images and audio. Due to the continuous nature of flow models,
dequantization is typically applied when using them for such discrete data,
resulting in lower bound estimates of the likelihood. In this paper, we
introduce subset flows, a class of flows that can tractably transform finite
volumes and thus allow exact computation of likelihoods for discrete data.
Based on subset flows, we identify ordinal discrete autoregressive models,
including WaveNets, PixelCNNs and Transformers, as single-layer flows. We use
the flow formulation to compare models trained and evaluated with either the
exact likelihood or its dequantization lower bound. Finally, we study
multilayer flows composed of PixelCNNs and non-autoregressive coupling layers
and demonstrate state-of-the-art results on CIFAR-10 for flow models trained
with dequantization.
- Abstract(参考訳): 近年,画像や音声などの離散データモデリングにおいて,フローモデルは大きな進歩を遂げている。
フローモデルの連続的な性質から、デカルト化はそのような離散データに使用する場合に一般的に適用され、その結果、確率の上限を低く見積もる。
本稿では,有限体積を気道的に変換し,離散データに対する確率の正確な計算を可能にする流れのクラスである部分集合フローを紹介する。
部分集合流に基づいて,ウェーブネット,ピクセルcnn,トランスフォーマなどの順序離散自己回帰モデルを単層流として同定する。
フロー定式化(flow formula)を使用して、トレーニングおよび評価されたモデルと正確な確率または脱量子化下限のどちらかを比較した。
最後に,pixelcnnsと非自己回帰結合層からなる多層膜流れを解析し,脱量子化を施した流れモデルに対するcifar-10の最先端結果を示す。
関連論文リスト
- Fisher Flow Matching for Generative Modeling over Discrete Data [12.69975914345141]
離散データのための新しいフローマッチングモデルであるFisher-Flowを紹介する。
Fisher-Flowは、離散データ上のカテゴリー分布を考慮し、明らかに幾何学的な視点を採っている。
Fisher-Flowにより誘導される勾配流は, 前方KLの発散を低減するのに最適であることを示す。
論文 参考訳(メタデータ) (2024-05-23T15:02:11Z) - Guided Flows for Generative Modeling and Decision Making [55.42634941614435]
その結果,ガイドフローは条件付き画像生成やゼロショット音声合成におけるサンプル品質を著しく向上させることがわかった。
特に、我々は、拡散モデルと比較して、オフライン強化学習設定axスピードアップにおいて、まず、計画生成にフローモデルを適用する。
論文 参考訳(メタデータ) (2023-11-22T15:07:59Z) - Bayesian Flow Networks [4.585102332532472]
本稿では,ベイジアン・フロー・ネットワーク(BFN)について述べる。ベイジアン・フロー・ネットワーク(BFN)は,独立分布の集合のパラメータをベイジアン推論で修正した新しい生成モデルである。
単純な事前および反復的な2つの分布の更新から始めると、拡散モデルの逆過程に似た生成手順が得られる。
BFNは動的にバイナライズされたMNISTとCIFAR-10で画像モデリングを行うために競合するログライクフレーションを実現し、text8文字レベルの言語モデリングタスクにおいて既知のすべての離散拡散モデルより優れている。
論文 参考訳(メタデータ) (2023-08-14T09:56:35Z) - ChiroDiff: Modelling chirographic data with Diffusion Models [132.5223191478268]
チャーログラフィーデータのための強力なモデルクラスである「拡散確率モデル(Denoising Diffusion Probabilistic Models)」やDDPMを導入している。
我々のモデルは「ChiroDiff」と呼ばれ、非自己回帰的であり、全体論的概念を捉えることを学び、したがって高い時間的サンプリングレートに回復する。
論文 参考訳(メタデータ) (2023-04-07T15:17:48Z) - Attentive Contractive Flow with Lipschitz-constrained Self-Attention [25.84621883831624]
注意的収縮フロー(ACF)と呼ばれる新しいアプローチを導入する。
ACFは、フローベースの生成モデル - 収縮フロー - の特別なカテゴリを利用する。
我々は, ACFをプラグアンドプレイ方式で, 各種のアートフローモデルに導入できることを実証した。
論文 参考訳(メタデータ) (2021-09-24T18:02:49Z) - Discrete Denoising Flows [87.44537620217673]
分類的確率変数に対する離散的フローベースモデル(DDF)を提案する。
他の離散フローベースモデルとは対照的に、我々のモデルは勾配バイアスを導入することなく局所的に訓練することができる。
そこで本研究では, DDFs が離散フローより優れていることを示し, 対数類似度で測定した2値MNIST と Cityscapes のセグメンテーションマップをモデル化した。
論文 参考訳(メタデータ) (2021-07-24T14:47:22Z) - DeFlow: Learning Complex Image Degradations from Unpaired Data with
Conditional Flows [145.83812019515818]
本論文では,不対データから画像劣化を学習するDeFlowを提案する。
共有フローデコーダネットワークの潜在空間における劣化過程をモデル化する。
共同画像復元と超解像におけるDeFlowの定式化を検証した。
論文 参考訳(メタデータ) (2021-01-14T18:58:01Z) - Normalizing Flows with Multi-Scale Autoregressive Priors [131.895570212956]
マルチスケール自己回帰前処理(mAR)を通した遅延空間におけるチャネルワイド依存性を導入する。
我々のmARは、分割結合フロー層(mAR-SCF)を持つモデルに先立って、複雑なマルチモーダルデータの依存関係をよりよく捉えます。
我々は,mAR-SCFにより画像生成品質が向上し,FIDとインセプションのスコアは最先端のフローベースモデルと比較して向上したことを示す。
論文 参考訳(メタデータ) (2020-04-08T09:07:11Z) - Semi-Supervised Learning with Normalizing Flows [54.376602201489995]
FlowGMMは、フローの正規化を伴う生成半教師付き学習におけるエンドツーエンドのアプローチである。
我々は AG-News や Yahoo Answers のテキストデータなど,幅広いアプリケーションに対して有望な結果を示す。
論文 参考訳(メタデータ) (2019-12-30T17:36:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。