論文の概要: Normalizing Flows with Iterative Denoising
- arxiv url: http://arxiv.org/abs/2604.20041v1
- Date: Tue, 21 Apr 2026 22:52:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-23 15:36:10.880225
- Title: Normalizing Flows with Iterative Denoising
- Title(参考訳): 反復Denoisingによる流れの正規化
- Authors: Tianrong Chen, Jiatao Gu, David Berthelot, Joshua Susskind, Shuangfei Zhai,
- Abstract要約: フロー生成モデルの正規化に,反復的TARFlow(iTARFlow)を導入する。
iTARFlowは、トレーニング中に完全なエンドツーエンド、可能性ベースの目標を維持している。
これは、64、128、256ピクセルのImageNet解像度で競合するパフォーマンスを実現している。
- 参考スコア(独自算出の注目度): 32.9706166699763
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Normalizing Flows (NFs) are a classical family of likelihood-based methods that have received revived attention. Recent efforts such as TARFlow have shown that NFs are capable of achieving promising performance on image modeling tasks, making them viable alternatives to other methods such as diffusion models. In this work, we further advance the state of Normalizing Flow generative models by introducing iterative TARFlow (iTARFlow). Unlike diffusion models, iTARFlow maintains a fully end-to-end, likelihood-based objective during training. During sampling, it performs autoregressive generation followed by an iterative denoising procedure inspired by diffusion-style methods. Through extensive experiments, we show that iTARFlow achieves competitive performance across ImageNet resolutions of 64, 128, and 256 pixels, demonstrating its potential as a strong generative model and advancing the frontier of Normalizing Flows. In addition, we analyze the characteristic artifacts produced by iTARFlow, offering insights that may shed light on future improvements. Code is available at https://github.com/apple/ml-itarflow.
- Abstract(参考訳): 正規化フロー(英: Normalizing Flows, NFs)は、確率に基づく手法の古典的なファミリーであり、再び注目を集めている。
TARFlowのような最近の取り組みにより、NFは画像モデリングタスクにおいて有望なパフォーマンスを達成することができ、拡散モデルのような他の方法に代わる有効な代替手段となることが示されている。
本研究では、反復的TARFlow(iTARFlow)を導入することにより、フロー生成モデルの正規化をさらに進める。
拡散モデルとは異なり、iTARFlowはトレーニング中に完全なエンドツーエンド、可能性ベースの目標を維持している。
サンプリング中に自己回帰生成を行い、拡散スタイルの手法にインスパイアされた反復的復調処理を行う。
広汎な実験により,iTARFlowは64,128,256ピクセルのImageNet解像度の競合性能を達成し,強力な生成モデルとしての可能性を示し,正規化フローのフロンティアを前進させることを示す。
さらに、iTARFlowが生み出す特徴的アーティファクトを分析し、今後の改善に光を当てる可能性のある洞察を提供する。
コードはhttps://github.com/apple/ml-itarflowで入手できる。
関連論文リスト
- Mean Flows for One-step Generative Modeling [64.4997821467102]
本稿では,一段階生成モデリングのための原理的かつ効果的なフレームワークを提案する。
ニューラルネットワークトレーニングのガイドには,平均速度と瞬時速度を適切に定義したアイデンティティが導出され,使用される。
提案手法はMeanFlowモデルと呼ばれ,自己完結型であり,事前学習,蒸留,カリキュラム学習は不要である。
論文 参考訳(メタデータ) (2025-05-19T17:59:42Z) - Normalizing Flows are Capable Generative Models [48.31226028595099]
TarFlowはシンプルでスケーラブルなアーキテクチャで、高性能なNFモデルを実現する。
エンドツーエンドのトレーニングは簡単で、ピクセルを直接モデリングして生成することができる。
TarFlowは、画像の確率推定に新たな最先端結果を設定し、以前のベストメソッドを大きなマージンで上回る。
論文 参考訳(メタデータ) (2024-12-09T09:28:06Z) - D-Flow: Differentiating through Flows for Controlled Generation [37.80603174399585]
フローを微分することで生成プロセスを制御するフレームワークであるD-Flowを紹介する。
我々は、ガウス確率パスで訓練された拡散/FMモデルに対して、生成過程を微分することで、データ多様体の勾配を予測できるというキーとなる観察によって、この枠組みを動機付けている。
我々は,画像と音声の逆問題や条件分子生成など,線形および非線形に制御された生成問題に対する枠組みを検証する。
論文 参考訳(メタデータ) (2024-02-21T18:56:03Z) - Guided Flows for Generative Modeling and Decision Making [55.42634941614435]
その結果,ガイドフローは条件付き画像生成やゼロショット音声合成におけるサンプル品質を著しく向上させることがわかった。
特に、我々は、拡散モデルと比較して、オフライン強化学習設定axスピードアップにおいて、まず、計画生成にフローモデルを適用する。
論文 参考訳(メタデータ) (2023-11-22T15:07:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。