論文の概要: Continuous Adversarial Flow Models
- arxiv url: http://arxiv.org/abs/2604.11521v1
- Date: Mon, 13 Apr 2026 14:23:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:16.599397
- Title: Continuous Adversarial Flow Models
- Title(参考訳): 連続逆流モデル
- Authors: Shanchuan Lin, Ceyuan Yang, Zhijie Lin, Hao Chen, Haoqi Fan,
- Abstract要約: 本研究では, 対向目標を用いて学習した連続時間フローモデルである, 連続対向フローモデルを提案する。
平均二乗誤差基準を固定したフローマッチングとは異なり,本手法では学習者による学習指導のための識別器を導入する。
提案手法は,既存のフローマッチングモデルのトレーニング後,スクラッチからモデルのトレーニングを行うことができる。
- 参考スコア(独自算出の注目度): 26.917627135225118
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose continuous adversarial flow models, a type of continuous-time flow model trained with an adversarial objective. Unlike flow matching, which uses a fixed mean-squared-error criterion, our approach introduces a learned discriminator to guide training. This change in objective induces a different generalized distribution, which empirically produces samples that are better aligned with the target data distribution. Our method is primarily proposed for post-training existing flow-matching models, although it can also train models from scratch. On the ImageNet 256px generation task, our post-training substantially improves the guidance-free FID of latent-space SiT from 8.26 to 3.63 and of pixel-space JiT from 7.17 to 3.57. It also improves guided generation, reducing FID from 2.06 to 1.53 for SiT and from 1.86 to 1.80 for JiT. We further evaluate our approach on text-to-image generation, where it achieves improved results on both the GenEval and DPG benchmarks.
- Abstract(参考訳): 本研究では, 対向目標を用いて学習した連続時間フローモデルである, 連続対向フローモデルを提案する。
平均二乗誤差基準を固定したフローマッチングとは異なり,本手法では学習者による学習指導のための識別器を導入する。
この目的の変化は異なる一般化分布を誘導し、ターゲットデータ分布に適合したサンプルを経験的に生成する。
提案手法は,既存のフローマッチングモデルのトレーニング後,スクラッチからモデルのトレーニングを行うことができる。
ImageNet 256px 生成タスクでは,遅延空間 SiT の 8.26 から 3.63 ,ピクセル空間 JiT の 7.17 から 3.57 への誘導自由 FID を大幅に改善する。
また、FIDを2.06から1.53に削減し、SiTは1.86から1.80に改善した。
我々はさらに,GenEval と DPG のベンチマークで改善された結果が得られるテキスト・画像生成に対するアプローチを評価した。
関連論文リスト
- Momentum Guidance: Plug-and-Play Guidance for Flow Models [11.47531308210865]
本稿では, ODE 軌道自体を利用した新たなガイダンスである Momentum Guidance (MG) を紹介する。
MGは過去の速度の指数移動平均を用いて電流速度を外挿し、標準の1段階評価コストを保存する。
MGは、CFGを使わずに36.68%、CFGを使わず25.52%の平均的なFID改善を実現し、64回のサンプリングステップで1.597のFIDを達成する。
論文 参考訳(メタデータ) (2026-02-23T21:06:35Z) - Adversarial Flow Models [26.917627135225118]
本稿では,逆流モデルとフローモデルを統一する生成モデルのクラスである逆流モデルを提案する。
本手法は, ネイティブなワンステップ生成やマルチステップ生成をサポートし, 対角目標を用いて学習する。
56層モデルと112層モデルにおいて,中間的監督を伴わない深度反復によるエンドツーエンドトレーニングの可能性を示す。
論文 参考訳(メタデータ) (2025-11-27T14:04:08Z) - CMT: Mid-Training for Efficient Learning of Consistency, Mean Flow, and Flow Map Models [75.81132530657682]
Consistency Models (CM) や Mean Flow (MF) のようなフローマップモデルは、拡散モデルのODE解の長い跳躍を学習することで、少数のステップ生成を可能にする。
本研究では,(拡散)事前学習と最終フローマップトレーニングの間に,軽量な中間段階を挿入する最初の概念と実践的手法であるミドルトレーニングを紹介する。
論文 参考訳(メタデータ) (2025-09-29T09:42:08Z) - DiffusionNFT: Online Diffusion Reinforcement with Forward Process [99.94852379720153]
Diffusion Negative-aware FineTuning (DiffusionNFT) は、フローマッチングを通じて前方プロセス上で直接拡散モデルを最適化する新しいオンラインRLパラダイムである。
DiffusionNFTは、CFGフリーのFlowGRPOよりも25倍効率が高い。
論文 参考訳(メタデータ) (2025-09-19T16:09:33Z) - Contrastive Flow Matching [61.60002028726023]
コントラストフローマッチング(Contrastive Flow Matching)は、全ての条件フローに対して一意性を明示するフローマッチング対象の拡張である。
提案手法は,任意のサンプル対からの予測フロー間の相違を最大化するための対照的な目的を与える。
比較フローマッチングによるトレーニングモデル(1)は最大9倍のトレーニング速度,(2)は最大5倍のノイズ除去ステップ,(3)FIDを最大8.9以下に向上させる。
論文 参考訳(メタデータ) (2025-06-05T17:59:58Z) - Flow-GRPO: Training Flow Matching Models via Online RL [80.62659379624867]
本稿では,オンライン政策強化学習をフローマッチングモデルに統合する最初の方法であるFlow-GRPOを提案する。
提案手法では,(1)決定論的正規微分方程式を同値な微分方程式に変換するODE-to-SDE変換と,(2)推論ステップの数を維持しながらトレーニングの段階を短縮するDenoising Reduction戦略の2つの主要な戦略を用いる。
論文 参考訳(メタデータ) (2025-05-08T17:58:45Z) - Diffusion Models without Classifier-free Guidance [41.59396565229466]
モデルガイダンス(MG)は拡散モデルアドレスを訓練するための新しい目的であり、よく使われるガイダンス(CFG)を除去する。
我々の革新的なアプローチは、標準モデリングを超越し、条件の後方確率を組み込む。
提案手法は,CFGを用いた並列拡散モデルにおいても,学習過程を著しく加速し,推論速度を2倍にし,並列拡散モデルでさえ並列に超える異常な品質を実現する。
論文 参考訳(メタデータ) (2025-02-17T18:59:50Z) - Directly Denoising Diffusion Models [6.109141407163027]
数ステップのサンプリングで現実的な画像を生成するための単純で汎用的なアプローチであるDDDM(Directly Denoising Diffusion Model)を提案する。
本モデルでは, CIFAR-10のFIDスコアを1段階, 2段階のサンプリングで2.57と2.33とし, GANと蒸留モデルから得られたFIDスコアをそれぞれ上回った。
ImageNet 64x64の場合、当社のアプローチは主要なモデルに対する競争相手として機能します。
論文 参考訳(メタデータ) (2024-05-22T11:20:32Z) - Improved Techniques for Training Consistency Models [13.475711217989975]
本稿では, 蒸留なしでデータから直接一貫性モデルを学習する, 整合性トレーニングのための改良手法を提案する。
整合性学習目的のための対数正規雑音スケジュールを提案し、トレーニングの繰り返し回数毎に全離散化ステップを2倍にすることを提案する。
これらの修正により、一貫性モデルは1回のサンプリングステップでCIFAR-10で2.51と3.25のFIDスコア、ImageNetで64ドルをそれぞれ達成できる。
論文 参考訳(メタデータ) (2023-10-22T05:33:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。