Fugu-MT 論文翻訳(概要): Guided Flows for Generative Modeling and Decision Making

論文の概要: Guided Flows for Generative Modeling and Decision Making

arxiv url: http://arxiv.org/abs/2311.13443v1
Date: Wed, 22 Nov 2023 15:07:59 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-23 14:53:51.222279
Title: Guided Flows for Generative Modeling and Decision Making
Title（参考訳）: 生成モデリングと意思決定のためのガイドフロー
Authors: Qinqing Zheng, Matt Le, Neta Shaul, Yaron Lipman, Aditya Grover, Ricky T. Q. Chen
Abstract要約: その結果,ガイドフローは画像生成やゼロショット音声合成において,サンプル品質を著しく向上させることがわかった。また、ガイドフローは、エージェントの全体的な性能に影響を与えることなく、大幅に少ない計算量を利用することができることを示す。
参考スコア（独自算出の注目度）: 55.42634941614435
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Classifier-free guidance is a key component for improving the performance of conditional generative models for many downstream tasks. It drastically improves the quality of samples produced, but has so far only been used for diffusion models. Flow Matching (FM), an alternative simulation-free approach, trains Continuous Normalizing Flows (CNFs) based on regressing vector fields. It remains an open question whether classifier-free guidance can be performed for Flow Matching models, and to what extent does it improve performance. In this paper, we explore the usage of Guided Flows for a variety of downstream applications involving conditional image generation, speech synthesis, and reinforcement learning. In particular, we are the first to apply flow models to the offline reinforcement learning setting. We also show that Guided Flows significantly improves the sample quality in image generation and zero-shot text-to-speech synthesis, and can make use of drastically low amounts of computation without affecting the agent's overall performance.
Abstract（参考訳）: 分類子フリーガイダンスは、多くのダウンストリームタスクの条件付き生成モデルのパフォーマンスを改善するための重要なコンポーネントである。これは生成したサンプルの品質を大幅に改善するが、これまで拡散モデルにしか使われていない。オルタナティブなシミュレーションフリーな手法であるフローマッチング(fm)は、回帰ベクトル場に基づいて連続正規化フロー(cnfs)を訓練する。フローマッチングモデルに対して、分類器なしのガイダンスが実行可能であるか、どの程度パフォーマンスが向上するのか、という疑問が残る。本稿では、条件付き画像生成、音声合成、強化学習を含む様々な下流アプリケーションにおけるガイドフローの利用について検討する。特に、オフライン強化学習環境にフローモデルを適用するのは、私たちが初めてです。また,ガイドドフローは,画像生成におけるサンプル品質とゼロショットテキスト対音声合成を著しく改善し,エージェント全体の性能に影響を与えずに,極めて少ない計算量を利用できることを示した。

関連論文リスト

Flow Stochastic Segmentation Networks [16.173163796354675]
Flow-SSNは、離散時間自己回帰と現代の連続時間フローの変種を特徴とする生成セグメンテーションモデルである。 Flow-SSNを医用画像のベンチマークに応用し、最先端の結果を得る。
論文参考訳（メタデータ） (2025-07-24T22:26:28Z)
Align Your Flow: Scaling Continuous-Time Flow Map Distillation [63.927438959502226]
フローマップは、任意の2つのノイズレベルを1ステップで接続し、すべてのステップカウントで有効に保ちます。画像生成ベンチマークにおいて、Align Your Flowと呼ばれるフローマップモデルを広範囲に検証する。テキスト条件付き合成において、既存の非横断的訓練された数ステップのサンプルよりも優れたテキスト間フローマップモデルを示す。
論文参考訳（メタデータ） (2025-06-17T15:06:07Z)
Mean Flows for One-step Generative Modeling [64.4997821467102]
本稿では,一段階生成モデリングのための原理的かつ効果的なフレームワークを提案する。ニューラルネットワークトレーニングのガイドには,平均速度と瞬時速度を適切に定義したアイデンティティが導出され,使用される。提案手法はMeanFlowモデルと呼ばれ,自己完結型であり,事前学習,蒸留,カリキュラム学習は不要である。
論文参考訳（メタデータ） (2025-05-19T17:59:42Z)
Self-Corrected Flow Distillation for Consistent One-Step and Few-Step Text-to-Image Generation [3.8959351616076745]
フローマッチングは、生成モデルをトレーニングするための有望なフレームワークとして登場した。本稿では, 整合性モデルと対向学習を統合した自己補正型流動蒸留法を提案する。この研究は、数ステップと1ステップのサンプリングで一貫した生成品質を達成するための先駆者である。
論文参考訳（メタデータ） (2024-12-22T07:48:49Z)
Jet: A Modern Transformer-Based Normalizing Flow [62.2573739835562]
本稿では,結合型正規化フローモデルの設計を再考する。よりシンプルなアーキテクチャで、最先端の定量的、質的なパフォーマンスを実現しています。
論文参考訳（メタデータ） (2024-12-19T18:09:42Z)
Unraveling the Connections between Flow Matching and Diffusion Probabilistic Models in Training-free Conditional Generation [7.3604864243987365]
本稿では,Flow Matching を用いた Posterior Smpling (FMPS) を提案し,その適用範囲を拡大する。この補正項は、サロゲートスコア関数を組み込むように再構成することができる。 FMPSは既存の最先端手法に比べて優れた世代品質が得られることを示す。
論文参考訳（メタデータ） (2024-11-12T08:14:39Z)
Energy-Based Diffusion Language Models for Text Generation [126.23425882687195]
エネルギーベース拡散言語モデル(Energy-based Diffusion Language Model, EDLM)は、拡散ステップごとに全シーケンスレベルで動作するエネルギーベースモデルである。我々のフレームワークは、既存の拡散モデルよりも1.3$times$のサンプリングスピードアップを提供する。
論文参考訳（メタデータ） (2024-10-28T17:25:56Z)
Representation Alignment for Generation: Training Diffusion Transformers Is Easier Than You Think [72.48325960659822]
生成のための大規模拡散モデルの訓練における主要なボトルネックは、これらの表現を効果的に学習することにある。本稿では,RePresentation Alignment (REPA) と呼ばれる単純な正規化を導入し,ノイズの多い入力隠れ状態の投影を,外部の事前学習された視覚エンコーダから得られるクリーンな画像表現と整合させる手法を提案する。我々の単純な戦略は、一般的な拡散やDiTsやSiTsといったフローベースのトランスフォーマーに適用した場合、トレーニング効率と生成品質の両方に大きな改善をもたらす。
論文参考訳（メタデータ） (2024-10-09T14:34:53Z)
FlowTurbo: Towards Real-time Flow-Based Image Generation with Velocity Refiner [70.90505084288057]
フローベースモデルはサンプリングプロセス中により直線的なサンプリング軌道を生成する傾向にある。擬似修正器やサンプル認識コンパイルなどいくつかの手法を導入し,推論時間をさらに短縮する。 FlowTurboはImageNet上で100(ms/img)で2.12FID、38(ms/img)で3.93FIDに達する
論文参考訳（メタデータ） (2024-09-26T17:59:51Z)
Text-to-Image Rectified Flow as Plug-and-Play Priors [52.586838532560755]
整流流は、ソースからターゲット分布への線形進行を強制する新しい生成モデルのクラスである。補正フローアプローチが生成品質と効率を上回り,推論ステップを少なくすることを示した。また,画像のインバージョンや編集における競合性能も示す。
論文参考訳（メタデータ） (2024-06-05T14:02:31Z)
D-Flow: Differentiating through Flows for Controlled Generation [37.80603174399585]
フローを微分することで生成プロセスを制御するフレームワークであるD-Flowを紹介する。我々は、ガウス確率パスで訓練された拡散/FMモデルに対して、生成過程を微分することで、データ多様体の勾配を予測できるというキーとなる観察によって、この枠組みを動機付けている。我々は,画像と音声の逆問題や条件分子生成など,線形および非線形に制御された生成問題に対する枠組みを検証する。
論文参考訳（メタデータ） (2024-02-21T18:56:03Z)
Attentive Contractive Flow with Lipschitz-constrained Self-Attention [25.84621883831624]
注意的収縮フロー(ACF)と呼ばれる新しいアプローチを導入する。 ACFは、フローベースの生成モデル - 収縮フロー - の特別なカテゴリを利用する。我々は, ACFをプラグアンドプレイ方式で, 各種のアートフローモデルに導入できることを実証した。
論文参考訳（メタデータ） (2021-09-24T18:02:49Z)
Distilling the Knowledge from Normalizing Flows [22.578033953780697]
正規化フローは、複数の音声および視覚問題において強力な性能を示す生成モデルの強力なクラスである。本稿では, 簡易蒸留法を提案し, 画像超解像と音声合成のための現状条件付きフローベースモデルの有効性を実証する。
論文参考訳（メタデータ） (2021-06-24T00:10:22Z)
Refining Deep Generative Models via Discriminator Gradient Flow [18.406499703293566]
判別器グラディエントフロー (DGflow) は, エントロピー規則化されたf-ディバージェンスの勾配流を介して生成したサンプルを改善する新しい手法である。 DGflowは, 様々な生成モデルに対して, 生成したサンプルの品質を著しく向上させることを示す。
論文参考訳（メタデータ） (2020-12-01T19:10:15Z)
Normalizing Flows with Multi-Scale Autoregressive Priors [131.895570212956]
マルチスケール自己回帰前処理(mAR)を通した遅延空間におけるチャネルワイド依存性を導入する。我々のmARは、分割結合フロー層(mAR-SCF)を持つモデルに先立って、複雑なマルチモーダルデータの依存関係をよりよく捉えます。我々は,mAR-SCFにより画像生成品質が向上し,FIDとインセプションのスコアは最先端のフローベースモデルと比較して向上したことを示す。
論文参考訳（メタデータ） (2020-04-08T09:07:11Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。