論文の概要: I-Max: Maximize the Resolution Potential of Pre-trained Rectified Flow Transformers with Projected Flow
- arxiv url: http://arxiv.org/abs/2410.07536v2
- Date: Tue, 15 Oct 2024 02:26:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-16 10:09:35.193141
- Title: I-Max: Maximize the Resolution Potential of Pre-trained Rectified Flow Transformers with Projected Flow
- Title(参考訳): I-Max: 投射流を伴う予修整流変圧器の分解能の最大化
- Authors: Ruoyi Du, Dongyang Liu, Le Zhuo, Qin Qi, Hongsheng Li, Zhanyu Ma, Peng Gao,
- Abstract要約: Rectified Flow Transformer (RFT) は優れたトレーニングと推論の効率を提供する。
テキスト・ツー・イメージ RFT の解像度を最大化する I-Max フレームワークを提案する。
- 参考スコア(独自算出の注目度): 50.55228067778858
- License:
- Abstract: Rectified Flow Transformers (RFTs) offer superior training and inference efficiency, making them likely the most viable direction for scaling up diffusion models. However, progress in generation resolution has been relatively slow due to data quality and training costs. Tuning-free resolution extrapolation presents an alternative, but current methods often reduce generative stability, limiting practical application. In this paper, we review existing resolution extrapolation methods and introduce the I-Max framework to maximize the resolution potential of Text-to-Image RFTs. I-Max features: (i) a novel Projected Flow strategy for stable extrapolation and (ii) an advanced inference toolkit for generalizing model knowledge to higher resolutions. Experiments with Lumina-Next-2K and Flux.1-dev demonstrate I-Max's ability to enhance stability in resolution extrapolation and show that it can bring image detail emergence and artifact correction, confirming the practical value of tuning-free resolution extrapolation.
- Abstract(参考訳): Rectified Flow Transformer (RFT) は優れたトレーニングと推論効率を提供し、拡散モデルをスケールアップするための最も有効な方向である可能性が高い。
しかし、データ品質とトレーニングコストのため、生成解像度の進歩は比較的遅い。
チューニングフリー分解能外挿法は代替となるが、現在の方法はしばしば生成安定性を低下させ、実用的な応用を制限する。
本稿では,既存の分解能外挿法を概観し,テキスト対画像RFTの分解能を最大化するためのI-Maxフレームワークを提案する。
I-Max の機能
一 安定な外挿のための新規な投射流戦略
(II)モデル知識を高分解能に一般化するための高度な推論ツールキット。
Lumina-Next-2K と Flux.1-dev による実験では、I-Max は分解能外挿の安定性を向上し、画像詳細の創発とアーチファクトの補正を実現し、チューニング不要分解能外挿の実用的価値を確認することができることを示した。
関連論文リスト
- Motion-prior Contrast Maximization for Dense Continuous-Time Motion Estimation [34.529280562470746]
コントラスト最大化フレームワークと非直線運動を組み合わせた新たな自己監督的損失を画素レベルの軌跡の形で導入する。
連続時間運動の高密度推定では, 合成学習モデルのゼロショット性能を29%向上する。
論文 参考訳(メタデータ) (2024-07-15T15:18:28Z) - FlowIE: Efficient Image Enhancement via Rectified Flow [71.6345505427213]
FlowIEはフローベースのフレームワークであり、基本的な分布から高品質な画像への直線パスを推定する。
私たちのコントリビューションは、合成および実世界のデータセットに関する包括的な実験を通じて、厳密に検証されています。
論文 参考訳(メタデータ) (2024-06-01T17:29:29Z) - DFU: scale-robust diffusion model for zero-shot super-resolution image
generation [15.689418447376587]
複数の解像度で空間情報とスペクトル情報を組み合わせることでスコア演算子を近似する新しいディープラーニングアーキテクチャDual-FNO UNet(DFU)を提案する。
本稿では,FIDをFFHQの最大トレーニング解像度の1.66倍の1.66倍の1.3倍の精度で達成し,ゼロショット超解像画像生成能力をさらに高めるための微調整戦略を提案する。
論文 参考訳(メタデータ) (2023-11-30T23:31:33Z) - PSRFlow: Probabilistic Super Resolution with Flow-Based Models for
Scientific Data [11.15523311079383]
PSRFlowは、科学データ超解像のための新しい正規化フローベース生成モデルである。
以上の結果から,既存の手法と比較して,優れた性能とロバストな不確実性定量化が得られた。
論文 参考訳(メタデータ) (2023-08-08T22:10:29Z) - ACDMSR: Accelerated Conditional Diffusion Models for Single Image
Super-Resolution [84.73658185158222]
本稿では,ACDMSRと呼ばれる拡散モデルに基づく超解像法を提案する。
提案手法は, 決定論的反復分解過程を通じて超解像を行うために, 標準拡散モデルに適応する。
提案手法は,低解像度画像に対してより視覚的に現実的な表現を生成し,現実的なシナリオにおけるその有効性を強調した。
論文 参考訳(メタデータ) (2023-07-03T06:49:04Z) - Exploiting Diffusion Prior for Real-World Image Super-Resolution [75.5898357277047]
本稿では,事前学習したテキスト・画像拡散モデルにカプセル化された事前知識を視覚的超解像に活用するための新しいアプローチを提案する。
時間認識エンコーダを用いることで、事前学習した合成モデルを変更することなく、有望な復元結果が得られる。
論文 参考訳(メタデータ) (2023-05-11T17:55:25Z) - Implicit Diffusion Models for Continuous Super-Resolution [65.45848137914592]
本稿では,高忠実度連続画像超解像のためのインプリシティ拡散モデル(IDM)を提案する。
IDMは暗黙のニューラル表現とデノナイジング拡散モデルを統合されたエンドツーエンドフレームワークに統合する。
スケーリング係数は分解能を調節し、最終出力におけるLR情報と生成された特徴の比率を変調する。
論文 参考訳(メタデータ) (2023-03-29T07:02:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。