論文の概要: Training-free, Perceptually Consistent Low-Resolution Previews with High-Resolution Image for Efficient Workflows of Diffusion Models
- arxiv url: http://arxiv.org/abs/2604.09227v1
- Date: Fri, 10 Apr 2026 11:36:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.836161
- Title: Training-free, Perceptually Consistent Low-Resolution Previews with High-Resolution Image for Efficient Workflows of Diffusion Models
- Title(参考訳): 拡散モデルの効率的なワークフローのための高分解能画像を用いた学習不要・知覚整合性低分解能プレビュー
- Authors: Wongi Jeong, Hoigi Seo, Se Young Chun,
- Abstract要約: 本稿では,高忠実度LR画像を生成する手法を提案する。
人間の知覚的一貫性を維持しつつ,最大33%の削減率でLR画像を生成することができる。
我々の定式化は、ワープや翻訳などの画像操作にまで拡張することができ、その一般化可能性を示している。
- 参考スコア(独自算出の注目度): 29.845476457607614
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Image generative models have become indispensable tools to yield exquisite high-resolution (HR) images for everyone, ranging from general users to professional designers. However, a desired outcome often requires generating a large number of HR images with different prompts and seeds, resulting in high computational cost for both users and service providers. Generating low-resolution (LR) images first could alleviate computational burden, but it is not straightforward how to generate LR images that are perceptually consistent with their HR counterparts. Here, we consider the task of generating high-fidelity LR images, called Previews, that preserve perceptual similarity of their HR counterparts for an efficient workflow, allowing users to identify promising candidates before generating the final HR image. We propose the commutator-zero condition to ensure the LR-HR perceptual consistency for flow matching models, leading to the proposed training-free solution with downsampling matrix selection and commutator-zero guidance. Extensive experiments show that our method can generate LR images with up to 33\% computation reduction while maintaining HR perceptual consistency. When combined with existing acceleration techniques, our method achieves up to 3$\times$ speedup. Moreover, our formulation can be extended to image manipulations, such as warping and translation, demonstrating its generalizability.
- Abstract(参考訳): 画像生成モデルは、一般ユーザーからプロのデザイナーまで、誰でも高度な高解像度(HR)画像を得るのに欠かせないツールとなっている。
しかし、望ましい結果を得るためには、多くのHRイメージを異なるプロンプトとシードで生成する必要があることが多いため、ユーザとサービスプロバイダの両方にとって高い計算コストがかかる。
低解像度(LR)画像の生成は、まず計算負担を軽減することができるが、HR画像と知覚的に一致したLR画像を生成する方法は簡単ではない。
本稿では,高忠実なLR画像を生成するPreviewsというタスクについて考察する。このタスクは,HR画像を生成する前に,ユーザが有望な候補を識別できるように,HR画像の知覚的類似性を効率よく維持するものである。
本稿では, LR-HRのフローマッチングモデルに対する知覚的整合性を確保するためのコンピュテータゼロ条件を提案し, ダウンサンプリング行列選択とコンピュテータゼロガイダンスを用いたトレーニング自由解を提案する。
広汎な実験により,人間の知覚的一貫性を維持しつつ,最大33倍の計算量でLR画像を生成することができることがわかった。
既存の加速技術と組み合わせることで,最大3$\times$ Speedupを実現する。
さらに、この定式化は、ワープや翻訳などの画像操作にも適用でき、その一般化性を示すことができる。
関連論文リスト
- Blind Super Resolution with Reference Images and Implicit Degradation Representation [5.34372866210952]
劣化カーネルは、分解プロセスだけでなく、スケールの低下要因も考慮すべきである。
様々な超解像スケールで同じ分解カーネルを適用することは現実的ではないかもしれない。
本研究は,BSRタスクにおいて,劣化カーネルとスケーリング要因を重要な要素として認めている。
論文 参考訳(メタデータ) (2025-07-18T13:45:04Z) - Real-time 6K Image Rescaling with Rate-distortion Optimization [53.61374658914277]
リアルタイム6Kレート歪み認識画像再スケーリングのための新しいフレームワークを提案する。
我々のフレームワークは、HR画像をエンコーダによってJPEG LRサムネイルに埋め込む。
そして、効率的な周波数認識復号器は、LR1から高忠実度HR画像をリアルタイムに再構成する。
論文 参考訳(メタデータ) (2023-04-03T15:21:56Z) - SRTGAN: Triplet Loss based Generative Adversarial Network for Real-World
Super-Resolution [13.897062992922029]
SISR(Single Image Super-Resolution)と呼ばれる別のソリューションは、低解像度(LR)画像を取得し、HR画像を取得することを目的としたソフトウェア駆動のアプローチである。
我々は、LR画像に提供される情報を負のサンプルとして利用することで、新たな三重項に基づく対向損失関数を導入する。
本稿では, 対向的損失, 内容的損失, 知覚的損失, 品質的損失を融合させて, 知覚的忠実度の高い超解像を得る。
論文 参考訳(メタデータ) (2022-11-22T11:17:07Z) - Memory-augmented Deep Unfolding Network for Guided Image
Super-resolution [67.83489239124557]
誘導画像超解像(GISR)は、HR画像の誘導の下で低解像度(LR)目標画像の空間分解能を高めて高解像度(HR)目標画像を得る。
従来のモデルベース手法は主に画像全体を取り、HR目標画像とHRガイダンス画像との事前分布を仮定する。
HR目標画像上で2種類の事前性を持つGISRの最大後部(MAP)推定モデルを提案する。
論文 参考訳(メタデータ) (2022-02-12T15:37:13Z) - Learning Multiple Probabilistic Degradation Generators for Unsupervised
Real World Image Super Resolution [5.987801889633082]
教師なしの現実世界のスーパーレゾリューションは、ペア化されたデータが利用できない場合に、低解像度(LR)入力を与えられた高解像度(HR)イメージを復元することを目的としている。
最も一般的なアプローチの1つは、GANを使ってノイズの多いLR画像を合成し、合成データセットを使用してモデルを教師付きで訓練することである。
HR画像が与えられたLR画像の分布を近似する確率分解生成器を提案する。
論文 参考訳(メタデータ) (2022-01-26T04:49:11Z) - Hierarchical Conditional Flow: A Unified Framework for Image
Super-Resolution and Image Rescaling [139.25215100378284]
画像SRと画像再スケーリングのための統合フレームワークとして階層的条件フロー(HCFlow)を提案する。
HCFlowは、LR画像と残りの高周波成分の分布を同時にモデル化することにより、HRとLR画像ペア間のマッピングを学習する。
さらに性能を高めるために、知覚的損失やGAN損失などの他の損失と、トレーニングで一般的に使用される負の対数類似損失とを組み合わせる。
論文 参考訳(メタデータ) (2021-08-11T16:11:01Z) - Best-Buddy GANs for Highly Detailed Image Super-Resolution [71.13466303340192]
我々は,低分解能(LR)入力に基づいて高分解能(HR)画像を生成する単一画像超解像(SISR)問題を考える。
このラインに沿ったほとんどのメソッドは、SISRタスクに十分な柔軟性がない、事前定義されたシングルLRシングルHRマッピングに依存しています。
リッチディテールSISRのためのベストバディGAN(Beby-GAN)を提案する。
イミュータブルな1対1の制約を緩和することで、推定されたパッチを動的に最高の監視を求めることができる。
論文 参考訳(メタデータ) (2021-03-29T02:58:27Z) - Deep Generative Adversarial Residual Convolutional Networks for
Real-World Super-Resolution [31.934084942626257]
我々は,超解像残差畳み込み生成共役ネットワーク(SRResCGAN)を提案する。
これは、生成したLRドメインからHRドメインの画素単位の監督でモデルを逆トレーニングすることで、現実世界の劣化設定に従う。
提案するネットワークは,画像の高精細化と凸最適化によるエネルギーベース目的関数の最小化により,残差学習を利用する。
論文 参考訳(メタデータ) (2020-05-03T00:12:38Z) - Closed-loop Matters: Dual Regression Networks for Single Image
Super-Resolution [73.86924594746884]
ディープニューラルネットワークは、画像超解像において有望な性能を示した。
これらのネットワークは、低分解能(LR)画像から高分解能(HR)画像への非線形マッピング関数を学習する。
本稿では,可能な関数の空間を削減するために,LRデータに新たな制約を導入することで,二重回帰手法を提案する。
論文 参考訳(メタデータ) (2020-03-16T04:23:42Z) - PULSE: Self-Supervised Photo Upsampling via Latent Space Exploration of
Generative Models [77.32079593577821]
PULSE (Photo Upsampling via Latent Space Exploration) は、それまで文献になかった解像度で高解像度でリアルな画像を生成する。
本手法は, 従来よりも高分解能, スケールファクターの知覚品質において, 最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-03-08T16:44:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。