Fugu-MT 論文翻訳(概要): Late-Constraint Diffusion Guidance for Controllable Image Synthesis

論文の概要: Late-Constraint Diffusion Guidance for Controllable Image Synthesis

arxiv url: http://arxiv.org/abs/2305.11520v4
Date: Wed, 14 Jun 2023 12:29:17 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-17 00:49:24.199845
Title: Late-Constraint Diffusion Guidance for Controllable Image Synthesis
Title（参考訳）: 制御可能な画像合成のための遅延制約拡散誘導
Authors: Chang Liu, Dong Liu
Abstract要約: 拡散モデルでは、テキスト条件の有無にかかわらず、少数の単語が与えられたり、あるいは全くない画像の合成能力を示す。我々は拡散ネットワークをそのままにしておくが、その出力は要求条件に適合するように制約する。提案手法は,既存の早期制約法よりも優れ,未確認条件の一般化に優れる。
参考スコア（独自算出の注目度）: 15.16204528664876
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Diffusion models, either with or without text condition, have demonstrated impressive capability in synthesizing photorealistic images given a few or even no words. These models may not fully satisfy user need, as normal users or artists intend to control the synthesized images with specific guidance, like overall layout, color, structure, object shape, and so on. To adapt diffusion models for controllable image synthesis, several methods have been proposed to incorporate the required conditions as regularization upon the intermediate features of the diffusion denoising network. These methods, known as early-constraint ones in this paper, have difficulties in handling multiple conditions with a single solution. They intend to train separate models for each specific condition, which require much training cost and result in non-generalizable solutions. To address these difficulties, we propose a new approach namely late-constraint: we leave the diffusion networks unchanged, but constrain its output to be aligned with the required conditions. Specifically, we train a lightweight condition adapter to establish the correlation between external conditions and internal representations of diffusion models. During the iterative denoising process, the conditional guidance is sent into corresponding condition adapter to manipulate the sampling process with the established correlation. We further equip the introduced late-constraint strategy with a timestep resampling method and an early stopping technique, which boost the quality of synthesized image meanwhile complying with the guidance. Our method outperforms the existing early-constraint methods and generalizes better to unseen condition. Our code would be available.
Abstract（参考訳）: 拡散モデルは、テキスト条件の有無にかかわらず、数語または全くの単語を与えられたフォトリアリスティック画像の合成能力を示す。通常のユーザーやアーティストは、全体的なレイアウト、色、構造、オブジェクトの形状など、特定のガイダンスで合成画像を制御するつもりなので、これらのモデルはユーザーのニーズを十分に満たさないかもしれない。制御可能な画像合成に拡散モデルを適用するために,拡散復調ネットワークの中間特性を正則化するためのいくつかの手法が提案されている。本稿では, 早期制約法として知られ, 単一解法で複数の条件を扱うのに困難がある。彼らは、多くのトレーニングコストと一般化不可能なソリューションを必要とする、特定の条件ごとに別々のモデルをトレーニングすることを意図している。これらの問題に対処するために,我々は拡散ネットワークをそのまま残しながら,その出力が要求条件に合致するように制約するという,遅延制約という新しいアプローチを提案する。具体的には,外部条件と拡散モデルの内部表現との相関性を確立するために,軽量条件アダプタを訓練する。反復分別処理の間、条件付きガイダンスを対応する条件アダプタに送信してサンプリングプロセスを確立された相関で操作する。さらに,提案手法に準拠した合成画像の品質向上を図るため,時間ステップリサンプリング法と早期停止法を用いて,導入した遅延制約戦略を導入する。提案手法は,既存の早期制約法よりも優れ,未確認条件の一般化に優れる。私たちのコードは利用できます。

関連論文リスト

Composition and Alignment of Diffusion Models using Constrained Learning [79.36736636241564]
拡散モデルは、複雑な分布からサンプルを採取する能力により、生成的モデリングにおいて普及している。 i) 拡散モデルを微調整して報酬と整合させるアライメントと、(ii) 予め訓練された拡散モデルを組み合わせて、それぞれが生成した出力に望ましい属性を強調する合成である。本稿では,共役モデルが報酬制約を満たすこと,あるいは(潜在的に複数の)事前学習モデルに近づき続けることを強制することによって,拡散モデルのアライメントと構成を統一する制約付き最適化フレームワークを提案する。
論文参考訳（メタデータ） (2025-08-26T15:06:30Z)
Training-Free Constrained Generation With Stable Diffusion Models [45.138721047543214]
安定拡散モデルは、様々な領域にまたがるデータ合成における最先端のモデルである。本稿では,安定拡散モデルと制約付き最適化フレームワークの新たな統合を提案する。このアプローチの有効性は、精密な形態計測特性の付着を必要とする材料設計実験によって実証される。
論文参考訳（メタデータ） (2025-02-08T16:11:17Z)
Conditional Controllable Image Fusion [56.4120974322286]
条件付き制御可能核融合(CCF)フレームワーク。 CCFは、実際には個々の個人に対して特定の核融合の制約を課している。様々なシナリオにまたがる一般融合タスクにおける有効性を検証する実験。
論文参考訳（メタデータ） (2024-11-03T13:56:15Z)
Model-Based Diffusion for Trajectory Optimization [8.943418808959494]
データ無しで軌道最適化(TO)問題を解決するために拡散法を用いた最適化手法であるモデルベース拡散(MBD)を導入する。 MBDは外部データを必要としないが、様々な性質のデータと自然に統合して拡散過程を制御できる。 MBDは、最先端の強化学習とサンプリングベースのTOメソッドを上回り、コンタクトリッチなタスクに挑戦する。
論文参考訳（メタデータ） (2024-05-28T22:14:25Z)
An Overview of Diffusion Models: Applications, Guided Generation, Statistical Rates and Optimization [59.63880337156392]
拡散モデルはコンピュータビジョン、オーディオ、強化学習、計算生物学において大きな成功を収めた。経験的成功にもかかわらず、拡散モデルの理論は非常に限定的である。本稿では,前向きな理論や拡散モデルの手法を刺激する理論的露光について述べる。
論文参考訳（メタデータ） (2024-04-11T14:07:25Z)
Unveil Conditional Diffusion Models with Classifier-free Guidance: A Sharp Statistical Theory [87.00653989457834]
条件付き拡散モデルは現代の画像合成の基礎となり、計算生物学や強化学習などの分野に広く応用されている。経験的成功にもかかわらず、条件拡散モデルの理論はほとんど欠落している。本稿では,条件拡散モデルを用いた分布推定の急激な統計的理論を提示することにより,ギャップを埋める。
論文参考訳（メタデータ） (2024-03-18T17:08:24Z)
Constrained Synthesis with Projected Diffusion Models [47.56192362295252]
本稿では, 制約や物理原理の遵守を満足し, 証明する上で, 生成拡散プロセスへのアプローチを紹介する。提案手法は, 従来の生成拡散過程を制約分布問題として再キャストし, 制約の順守を保証する。
論文参考訳（メタデータ） (2024-02-05T22:18:16Z)
Steered Diffusion: A Generalized Framework for Plug-and-Play Conditional Image Synthesis [62.07413805483241]
Steered Diffusionは、無条件生成のために訓練された拡散モデルを用いたゼロショット条件画像生成のためのフレームワークである。塗装,着色,テキスト誘導セマンティック編集,画像超解像などのタスクに対して,ステアリング拡散を用いた実験を行った。
論文参考訳（メタデータ） (2023-09-30T02:03:22Z)
Enhanced Controllability of Diffusion Models via Feature Disentanglement and Realism-Enhanced Sampling Methods [27.014858633903867]
拡散モデル(FDiff)の特徴分散のためのトレーニングフレームワークを提案する。本稿では,拡散モデルの現実性を高め,制御性を高める2つのサンプリング手法を提案する。
論文参考訳（メタデータ） (2023-02-28T07:43:00Z)
ShiftDDPMs: Exploring Conditional Diffusion Models by Shifting Diffusion Trajectories [144.03939123870416]
本稿では,前処理に条件を導入することで,新しい条件拡散モデルを提案する。いくつかのシフト規則に基づいて各条件に対して排他的拡散軌跡を割り当てるために、余剰潜在空間を用いる。我々は textbfShiftDDPMs と呼ぶメソッドを定式化し、既存のメソッドの統一的な視点を提供する。
論文参考訳（メタデータ） (2023-02-05T12:48:21Z)
Bi-Noising Diffusion: Towards Conditional Diffusion Models with Generative Restoration Priors [64.24948495708337]
本研究では,事前訓練した非条件拡散モデルを用いて,予測サンプルをトレーニングデータ多様体に導入する手法を提案する。我々は,超解像,着色,乱流除去,画像劣化作業におけるアプローチの有効性を実証するための総合的な実験を行った。
論文参考訳（メタデータ） (2022-12-14T17:26:35Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。