論文の概要: TCIG: Two-Stage Controlled Image Generation with Quality Enhancement
through Diffusion
- arxiv url: http://arxiv.org/abs/2403.01212v1
- Date: Sat, 2 Mar 2024 13:59:02 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-05 14:50:47.369262
- Title: TCIG: Two-Stage Controlled Image Generation with Quality Enhancement
through Diffusion
- Title(参考訳): TCIG:拡散による画質向上を伴う2段階制御画像生成
- Authors: Salaheldin Mohamed
- Abstract要約: 画像生成における制御性と高品質を両立させる2段階の手法を提案する。
制御性と高品質を分離することにより,優れた結果が得られる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In recent years, significant progress has been made in the development of
text- to-image generation models. However, these models still face limitations
when it comes to achieving full controllability during the generation process.
Often, spe- cific training or the use of limited models is required, and even
then, they have certain restrictions. To address these challenges, A two-stage
method that effec- tively combines controllability and high quality in the
generation of images is proposed. This approach leverages the expertise of
pre-trained models to achieve precise control over the generated images, while
also harnessing the power of diffusion models to achieve state-of-the-art
quality. By separating controllability from high quality, This method achieves
outstanding results. It is compatible with both latent and image space
diffusion models, ensuring versatility and flexibil- ity. Moreover, This
approach consistently produces comparable outcomes to the current
state-of-the-art methods in the field. Overall, This proposed method rep-
resents a significant advancement in text-to-image generation, enabling
improved controllability without compromising on the quality of the generated
images.
- Abstract(参考訳): 近年,テキスト・ツー・イメージ生成モデルの開発において,大きな進歩を遂げている。
しかし、これらのモデルは生成プロセス中に完全な制御性を達成することに関して制限に直面している。
多くの場合、spe-cific trainingや限定的なモデルの使用が必要であり、それでも一定の制限がある。
これらの課題に対処するために,effecによる画像生成の制御性と高品質化を両立する2段階法を提案する。
このアプローチは、訓練済みのモデルの専門知識を活用して、生成された画像を正確に制御すると同時に、拡散モデルの力を利用して最先端の品質を達成する。
制御性を高品質から分離することにより,優れた結果が得られる。
潜像拡散モデルと画像空間拡散モデルの両方と互換性があり、柔軟性と柔軟性を確保している。
さらに、このアプローチは、フィールドにおける現在の最先端メソッドと同等の結果を一貫して生成する。
全体として,提案手法はテキスト対画像生成の著しい進歩を示し,生成画像の品質を損なうことなく制御性の向上を実現する。
関連論文リスト
- Giving a Hand to Diffusion Models: a Two-Stage Approach to Improving Conditional Human Image Generation [29.79050316749927]
ポーズ条件付き人体画像生成に新たなアプローチを導入し,その過程を2段階に分けた。
両ステージの結果をコヒーレントな方法で組み合わせた第2段階のハンドディテールを維持するために, 新規なブレンディング技術が導入された。
提案手法は生成した手の品質を向上するだけでなく、ポーズ条件付き人体画像生成の能力を向上させるとともに、手ポーズの制御も改善する。
論文 参考訳(メタデータ) (2024-03-15T23:31:41Z) - Active Generation for Image Classification [50.18107721267218]
本稿では,モデルのニーズと特徴に着目し,画像生成の効率性に対処することを提案する。
能動学習の中心的傾向として,ActGenという手法が,画像生成のトレーニング・アウェア・アプローチを取り入れている。
論文 参考訳(メタデータ) (2024-03-11T08:45:31Z) - Class-Prototype Conditional Diffusion Model with Gradient Projection for Continual Learning [20.175586324567025]
破滅的な忘れ方を減らすことは、継続的な学習における重要なハードルである。
大きな問題は、生成したデータの品質がオリジナルのものと比べて低下することである。
本稿では,ジェネレータにおける画像品質を向上させる連続学習のためのGRに基づくアプローチを提案する。
論文 参考訳(メタデータ) (2023-12-10T17:39:42Z) - Image Inpainting via Tractable Steering of Diffusion Models [54.13818673257381]
本稿では,トラクタブル確率モデル(TPM)の制約後部を正確に,かつ効率的に計算する能力を活用することを提案する。
具体的には、確率回路(PC)と呼ばれる表現型TPMのクラスを採用する。
提案手法は, 画像の全体的な品質とセマンティックコヒーレンスを, 計算オーバーヘッドを10%加えるだけで一貫的に改善できることを示す。
論文 参考訳(メタデータ) (2023-11-28T21:14:02Z) - CoDi: Conditional Diffusion Distillation for Higher-Fidelity and Faster
Image Generation [49.3016007471979]
大規模な生成拡散モデルは、テキスト・ツー・イメージ生成に革命をもたらし、条件付き生成タスクに大きな可能性を秘めている。
しかし、彼らの普及は高い計算コストによって妨げられ、リアルタイムの応用が制限される。
本稿では,事前学習した潜伏拡散モデルに付加的な画像条件入力を適応させるCoDiという新しい手法を提案する。
論文 参考訳(メタデータ) (2023-10-02T17:59:18Z) - Steered Diffusion: A Generalized Framework for Plug-and-Play Conditional
Image Synthesis [62.07413805483241]
Steered Diffusionは、無条件生成のために訓練された拡散モデルを用いたゼロショット条件画像生成のためのフレームワークである。
塗装,着色,テキスト誘導セマンティック編集,画像超解像などのタスクに対して,ステアリング拡散を用いた実験を行った。
論文 参考訳(メタデータ) (2023-09-30T02:03:22Z) - Conditional Generation from Unconditional Diffusion Models using
Denoiser Representations [94.04631421741986]
本稿では,学習したデノイザネットワークの内部表現を用いて,事前学習した非条件拡散モデルを新しい条件に適用することを提案する。
提案手法により生成した合成画像を用いたTiny ImageNetトレーニングセットの強化により,ResNetベースラインの分類精度が最大8%向上することを示す。
論文 参考訳(メタデータ) (2023-06-02T20:09:57Z) - Auto-regressive Image Synthesis with Integrated Quantization [55.51231796778219]
本稿では,条件付き画像生成のための多目的フレームワークを提案する。
CNNの帰納バイアスと自己回帰の強力なシーケンスモデリングが組み込まれている。
提案手法は,最先端技術と比較して,優れた多彩な画像生成性能を実現する。
論文 参考訳(メタデータ) (2022-07-21T22:19:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。