論文の概要: ComfyGI: Automatic Improvement of Image Generation Workflows
- arxiv url: http://arxiv.org/abs/2411.14193v1
- Date: Thu, 21 Nov 2024 15:02:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-22 15:20:55.642688
- Title: ComfyGI: Automatic Improvement of Image Generation Workflows
- Title(参考訳): ComfyGI: 画像生成ワークフローの自動改善
- Authors: Dominik Sobania, Martin Briesch, Franz Rothlauf,
- Abstract要約: ComfyGIは、人間の介入なしに画像生成を自動的に改善するための新しいアプローチである。
最適化されたワークフローで生成された画像は、中央値のImageRewardスコアから見ると、初期ワークフローと比べて約50%良いことがわかった。
- 参考スコア(独自算出の注目度): 0.8602553195689513
- License:
- Abstract: Automatic image generation is no longer just of interest to researchers, but also to practitioners. However, current models are sensitive to the settings used and automatic optimization methods often require human involvement. To bridge this gap, we introduce ComfyGI, a novel approach to automatically improve workflows for image generation without the need for human intervention driven by techniques from genetic improvement. This enables image generation with significantly higher quality in terms of the alignment with the given description and the perceived aesthetics. On the performance side, we find that overall, the images generated with an optimized workflow are about 50% better compared to the initial workflow in terms of the median ImageReward score. These already good results are even surpassed in our human evaluation, as the participants preferred the images improved by ComfyGI in around 90% of the cases.
- Abstract(参考訳): 自動画像生成はもはや研究者だけでなく、実践者にとっても興味を持つものとなっている。
しかし、現在のモデルは使用される設定に敏感であり、自動最適化手法は人間の関与を必要とすることが多い。
このギャップを埋めるために,遺伝子改良による人為的介入を必要とせず,画像生成のためのワークフローを自動的に改善する新しいアプローチであるComfyGIを導入する。
これにより、与えられた記述と認識された美学との整合性の観点から、画質が著しく向上する画像生成が可能となる。
パフォーマンス面では、最適化されたワークフローで生成された画像は、中央値のImageRewardスコアから見ると、初期ワークフローと比べて約50%良いことが分かりました。
被験者はComfyGIで改善した画像が約90%の症例で好まれていたため、これらの結果はすでに人間の評価に勝っている。
関連論文リスト
- Augmented Conditioning Is Enough For Effective Training Image Generation [11.60839452103417]
実画像の生成プロセスの条件付けとテキストのプロンプトにより、下流トレーニングに有効な合成データセットとして機能する世代を生成することが判明した。
我々は,5つの確立された長尾画像と少数ショット画像の分類ベンチマークにおいて,拡張条件を検証した。
論文 参考訳(メタデータ) (2025-02-06T19:57:33Z) - Active Generation for Image Classification [45.93535669217115]
本稿では,モデルのニーズと特徴に着目し,画像生成の効率性に対処することを提案する。
能動学習の中心的傾向として,ActGenという手法が,画像生成のトレーニング・アウェア・アプローチを取り入れている。
論文 参考訳(メタデータ) (2024-03-11T08:45:31Z) - Q-Refine: A Perceptual Quality Refiner for AI-Generated Image [85.89840673640028]
Q-Refineという品質改善手法を提案する。
画像品質評価(IQA)メトリクスを使用して、初めて精錬プロセスをガイドする。
忠実度と美的品質の両方からAIGIを最適化するための一般的な精錬機となる。
論文 参考訳(メタデータ) (2024-01-02T09:11:23Z) - Emu: Enhancing Image Generation Models Using Photogenic Needles in a
Haystack [75.00066365801993]
Webスケールの画像-テキストペアによるテキスト-画像モデルのトレーニングにより、テキストから幅広い視覚概念を生成することができる。
これらの事前訓練されたモデルは、高度に美的な画像を生成することに関して、しばしば課題に直面します。
本稿では,高度に視覚的に魅力的な画像のみを生成するために,事前学習されたモデルを誘導する品質チューニングを提案する。
論文 参考訳(メタデータ) (2023-09-27T17:30:19Z) - SAGE: Saliency-Guided Mixup with Optimal Rearrangements [22.112463794733188]
最適リアレンジメント(SAGE)を用いたサリエンシ誘導混合
SAGEは、ビジュアル・サリエンシをガイダンスとして、イメージペアを並べ替え、混合することで、新しいトレーニング例を作成する。
我々は, CIFAR-10 と CIFAR-100 について, SAGE がより効率的でありながら, より優れた性能と同等の性能を達成できることを実証した。
論文 参考訳(メタデータ) (2022-10-31T19:45:21Z) - Controllable Image Enhancement [66.18525728881711]
いくつかのパラメータを制御して、複数のスタイルで高品質な画像を生成できる半自動画像強調アルゴリズムを提案する。
エンコーダ・デコーダフレームワークは、リタッチスキルを潜在コードにエンコードし、イメージ信号処理機能のパラメータにデコードする。
論文 参考訳(メタデータ) (2022-06-16T23:54:53Z) - Conformer and Blind Noisy Students for Improved Image Quality Assessment [80.57006406834466]
知覚品質評価(IQA)のための学習ベースアプローチは、通常、知覚品質を正確に測定するために歪んだ画像と参照画像の両方を必要とする。
本研究では,変換器を用いた全参照IQAモデルの性能について検討する。
また,全教師モデルから盲人学生モデルへの半教師付き知識蒸留に基づくIQAの手法を提案する。
論文 参考訳(メタデータ) (2022-04-27T10:21:08Z) - A Generic Approach for Enhancing GANs by Regularized Latent Optimization [79.00740660219256]
本稿では,事前学習したGANを効果的かつシームレスに拡張できる,エミュレーティブモデル推論と呼ばれる汎用フレームワークを提案する。
我々の基本的な考え方は、ワッサーシュタイン勾配流法を用いて与えられた要求に対する最適潜時分布を効率的に推算することである。
論文 参考訳(メタデータ) (2021-12-07T05:22:50Z) - NICER: Aesthetic Image Enhancement with Humans in the Loop [0.7756211500979312]
本研究は,完全,半自動,完全手動のプロセスにおいて,非参照画像強調に対するニューラルネットワークに基づくアプローチを提案する。
NICERは,ユーザインタラクションを伴わずに画像美学を向上し,ユーザインタラクションを可能とすることで,多様な改善結果が得られることを示す。
論文 参考訳(メタデータ) (2020-12-03T09:14:10Z) - Automated Synthetic-to-Real Generalization [142.41531132965585]
本稿では,レイヤワイズ学習率の選択を自動化するためのテキスト学習最適化(L2O)戦略を提案する。
提案手法は,実データを見たり,トレーニングしたりすることなく,合成から現実への一般化性能を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2020-07-14T10:57:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。