論文の概要: Creative Image Generation with Diffusion Models
- arxiv url: http://arxiv.org/abs/2601.22125v2
- Date: Mon, 02 Feb 2026 20:24:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 16:18:58.814222
- Title: Creative Image Generation with Diffusion Models
- Title(参考訳): 拡散モデルによる創造的画像生成
- Authors: Kunpeng Song, Ahmed Elgammal,
- Abstract要約: 本稿では,CLIP埋め込み空間における画像の存在の逆確率と創造性を関連付ける拡散モデルを用いた創造的生成のための新しい枠組みを提案する。
提案手法は,生成した画像の確率分布を計算し,それを低確率領域に向けて駆動し,希少かつ想像的かつ視覚的に表現可能な出力を生成する。
- 参考スコア(独自算出の注目度): 10.05957748073635
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Creative image generation has emerged as a compelling area of research, driven by the need to produce novel and high-quality images that expand the boundaries of imagination. In this work, we propose a novel framework for creative generation using diffusion models, where creativity is associated with the inverse probability of an image's existence in the CLIP embedding space. Unlike prior approaches that rely on a manual blending of concepts or exclusion of subcategories, our method calculates the probability distribution of generated images and drives it towards low-probability regions to produce rare, imaginative, and visually captivating outputs. We also introduce pullback mechanisms, achieving high creativity without sacrificing visual fidelity. Extensive experiments on text-to-image diffusion models demonstrate the effectiveness and efficiency of our creative generation framework, showcasing its ability to produce unique, novel, and thought-provoking images. This work provides a new perspective on creativity in generative models, offering a principled method to foster innovation in visual content synthesis.
- Abstract(参考訳): 創造的な画像生成は、想像力の境界を広げる新しい高品質の画像を作成する必要性から、魅力的な研究領域として現れてきた。
本稿では,CLIP埋め込み空間における画像の存在の逆確率と創造性が関連付けられた拡散モデルを用いた創造的生成のための新しいフレームワークを提案する。
概念を手動でブレンドしたり、サブカテゴリを除外したりする従来の手法とは異なり、本手法は生成した画像の確率分布を計算し、それを低確率領域に向けて駆動し、希少で想像的かつ視覚的に捕食する出力を生成する。
また、視覚的忠実さを犠牲にすることなく高い創造性を達成する引き戻し機構も導入する。
テキストと画像の拡散モデルに関する大規模な実験は、創造的生成フレームワークの有効性と効率を実証し、ユニークな、斬新で、思考を誘発するイメージを作り出す能力を示している。
この研究は、生成モデルにおける創造性に関する新たな視点を提供し、視覚コンテンツ合成の革新を促進するための原則化された方法を提供する。
関連論文リスト
- Creativity in AI as Emergence from Domain-Limited Generative Models [0.0]
評価フレームワークは、創造性を明示的にモデル化される現象ではなく、評価されるべき特性として扱う。
本稿では,境界情報環境に埋め込まれた領域限定生成モデルの創発的特性として,AIにおける創造性に関する生成的視点を提案する。
論文 参考訳(メタデータ) (2026-01-13T09:52:14Z) - CREward: A Type-Specific Creativity Reward Model [23.62496736021293]
CREwardは3つの創造性軸、幾何学、素材、テクスチャにまたがるタイプ固有の創造性報酬モデルである。
大規模視覚言語モデル(LVLM)による人間の判断と予測の相関分析
創造性評価,説明可能な創造性,創造的サンプル取得の3つの応用を,人間のデザインインスピレーションと,低ランク適応による創造的生成の導出の両面から検討する。
論文 参考訳(メタデータ) (2025-11-25T07:00:42Z) - VLM-Guided Adaptive Negative Prompting for Creative Generation [21.534474554320823]
創造的生成(Creative generation)とは、ユーザの意図を反映する新しい、驚き、価値あるサンプルを事前に想像できない形で合成することである。
本稿では,VLM-Guided Adaptive Negative-Promptingを提案する。
創造的ノベルティにおいて,計算オーバーヘッドの無視による一貫した向上を示す。
論文 参考訳(メタデータ) (2025-10-12T17:34:59Z) - Probing and Inducing Combinational Creativity in Vision-Language Models [52.76981145923602]
VLM(Vision-Language Models)の最近の進歩は、それらのアウトプットが組合せの創造性を反映しているかという議論を引き起こしている。
本稿では,創造的プロセスを3つのレベルに分解するIEIフレームワークを提案する。
このフレームワークを検証するために、IEIフレームワークに従って注釈付けされた666人のアーティストによる視覚マッシュアップの高品質データセットであるCreativeMashupをキュレートする。
論文 参考訳(メタデータ) (2025-04-17T17:38:18Z) - DreamCreature: Crafting Photorealistic Virtual Creatures from
Imagination [140.1641573781066]
ターゲット概念のラベルなしイメージのセットを前提として、我々は、新しいハイブリッド概念を創出できるT2Iモデルをトレーニングすることを目指している。
そこで我々はDreamCreatureと呼ばれる新しい手法を提案し,その基盤となるサブ概念を同定し抽出する。
したがって、T2Iは忠実な構造とフォトリアリスティックな外観を持つ新しい概念を生成するのに適応する。
論文 参考訳(メタデータ) (2023-11-27T01:24:31Z) - ConceptLab: Creative Concept Generation using VLM-Guided Diffusion Prior
Constraints [56.824187892204314]
我々は創造的なテキスト・画像生成の課題を提示し、幅広いカテゴリの新しいメンバーを創り出そうとする。
本稿では, 先行拡散の出力空間上での最適化プロセスとして, 創造的生成問題を定式化できることを示す。
我々は、最適化問題に新たな制約を適応的に付加する質問応答型視覚言語モデル(VLM)を導入し、よりユニークな生成物を発見するようモデルに促す。
論文 参考訳(メタデータ) (2023-08-03T17:04:41Z) - Towards Creativity Characterization of Generative Models via Group-based
Subset Scanning [64.6217849133164]
創造的プロセスを特定し,定量化し,特徴付けるグループベースサブセットスキャンを提案する。
創造的なサンプルは、データセット全体にわたる通常のサンプルや非創造的なサンプルよりも大きな異常のサブセットを生成する。
論文 参考訳(メタデータ) (2022-03-01T15:07:14Z) - Towards creativity characterization of generative models via group-based
subset scanning [51.84144826134919]
創造的プロセスを定量化し,検出し,特徴付けるグループベースサブセットスキャンを提案する。
創造的なサンプルは、データセットをまたいだ通常または非創造的なサンプルよりも大きな異常のサブセットを生成する。
論文 参考訳(メタデータ) (2021-04-01T14:07:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。