論文の概要: Redefining in Dictionary: Towards a Enhanced Semantic Understanding of Creative Generation
- arxiv url: http://arxiv.org/abs/2410.24160v1
- Date: Thu, 31 Oct 2024 17:19:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-01 17:03:23.286714
- Title: Redefining <Creative> in Dictionary: Towards a Enhanced Semantic Understanding of Creative Generation
- Title(参考訳): 辞書における<Creative>を再定義する:創造的生成のセマンティック理解の強化を目指して
- Authors: Fu Feng, Yucheng Xie, Jing Wang, Xin Geng,
- Abstract要約: CreTokを導入し、" Creative" をトークン $texttCreTok>$ として再定義します。
CreTokは、より柔軟性と時間のオーバーヘッドを減らし、texttCreTok>$は任意の概念のユニバーサルトークンとして機能する。
- 参考スコア(独自算出の注目度): 37.97945436202779
- License:
- Abstract: Creativity, both in human and diffusion models, remains an inherently abstract concept; thus, simply adding "creative" to a prompt does not yield reliable semantic recognition by the model. In this work, we concretize the abstract notion of "creative" through the TP2O task, which aims to merge two unrelated concepts, and introduce CreTok, redefining "creative" as the token $\texttt{<CreTok>}$. This redefinition offers a more concrete and universally adaptable representation for concept blending. This redefinition occurs continuously, involving the repeated random sampling of text pairs with different concepts and optimizing cosine similarity between target and constant prompts. This approach enables $\texttt{<CreTok>}$ to learn a method for creative concept fusion. Extensive experiments demonstrate that the creative capability enabled by $\texttt{<CreTok>}$ substantially surpasses recent SOTA diffusion models and achieves superior creative generation. CreTok exhibits greater flexibility and reduced time overhead, as $\texttt{<CreTok>}$ can function as a universal token for any concept, facilitating creative generation without retraining.
- Abstract(参考訳): 人間と拡散モデルの両方において創造性は本質的に抽象的な概念であり、プロンプトに「創造的」を追加するだけでモデルによる信頼できる意味認識が得られない。
本研究では,2つの無関係な概念を統合することを目的としたTP2Oタスクを通じて「創造性」という抽象概念を整理し,CreTokを導入し,トークンとして「創造性」を再定義する。
この再定義は、概念ブレンディングに対してより具体的で普遍的に適応可能な表現を提供する。
この再定義は連続的に行われ、異なる概念を持つテキストペアのランダムサンプリングを繰り返し、ターゲットと一定プロンプトのコサイン類似性を最適化する。
このアプローチにより、$\texttt{<CreTok>}$でクリエイティブな概念融合の方法を学ぶことができる。
大規模な実験により、$\texttt{<CreTok>}$で実現された創造力は、最近のSOTA拡散モデルを大幅に上回り、優れた創造力を生み出すことが示されている。
CreTokは、より柔軟性と時間のオーバーヘッドを減らし、$\texttt{<CreTok>}$は任意の概念の普遍トークンとして機能し、再トレーニングなしに創造的な生成を容易にする。
関連論文リスト
- Innovative Thinking, Infinite Humor: Humor Research of Large Language Models through Structured Thought Leaps [34.35304020094762]
ヒューモア(英: Humor)は、人間の言語における文化的に曖昧な側面であり、理解と生成の課題を提示する。
本稿では,ユーモアを創造する体系的な考え方を提案し,それに基づいてCreative Leap of Structured Thought frameを構築した。
論文 参考訳(メタデータ) (2024-10-14T10:50:16Z) - Towards a Formal Creativity Theory: Preliminary results in Novelty and Transformativeness [0.0]
この形式化は、フォーマル・クリエイティビティ理論(Formal Creativity Theory)と呼ばれる研究分野の始まりである。
創発的な創造性は一般には必要ないが、経験の連続ではなく刺激的な集合を使う場合、エージェントは実際に変化的な創造性を起こすのに斬新性を必要とする。
論文 参考訳(メタデータ) (2024-05-03T14:53:46Z) - DreamCreature: Crafting Photorealistic Virtual Creatures from
Imagination [140.1641573781066]
ターゲット概念のラベルなしイメージのセットを前提として、我々は、新しいハイブリッド概念を創出できるT2Iモデルをトレーニングすることを目指している。
そこで我々はDreamCreatureと呼ばれる新しい手法を提案し,その基盤となるサブ概念を同定し抽出する。
したがって、T2Iは忠実な構造とフォトリアリスティックな外観を持つ新しい概念を生成するのに適応する。
論文 参考訳(メタデータ) (2023-11-27T01:24:31Z) - Multi-Concept T2I-Zero: Tweaking Only The Text Embeddings and Nothing
Else [75.6806649860538]
我々は,事前学習した拡散モデルを用いた自然多概念生成という,より野心的な目標を考える。
マルチコンセプト生成性能を著しく低下させる概念支配と非局所的貢献を観察する。
我々は、より現実的なマルチコンセプトのテキスト・ツー・イメージ生成のために、テキストの埋め込みを微調整することで、上記の問題を克服する最小の低コストのソリューションを設計する。
論文 参考訳(メタデータ) (2023-10-11T12:05:44Z) - Create Your World: Lifelong Text-to-Image Diffusion [75.14353789007902]
本稿では,過去の概念の「破滅的忘れ」を克服するために,ライフロングテキスト・画像拡散モデル(L2DM)を提案する。
我々のL2DMフレームワークは,知識の「破滅的忘れ」に関して,タスク対応メモリ拡張モジュールと弾性概念蒸留モジュールを考案している。
我々のモデルは、質的および定量的な指標の両方の観点から、連続的なテキストプロンプトの範囲にわたって、より忠実な画像を生成することができる。
論文 参考訳(メタデータ) (2023-09-08T16:45:56Z) - ConceptLab: Creative Concept Generation using VLM-Guided Diffusion Prior
Constraints [56.824187892204314]
我々は創造的なテキスト・画像生成の課題を提示し、幅広いカテゴリの新しいメンバーを創り出そうとする。
本稿では, 先行拡散の出力空間上での最適化プロセスとして, 創造的生成問題を定式化できることを示す。
我々は、最適化問題に新たな制約を適応的に付加する質問応答型視覚言語モデル(VLM)を導入し、よりユニークな生成物を発見するようモデルに促す。
論文 参考訳(メタデータ) (2023-08-03T17:04:41Z) - Explaining Creative Artifacts [69.86890599471202]
生成物と構成的創造性を結合鎖に分解する逆問題定式化を開発する。
特に、当社の定式化は、アソシエイト要素の知識グラフを通じて、旅行セールスマン問題の解決として構成されている。
論文 参考訳(メタデータ) (2020-10-14T14:32:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。