論文の概要: RePrompt: Automatic Prompt Editing to Refine AI-Generative Art Towards
Precise Expressions
- arxiv url: http://arxiv.org/abs/2302.09466v3
- Date: Mon, 20 Mar 2023 02:34:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-23 23:45:04.918356
- Title: RePrompt: Automatic Prompt Editing to Refine AI-Generative Art Towards
Precise Expressions
- Title(参考訳): RePrompt: 精密表現に向けてAI生成芸術を再現する自動プロンプト編集
- Authors: Yunlong Wang, Shuyuan Shen, Brian Y. Lim
- Abstract要約: 本研究では,生成した画像の正確な表現に向けて,テキストプロンプトを洗練するためのRePromptを開発する。
クラウドソースによる編集戦略に触発されて,名詞の数や具体性などの直感的なテキスト機能をキュレートした。
プロキシモデルのモデル説明を用いて,テキストプロンプトを調整し,正確な感情表現のための画像生成を最適化した。
- 参考スコア(独自算出の注目度): 9.51095076299351
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative AI models have shown impressive ability to produce images with
text prompts, which could benefit creativity in visual art creation and
self-expression. However, it is unclear how precisely the generated images
express contexts and emotions from the input texts. We explored the emotional
expressiveness of AI-generated images and developed RePrompt, an automatic
method to refine text prompts toward precise expression of the generated
images. Inspired by crowdsourced editing strategies, we curated intuitive text
features, such as the number and concreteness of nouns, and trained a proxy
model to analyze the feature effects on the AI-generated image. With model
explanations of the proxy model, we curated a rubric to adjust text prompts to
optimize image generation for precise emotion expression. We conducted
simulation and user studies, which showed that RePrompt significantly improves
the emotional expressiveness of AI-generated images, especially for negative
emotions.
- Abstract(参考訳): 生成AIモデルは、テキストプロンプトで画像を生成する素晴らしい能力を示しており、視覚芸術の創造性と自己表現の創造性に恩恵をもたらす可能性がある。
しかし、生成した画像が入力テキストから文脈や感情を正確に表現しているかは明らかでない。
我々は,AI生成画像の感情表現性を探求し,生成画像の正確な表現に向けてテキストプロンプトを洗練させるRePromptを開発した。
クラウドソースによる編集戦略に触発されて、名詞の数や具体性などの直感的なテキスト機能をキュレーションし、プロキシモデルを訓練し、AI生成画像の特徴効果を分析した。
プロキシモデルのモデル説明を用いて,テキストプロンプトを調整し,正確な感情表現のための画像生成を最適化した。
シミュレーションとユーザスタディを行い、RePromptはAI生成画像の感情表現性、特に負の感情に対して著しく改善することを示した。
関連論文リスト
- Dynamic Prompt Optimizing for Text-to-Image Generation [63.775458908172176]
テキストから画像への生成モデルを改善するために,textbfPrompt textbfAuto-textbfEditing (PAE)法を導入する。
我々は、各単語の重みと射出時間ステップを探索するために、オンライン強化学習戦略を採用し、動的微調整プロンプトを導いた。
論文 参考訳(メタデータ) (2024-04-05T13:44:39Z) - EmoGen: Emotional Image Content Generation with Text-to-Image Diffusion
Models [11.901294654242376]
本稿では,感情カテゴリを与えられた意味的明瞭で感情に忠実な画像を生成するための新しいタスクである感情画像コンテンツ生成(EICG)を紹介する。
具体的には、感情空間を提案し、それを強力なコントラスト言語-画像事前学習(CLIP)空間と整合させるマッピングネットワークを構築する。
本手法は,最先端のテクスト・ツー・イメージ・アプローチを定量的・質的に上回る。
論文 参考訳(メタデータ) (2024-01-09T15:23:21Z) - Prompt Expansion for Adaptive Text-to-Image Generation [51.67811570987088]
本稿では,より少ない労力で高品質で多様な画像を生成するためのPrompt Expansionフレームワークを提案する。
Prompt Expansionモデルはテキストクエリを入力として取り、拡張されたテキストプロンプトのセットを出力する。
本研究では,Prompt Expansionにより生成された画像が,ベースライン法により生成された画像よりも美的かつ多様であることを示す人体評価研究を行う。
論文 参考訳(メタデータ) (2023-12-27T21:12:21Z) - A Portrait of Emotion: Empowering Self-Expression through AI-Generated
Art [0.0]
本研究では,創造的表現を通じて著者の認知過程を反映する生成人工知能(AI)の可能性と限界について検討した。
その結果,主イベントに対する著者の感情の記述に基づく画像の嗜好が示された。
生成AIを用いた研究フレームワークは、関連する分野におけるAIベースの介入を設計するのに役立ちます。
論文 参考訳(メタデータ) (2023-04-26T06:54:53Z) - Attend-and-Excite: Attention-Based Semantic Guidance for Text-to-Image
Diffusion Models [103.61066310897928]
最近のテキスト・ツー・イメージ生成モデルは、ターゲットのテキスト・プロンプトによって導かれる多様な創造的な画像を生成する非例外的な能力を実証している。
革命的ではあるが、現在の最先端拡散モデルは、与えられたテキストプロンプトのセマンティクスを完全に伝達するイメージの生成に失敗する可能性がある。
本研究では, 一般に公開されている安定拡散モデルを分析し, 破滅的無視の有無を評価し, そのモデルが入力プロンプトから1つ以上の被写体を生成するのに失敗した場合について検討する。
提案するジェネレーティブ・セマンティック・ナーシング(GSN)の概念は、推論時間中にハエの生殖過程に介入し、忠実性を改善するものである。
論文 参考訳(メタデータ) (2023-01-31T18:10:38Z) - Plug-and-Play Diffusion Features for Text-Driven Image-to-Image
Translation [10.39028769374367]
本稿では,画像間翻訳の領域にテキスト・ツー・イメージ合成を取り入れた新しいフレームワークを提案する。
本手法は,事前学習したテキスト・画像拡散モデルのパワーを利用して,対象のテキストに適合する新たな画像を生成する。
論文 参考訳(メタデータ) (2022-11-22T20:39:18Z) - Visualize Before You Write: Imagination-Guided Open-Ended Text
Generation [68.96699389728964]
我々は、機械生成画像を用いて、オープンエンドテキスト生成における言語モデルをガイドするiNLGを提案する。
オープンエンドテキスト生成タスクにおけるiNLGの有効性について実験と解析を行った。
論文 参考訳(メタデータ) (2022-10-07T18:01:09Z) - ViNTER: Image Narrative Generation with Emotion-Arc-Aware Transformer [59.05857591535986]
様々な感情を「感情弧」として表現する時系列に焦点をあてた画像物語を生成するモデルViNTERを提案する。
手動評価と自動評価の両方の実験結果を示す。
論文 参考訳(メタデータ) (2022-02-15T10:53:08Z) - Altering Facial Expression Based on Textual Emotion [0.19573380763700707]
我々はGAN(Generative Adversarial Network)を用いて画像中の表情を変化させることを目指している。
与えられたテキストから感情によって示されるイメージの表情をモデル化することで、作業を拡張します。
作業パイプラインのデモとして、異なる表現でプロファイルイメージを再生するブログのアプリケーションプロトタイプを作成しました。
論文 参考訳(メタデータ) (2021-12-02T17:52:25Z) - Facial Expression Editing with Continuous Emotion Labels [76.36392210528105]
深層生成モデルは、自動表情編集の分野で素晴らしい成果を上げている。
連続した2次元の感情ラベルに従って顔画像の表情を操作できるモデルを提案する。
論文 参考訳(メタデータ) (2020-06-22T13:03:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。