論文の概要: A Taxonomy of Prompt Modifiers for Text-To-Image Generation
- arxiv url: http://arxiv.org/abs/2204.13988v3
- Date: Wed, 14 Jun 2023 10:42:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-17 04:13:05.708322
- Title: A Taxonomy of Prompt Modifiers for Text-To-Image Generation
- Title(参考訳): テキスト・画像生成のためのプロンプト修飾器の分類
- Authors: Jonas Oppenlaender
- Abstract要約: 本稿では,3ヶ月のエスノグラフィー研究に基づいて,オンラインコミュニティの実践者が使用する6種類のプロンプト修飾剤を同定する。
プロンプト修飾子の新たな分類法は、テキスト・ツー・イメージ・ジェネレーションの実践を研究するための概念的な出発点となる。
本稿では,人間-コンピュータインタラクション分野における新しい創造的実践の機会について論じる。
- 参考スコア(独自算出の注目度): 6.903929927172919
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Text-to-image generation has seen an explosion of interest since 2021. Today,
beautiful and intriguing digital images and artworks can be synthesized from
textual inputs ("prompts") with deep generative models. Online communities
around text-to-image generation and AI generated art have quickly emerged. This
paper identifies six types of prompt modifiers used by practitioners in the
online community based on a 3-month ethnographic study. The novel taxonomy of
prompt modifiers provides researchers a conceptual starting point for
investigating the practice of text-to-image generation, but may also help
practitioners of AI generated art improve their images. We further outline how
prompt modifiers are applied in the practice of "prompt engineering." We
discuss research opportunities of this novel creative practice in the field of
Human-Computer Interaction (HCI). The paper concludes with a discussion of
broader implications of prompt engineering from the perspective of Human-AI
Interaction (HAI) in future applications beyond the use case of text-to-image
generation and AI generated art.
- Abstract(参考訳): テキストから画像への生成は2021年以来、注目を集めている。
今日では、美しい、興味深いデジタル画像やアートワークが、テキスト入力("prompts")と深い生成モデルから合成することができる。
テキスト・ツー・画像生成とAI生成アートに関するオンラインコミュニティが急速に現れている。
本稿では,3ヶ月のエスノグラフィー研究に基づいて,オンラインコミュニティの実践者が使用する6種類のプロンプト修飾剤を同定する。
プロンプト修飾子の新しい分類法により、研究者はテキストから画像への生成の実践を研究するための概念的な出発点を提供するが、aiが生成した芸術の実践者がイメージを改善するのに役立つかもしれない。
さらに,「プロンプトエンジニアリング」の実践における即時修飾器の応用について概説する。
本稿では,ヒューマン・コンピュータ・インタラクション(HCI)分野における新しい創造的実践の機会について論じる。
この論文は、テキスト・ツー・イメージ生成とAI生成技術以外の将来の応用におけるヒューマン・AIインタラクション(HAI)の観点から、迅速なエンジニアリングの幅広い意味を論じる。
関連論文リスト
- Equivalence: An analysis of artists' roles with Image Generative AI from Conceptual Art perspective through an interactive installation design practice [16.063735487844628]
本研究では、アーティストが高度なテキストから画像生成AIモデルとどのように相互作用するかを検討する。
この枠組みを実証するために,「等価性」と題されたケーススタディでは,ユーザの音声入力を連続的に変化する絵画に変換する。
この研究は、アーティストの役割に対する理解を深め、画像生成AIで作成されたアートに固有の創造的側面に対する深い評価を促進することを目的としている。
論文 参考訳(メタデータ) (2024-04-29T02:45:23Z) - No Longer Trending on Artstation: Prompt Analysis of Generative AI Art [7.64671395172401]
私たちは300万以上のプロンプトとそれらが生成する画像を収集し、分析します。
本研究は, 表面美学, 文化規範の強化, 一般的な表現, イメージに重点を置いていることを示す。
論文 参考訳(メタデータ) (2024-01-24T08:03:13Z) - Prompt Expansion for Adaptive Text-to-Image Generation [51.67811570987088]
本稿では,より少ない労力で高品質で多様な画像を生成するためのPrompt Expansionフレームワークを提案する。
Prompt Expansionモデルはテキストクエリを入力として取り、拡張されたテキストプロンプトのセットを出力する。
本研究では,Prompt Expansionにより生成された画像が,ベースライン法により生成された画像よりも美的かつ多様であることを示す人体評価研究を行う。
論文 参考訳(メタデータ) (2023-12-27T21:12:21Z) - A Survey of AI Text-to-Image and AI Text-to-Video Generators [0.4662017507844857]
テキスト・トゥ・イメージとテキスト・トゥ・ビデオAI生成モデル(Text-to-Image and Text-to-Video AI generation model)は、ディープラーニングと自然言語処理(NLP)技術を使用して、テキスト記述から画像とビデオを作成する革新的な技術である。
本稿では,テキスト・トゥ・イメージとテキスト・トゥ・ビデオAIの分野における最先端のアプローチについて検討する。
論文 参考訳(メタデータ) (2023-11-10T17:33:58Z) - RenAIssance: A Survey into AI Text-to-Image Generation in the Era of
Large Model [93.8067369210696]
テキスト・ツー・イメージ生成(テキスト・トゥ・イメージ・ジェネレーション、英: Text-to-image Generation、TTI)とは、テキスト入力を処理し、テキスト記述に基づいて高忠実度画像を生成するモデルである。
拡散モデル (diffusion model) は、繰り返しステップによるノイズの体系的導入を通じて画像の生成に使用される顕著な生成モデルである。
大規模モデルの時代、モデルサイズを拡大し、大規模言語モデルとの統合により、TTIモデルの性能がさらに向上した。
論文 参考訳(メタデータ) (2023-09-02T03:27:20Z) - AIwriting: Relations Between Image Generation and Digital Writing [0.0]
2022年、GPT-3のようなAIテキスト生成システムとDALL-E 2のようなAIテキスト・画像生成システムは飛躍的に飛躍した。
このパネルでは、電子文学の著者や理論家のグループが、これらのシステムによって提示される人間の創造性のための新しいオプポー・ツニティについて検討している。
論文 参考訳(メタデータ) (2023-05-18T09:23:05Z) - Text-to-image Diffusion Models in Generative AI: A Survey [86.11421833017693]
本調査は,テキストから画像を生成する際の拡散モデルの進展を概観する。
ビデオなどの様々なモダリティのためのテキスト誘導生成や、テキスト誘導画像編集など、画像生成以外の応用について論じる。
論文 参考訳(メタデータ) (2023-03-14T13:49:54Z) - Visualize Before You Write: Imagination-Guided Open-Ended Text
Generation [68.96699389728964]
我々は、機械生成画像を用いて、オープンエンドテキスト生成における言語モデルをガイドするiNLGを提案する。
オープンエンドテキスト生成タスクにおけるiNLGの有効性について実験と解析を行った。
論文 参考訳(メタデータ) (2022-10-07T18:01:09Z) - Make-A-Scene: Scene-Based Text-to-Image Generation with Human Priors [58.71128866226768]
近年のテキスト・ツー・イメージ生成手法は、生成した画像の忠実度とテキスト関連性を漸進的に改善している。
i)シーンの形式でテキストを補完する単純な制御機構を実現することで,これらのギャップに対処する新しいテキスト・ツー・イメージ手法を提案する。
このモデルにより,512×512ピクセルの解像度で高忠実度画像を生成することができる。
論文 参考訳(メタデータ) (2022-03-24T15:44:50Z) - ViNTER: Image Narrative Generation with Emotion-Arc-Aware Transformer [59.05857591535986]
様々な感情を「感情弧」として表現する時系列に焦点をあてた画像物語を生成するモデルViNTERを提案する。
手動評価と自動評価の両方の実験結果を示す。
論文 参考訳(メタデータ) (2022-02-15T10:53:08Z) - A Framework and Dataset for Abstract Art Generation via CalligraphyGAN [0.0]
本研究では,コンディショナル・ジェネレーティブ・アドバイザリ・ネットワークと文脈ニューラル言語モデルに基づく創造的枠組みを提示し,抽象アートワークを生成する。
私たちの作品は中国書道に触発され、字そのものが美的絵画である独特の視覚芸術形式である。
論文 参考訳(メタデータ) (2020-12-02T16:24:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。