論文の概要: Prompt Engineering for Text-Based Generative Art
- arxiv url: http://arxiv.org/abs/2204.13988v1
- Date: Wed, 20 Apr 2022 06:15:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-09 03:52:23.060583
- Title: Prompt Engineering for Text-Based Generative Art
- Title(参考訳): テキスト生成技術のためのプロンプトエンジニアリング
- Authors: Jonas Oppenlaender
- Abstract要約: 本稿は,Twitter上のテキスト生成技術コミュニティにおいて,実践者が用いた5種類のプロンプト修飾器について述べる。
本稿は,テキスト生成技術の分野における研究の機会と,今後の応用における即時工学の影響について論じる。
- 参考スコア(独自算出の注目度): 6.903929927172919
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Text-based generative art has seen an explosion of interest in 2021. Online
communities around text-based generative art as a novel digital medium have
quickly emerged. This short paper identifies five types of prompt modifiers
used by practitioners in the community of text-based generative art based on a
3-month ethnographic study on Twitter. The novel taxonomy of prompt modifiers
provides researchers a conceptual starting point for investigating the
practices of text-based generative art, but also may help practitioners of
text-based generative art improve their images. The paper concludes with a
discussion of research opportunities in the space of text-based generative art
and the broader implications of prompt engineering from the perspective of
human-AI interaction in future applications beyond the use case of text-based
generative art.
- Abstract(参考訳): テキストベースの生成アートは2021年に爆発的に注目を集めている。
デジタルメディアとしてのテキストベースの生成芸術に関するオンラインコミュニティが急速に登場している。
本稿は,Twitter上での3ヶ月のエスノグラフィー研究に基づいて,テキスト生成技術コミュニティにおいて実践者が使用する5種類のプロンプト修飾体を同定する。
プロンプト修飾子の新しい分類法により、研究者はテキストベースの生成芸術の実践を研究するための概念的な出発点となるが、テキストベースの生成芸術の実践者がイメージを改善するのに役立つかもしれない。
本稿は,テキストベース生成技術の分野における研究機会と,テキストベース生成技術の応用を超えた今後の応用における人間とAIの相互作用の観点から,迅速なエンジニアリングの幅広い意味を論じる。
関連論文リスト
- Equivalence: An analysis of artists' roles with Image Generative AI from Conceptual Art perspective through an interactive installation design practice [16.063735487844628]
本研究では、アーティストが高度なテキストから画像生成AIモデルとどのように相互作用するかを検討する。
この枠組みを実証するために,「等価性」と題されたケーススタディでは,ユーザの音声入力を連続的に変化する絵画に変換する。
この研究は、アーティストの役割に対する理解を深め、画像生成AIで作成されたアートに固有の創造的側面に対する深い評価を促進することを目的としている。
論文 参考訳(メタデータ) (2024-04-29T02:45:23Z) - No Longer Trending on Artstation: Prompt Analysis of Generative AI Art [7.64671395172401]
私たちは300万以上のプロンプトとそれらが生成する画像を収集し、分析します。
本研究は, 表面美学, 文化規範の強化, 一般的な表現, イメージに重点を置いていることを示す。
論文 参考訳(メタデータ) (2024-01-24T08:03:13Z) - Prompt Expansion for Adaptive Text-to-Image Generation [51.67811570987088]
本稿では,より少ない労力で高品質で多様な画像を生成するためのPrompt Expansionフレームワークを提案する。
Prompt Expansionモデルはテキストクエリを入力として取り、拡張されたテキストプロンプトのセットを出力する。
本研究では,Prompt Expansionにより生成された画像が,ベースライン法により生成された画像よりも美的かつ多様であることを示す人体評価研究を行う。
論文 参考訳(メタデータ) (2023-12-27T21:12:21Z) - A Survey of AI Text-to-Image and AI Text-to-Video Generators [0.4662017507844857]
テキスト・トゥ・イメージとテキスト・トゥ・ビデオAI生成モデル(Text-to-Image and Text-to-Video AI generation model)は、ディープラーニングと自然言語処理(NLP)技術を使用して、テキスト記述から画像とビデオを作成する革新的な技術である。
本稿では,テキスト・トゥ・イメージとテキスト・トゥ・ビデオAIの分野における最先端のアプローチについて検討する。
論文 参考訳(メタデータ) (2023-11-10T17:33:58Z) - RenAIssance: A Survey into AI Text-to-Image Generation in the Era of
Large Model [93.8067369210696]
テキスト・ツー・イメージ生成(テキスト・トゥ・イメージ・ジェネレーション、英: Text-to-image Generation、TTI)とは、テキスト入力を処理し、テキスト記述に基づいて高忠実度画像を生成するモデルである。
拡散モデル (diffusion model) は、繰り返しステップによるノイズの体系的導入を通じて画像の生成に使用される顕著な生成モデルである。
大規模モデルの時代、モデルサイズを拡大し、大規模言語モデルとの統合により、TTIモデルの性能がさらに向上した。
論文 参考訳(メタデータ) (2023-09-02T03:27:20Z) - AIwriting: Relations Between Image Generation and Digital Writing [0.0]
2022年、GPT-3のようなAIテキスト生成システムとDALL-E 2のようなAIテキスト・画像生成システムは飛躍的に飛躍した。
このパネルでは、電子文学の著者や理論家のグループが、これらのシステムによって提示される人間の創造性のための新しいオプポー・ツニティについて検討している。
論文 参考訳(メタデータ) (2023-05-18T09:23:05Z) - Text-to-image Diffusion Models in Generative AI: A Survey [86.11421833017693]
本調査は,テキストから画像を生成する際の拡散モデルの進展を概観する。
ビデオなどの様々なモダリティのためのテキスト誘導生成や、テキスト誘導画像編集など、画像生成以外の応用について論じる。
論文 参考訳(メタデータ) (2023-03-14T13:49:54Z) - Visualize Before You Write: Imagination-Guided Open-Ended Text
Generation [68.96699389728964]
我々は、機械生成画像を用いて、オープンエンドテキスト生成における言語モデルをガイドするiNLGを提案する。
オープンエンドテキスト生成タスクにおけるiNLGの有効性について実験と解析を行った。
論文 参考訳(メタデータ) (2022-10-07T18:01:09Z) - Make-A-Scene: Scene-Based Text-to-Image Generation with Human Priors [58.71128866226768]
近年のテキスト・ツー・イメージ生成手法は、生成した画像の忠実度とテキスト関連性を漸進的に改善している。
i)シーンの形式でテキストを補完する単純な制御機構を実現することで,これらのギャップに対処する新しいテキスト・ツー・イメージ手法を提案する。
このモデルにより,512×512ピクセルの解像度で高忠実度画像を生成することができる。
論文 参考訳(メタデータ) (2022-03-24T15:44:50Z) - ViNTER: Image Narrative Generation with Emotion-Arc-Aware Transformer [59.05857591535986]
様々な感情を「感情弧」として表現する時系列に焦点をあてた画像物語を生成するモデルViNTERを提案する。
手動評価と自動評価の両方の実験結果を示す。
論文 参考訳(メタデータ) (2022-02-15T10:53:08Z) - A Framework and Dataset for Abstract Art Generation via CalligraphyGAN [0.0]
本研究では,コンディショナル・ジェネレーティブ・アドバイザリ・ネットワークと文脈ニューラル言語モデルに基づく創造的枠組みを提示し,抽象アートワークを生成する。
私たちの作品は中国書道に触発され、字そのものが美的絵画である独特の視覚芸術形式である。
論文 参考訳(メタデータ) (2020-12-02T16:24:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。