論文の概要: Spellburst: A Node-based Interface for Exploratory Creative Coding with
Natural Language Prompts
- arxiv url: http://arxiv.org/abs/2308.03921v1
- Date: Mon, 7 Aug 2023 21:54:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-20 16:46:09.276976
- Title: Spellburst: A Node-based Interface for Exploratory Creative Coding with
Natural Language Prompts
- Title(参考訳): Spellburst: 自然言語による探索的創造的コーディングのためのノードベースのインターフェース
- Authors: Tyler Angert, Miroslav Ivan Suzara, Jenny Han, Christopher Lawrence
Pondoc, Hariharan Subramonyam
- Abstract要約: Spellburstは、LLM(Big Language Model)を利用したクリエイティブコーディング環境である。
Spellburstは、アーティストが生成アートを作成し、分岐とマージ操作を通じてバリエーションを探索することを可能にする。
- 参考スコア(独自算出の注目度): 7.074738009603178
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Creative coding tasks are often exploratory in nature. When producing digital
artwork, artists usually begin with a high-level semantic construct such as a
"stained glass filter" and programmatically implement it by varying code
parameters such as shape, color, lines, and opacity to produce visually
appealing results. Based on interviews with artists, it can be effortful to
translate semantic constructs to program syntax, and current programming tools
don't lend well to rapid creative exploration. To address these challenges, we
introduce Spellburst, a large language model (LLM) powered creative-coding
environment. Spellburst provides (1) a node-based interface that allows artists
to create generative art and explore variations through branching and merging
operations, (2) expressive prompt-based interactions to engage in semantic
programming, and (3) dynamic prompt-driven interfaces and direct code editing
to seamlessly switch between semantic and syntactic exploration. Our evaluation
with artists demonstrates Spellburst's potential to enhance creative coding
practices and inform the design of computational creativity tools that bridge
semantic and syntactic spaces.
- Abstract(参考訳): 創造的なコーディングタスクは自然界でしばしば探索的です。
デジタルアートワークを制作する場合、アーティストは通常「ステンドグラスフィルター」のような高レベルの意味構造から始め、形状、色、線、不透明といった様々なコードパラメータをプログラムで実装し、視覚的に魅力的な結果を生み出す。
アーティストとのインタビューに基づいて、セマンティックコンストラクトをプログラム構文に変換することは困難であり、現在のプログラミングツールは、迅速な創造的な探索には役に立たない。
これらの課題に対処するために,大規模言語モデル(LLM)を利用したクリエイティブコーディング環境であるSpellburstを紹介した。
spellburstは(1)アーティストが生成的なアートを作成し、分岐とマージ操作を通じてバリエーションを探索できるノードベースのインターフェース、(2)表現力のあるプロンプトベースのインタラクションによるセマンティックプログラミング、(3)動的プロンプト駆動インターフェースと直接コード編集により、意味と構文の探索をシームレスに切り替えることができる。
アーティストによる我々の評価は、Spellburstが創造的なコーディングプラクティスを強化する可能性を示し、セマンティック空間と構文空間を橋渡しする計算創造ツールの設計を通知する。
関連論文リスト
- Redefining <Creative> in Dictionary: Towards an Enhanced Semantic Understanding of Creative Generation [39.93527514513576]
現在の手法は、創造的な効果を達成するために参照プロンプトやイメージに大きく依存している。
CreTokを紹介します。これは、新しいトークンとして「創造性を再定義することで、拡散モデルにメタ創造性をもたらすものです。
CreTokは、多様なテキストペアを反復的にサンプリングすることで、そのような再定義を実現する。
論文 参考訳(メタデータ) (2024-10-31T17:19:03Z) - PartCraft: Crafting Creative Objects by Parts [128.30514851911218]
本稿では、ユーザが「選択」できることによって、生成的視覚AIにおける創造的制御を促進する。
私たちは初めて、創造的な努力のために、視覚的概念をパーツごとに選択できるようにしました。
選択された視覚概念を正確にキャプチャするきめ細かい生成。
論文 参考訳(メタデータ) (2024-07-05T15:53:04Z) - MetaDesigner: Advancing Artistic Typography through AI-Driven, User-Centric, and Multilingual WordArt Synthesis [65.78359025027457]
MetaDesignerは、Large Language Models(LLM)の強みを活用して、ユーザエンゲージメントを中心としたデザインパラダイムを推進することによって、芸術的なタイポグラフィに革命をもたらす。
総合的なフィードバックメカニズムは、マルチモーダルモデルとユーザ評価からの洞察を活用して、設計プロセスを反復的に洗練し、拡張する。
実証的な検証は、MetaDesignerが様々なWordArtアプリケーションに効果的に機能し、審美的に魅力的でコンテキストに敏感な結果を生み出す能力を強調している。
論文 参考訳(メタデータ) (2024-06-28T11:58:26Z) - Dynamic Typography: Bringing Text to Life via Video Diffusion Prior [73.72522617586593]
動的タイポグラフィー(Dynamic Typography)と呼ばれる自動テキストアニメーション方式を提案する。
意味的意味を伝えるために文字を変形させ、ユーザプロンプトに基づいて活気ある動きを注入する。
本手法は,ベクトルグラフィックス表現とエンドツーエンド最適化に基づくフレームワークを利用する。
論文 参考訳(メタデータ) (2024-04-17T17:59:55Z) - Exploring the Potential of Large Language Models in Artistic Creation:
Collaboration and Reflection on Creative Programming [10.57792673254363]
プログラム全体を呼び出し、複数のサブタスクを発行する、という2つの一般的なコラボレーションアプローチを比較します。
本研究は,アーティストの異なる刺激反射を2つの異なる方法で示すものである。
創造的コーディングにおけるLLMの芸術的可能性を明らかにする。
論文 参考訳(メタデータ) (2024-02-15T07:00:06Z) - CreativeSynth: Creative Blending and Synthesis of Visual Arts based on
Multimodal Diffusion [74.44273919041912]
大規模なテキスト・画像生成モデルは印象的な進歩を遂げ、高品質な画像を合成する能力を示している。
しかし、これらのモデルを芸術的な画像編集に適用することは、2つの重要な課題を提起する。
我々は,マルチモーダル入力をコーディネートする拡散モデルに基づく,革新的な統一フレームワークCreative Synthを構築した。
論文 参考訳(メタデータ) (2024-01-25T10:42:09Z) - DrawTalking: Building Interactive Worlds by Sketching and Speaking [19.421582154948627]
そこで我々はDrawTalkingを紹介した。DrawTalkingは、ストーリーを語りながらスケッチや会話によってインタラクティブな世界を構築し、制御するアプローチである。
ユーザコントロールと柔軟性を強調し、コードを必要とせずにプログラミングのような機能を提供する。
論文 参考訳(メタデータ) (2024-01-11T03:02:17Z) - Creative Agents: Empowering Agents with Imagination for Creative Tasks [31.920963353890393]
本稿では,言語命令に基づくタスク結果の詳細な想像力を生成するイマジネータを用いて,制御器を拡張したクリエイティブエージェントのためのソリューションのクラスを提案する。
私たちは創造的なタスクを、オープンワールドの挑戦的なゲームMinecraftでベンチマークします。
我々は、創造的エージェントの詳細な実験分析を行い、創造的エージェントがMinecraftの生存モードにおける多様な建築創造を達成する最初のAIエージェントであることを示した。
論文 参考訳(メタデータ) (2023-12-05T06:00:52Z) - Structure-Guided Image Completion with Image-level and Object-level Semantic Discriminators [97.12135238534628]
複雑な意味論やオブジェクトの生成を改善するために,セマンティック・ディミネータとオブジェクトレベル・ディミネータからなる学習パラダイムを提案する。
特に、セマンティック・ディミネーターは、事前学習された視覚的特徴を利用して、生成された視覚概念の現実性を改善する。
提案手法は, 生成品質を著しく向上させ, 各種タスクの最先端化を実現する。
論文 参考訳(メタデータ) (2022-12-13T01:36:56Z) - IR-GAN: Image Manipulation with Linguistic Instruction by Increment
Reasoning [110.7118381246156]
Incrment Reasoning Generative Adversarial Network (IR-GAN)は、画像における視覚的インクリメントと命令における意味的インクリメントとの整合性を推論することを目的としている。
まず,単語レベルと命令レベルの命令エンコーダを導入し,履歴関連命令からユーザの意図を意味的インクリメントとして学習する。
第2に、対象画像を生成するために、意味的インクリメントの表現をソースイメージに組み込んで、ソースイメージが補助的参照の役割を担っている。
論文 参考訳(メタデータ) (2022-04-02T07:48:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。