Fugu-MT 論文翻訳(概要): Spellburst: A Node-based Interface for Exploratory Creative Coding with Natural Language Prompts

論文の概要: Spellburst: A Node-based Interface for Exploratory Creative Coding with Natural Language Prompts

arxiv url: http://arxiv.org/abs/2308.03921v1
Date: Mon, 7 Aug 2023 21:54:58 GMT
ステータス: 翻訳完了
システム内更新日: 2023-08-20 16:46:09.276976
Title: Spellburst: A Node-based Interface for Exploratory Creative Coding with Natural Language Prompts
Title（参考訳）: Spellburst: 自然言語による探索的創造的コーディングのためのノードベースのインターフェース
Authors: Tyler Angert, Miroslav Ivan Suzara, Jenny Han, Christopher Lawrence Pondoc, Hariharan Subramonyam
Abstract要約: Spellburstは、LLM(Big Language Model)を利用したクリエイティブコーディング環境である。 Spellburstは、アーティストが生成アートを作成し、分岐とマージ操作を通じてバリエーションを探索することを可能にする。
参考スコア（独自算出の注目度）: 7.074738009603178
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Creative coding tasks are often exploratory in nature. When producing digital artwork, artists usually begin with a high-level semantic construct such as a "stained glass filter" and programmatically implement it by varying code parameters such as shape, color, lines, and opacity to produce visually appealing results. Based on interviews with artists, it can be effortful to translate semantic constructs to program syntax, and current programming tools don't lend well to rapid creative exploration. To address these challenges, we introduce Spellburst, a large language model (LLM) powered creative-coding environment. Spellburst provides (1) a node-based interface that allows artists to create generative art and explore variations through branching and merging operations, (2) expressive prompt-based interactions to engage in semantic programming, and (3) dynamic prompt-driven interfaces and direct code editing to seamlessly switch between semantic and syntactic exploration. Our evaluation with artists demonstrates Spellburst's potential to enhance creative coding practices and inform the design of computational creativity tools that bridge semantic and syntactic spaces.
Abstract（参考訳）: 創造的なコーディングタスクは自然界でしばしば探索的です。デジタルアートワークを制作する場合、アーティストは通常「ステンドグラスフィルター」のような高レベルの意味構造から始め、形状、色、線、不透明といった様々なコードパラメータをプログラムで実装し、視覚的に魅力的な結果を生み出す。アーティストとのインタビューに基づいて、セマンティックコンストラクトをプログラム構文に変換することは困難であり、現在のプログラミングツールは、迅速な創造的な探索には役に立たない。これらの課題に対処するために,大規模言語モデル(LLM)を利用したクリエイティブコーディング環境であるSpellburstを紹介した。 spellburstは(1)アーティストが生成的なアートを作成し、分岐とマージ操作を通じてバリエーションを探索できるノードベースのインターフェース、(2)表現力のあるプロンプトベースのインタラクションによるセマンティックプログラミング、(3)動的プロンプト駆動インターフェースと直接コード編集により、意味と構文の探索をシームレスに切り替えることができる。アーティストによる我々の評価は、Spellburstが創造的なコーディングプラクティスを強化する可能性を示し、セマンティック空間と構文空間を橋渡しする計算創造ツールの設計を通知する。

関連論文リスト

AI Co-Artist: A LLM-Powered Framework for Interactive GLSL Shader Animation Evolution [2.7010154811483162]
本稿では,大規模言語モデル(LLM),特にGPT-4の機能を利用する,インタラクティブなシステムであるAI Co-Artistを紹介する。私たちのシステムでは,コードの記述や理解を必要とせずに,直感的なインタラクションによってシェーダアートを進化させることができます。
論文参考訳（メタデータ） (2025-11-27T18:55:32Z)
ThematicPlane: Bridging Tacit User Intent and Latent Spaces for Image Generation [49.805992099208595]
ThematicPlaneは,ユーザが高レベルのセマンティック概念をナビゲートし操作できるシステムである。このインターフェースは、暗黙の創造意図とシステム制御のギャップを埋める。
論文参考訳（メタデータ） (2025-08-08T06:57:14Z)
WordCraft: Interactive Artistic Typography with Attention Awareness and Noise Blending [12.655120187133779]
アートタイポグラフィーは、創造的かつ妥当な視覚効果を持つ入力文字をスタイリングすることを目的としている。従来のアプローチは手動設計に大きく依存するが、最近の生成モデル、特に拡散型手法は自動文字スタイリングを可能にしている。我々はこれらの制限に対処するために拡散モデルを統合するインタラクティブなアートタイポグラフィーシステムであるWordCraftを紹介する。
論文参考訳（メタデータ） (2025-07-13T10:49:09Z)
CodeDiffuser: Attention-Enhanced Diffusion Policy via VLM-Generated Code for Instruction Ambiguity [23.77040677368575]
我々は,潜在的にあいまいな自然言語によって指定されたタスクを達成できる,新しいロボット操作フレームワークを導入する。このフレームワークはVLM(Vision-Language Model)を使用して、自然言語命令の抽象概念を解釈する。本稿では,言語あいまいさ,コンタクトリッチな操作,多目的インタラクションといった課題に対して,アプローチが優れていることを示す。
論文参考訳（メタデータ） (2025-06-19T23:42:03Z)
POET: Supporting Prompting Creativity and Personalization with Automated Expansion of Text-to-Image Generation [31.886910258606875]
最先端のビジュアル生成AIツールは、クリエイティブなタスクの初期のアイデア段階において、ユーザーを支援する大きな可能性を秘めている。多くの大規模テキスト・ツー・イメージシステムは幅広い適用性のために設計されており、創造的な探索を制限するような従来の出力が得られる。テキストから画像への生成モデルにおいて,同質性の次元を自動的に検出するリアルタイム対話型ツールPOETを紹介する。
論文参考訳（メタデータ） (2025-04-18T00:54:36Z)
Redefining <Creative> in Dictionary: Towards an Enhanced Semantic Understanding of Creative Generation [39.93527514513576]
現在の手法は、創造的な効果を達成するために参照プロンプトやイメージに大きく依存している。 CreTokを紹介します。これは、新しいトークンとして「創造性を再定義することで、拡散モデルにメタ創造性をもたらすものです。 CreTokは、多様なテキストペアを反復的にサンプリングすることで、そのような再定義を実現する。
論文参考訳（メタデータ） (2024-10-31T17:19:03Z)
VitaGlyph: Vitalizing Artistic Typography with Flexible Dual-branch Diffusion Models [53.59400446543756]
アーティスティック・タイポグラフィー(Arttic typography)は、入力文字の意味を想像可能で読みやすい方法で視覚化する技法である。そこで我々は,VitaGlyphと呼ばれる2枝のトレーニング不要な手法を導入し,幾何学的変化を制御可能な,柔軟な芸術的タイポグラフィーを実現する。
論文参考訳（メタデータ） (2024-10-02T16:48:47Z)
PartCraft: Crafting Creative Objects by Parts [128.30514851911218]
本稿では、ユーザが「選択」できることによって、生成的視覚AIにおける創造的制御を促進する。私たちは初めて、創造的な努力のために、視覚的概念をパーツごとに選択できるようにしました。選択された視覚概念を正確にキャプチャするきめ細かい生成。
論文参考訳（メタデータ） (2024-07-05T15:53:04Z)
MetaDesigner: Advancing Artistic Typography through AI-Driven, User-Centric, and Multilingual WordArt Synthesis [65.78359025027457]
MetaDesignerは、Large Language Models(LLM)の強みを活用して、ユーザエンゲージメントを中心としたデザインパラダイムを推進することによって、芸術的なタイポグラフィに革命をもたらす。総合的なフィードバックメカニズムは、マルチモーダルモデルとユーザ評価からの洞察を活用して、設計プロセスを反復的に洗練し、拡張する。実証的な検証は、MetaDesignerが様々なWordArtアプリケーションに効果的に機能し、審美的に魅力的でコンテキストに敏感な結果を生み出す能力を強調している。
論文参考訳（メタデータ） (2024-06-28T11:58:26Z)
Dynamic Typography: Bringing Text to Life via Video Diffusion Prior [73.72522617586593]
動的タイポグラフィー(Dynamic Typography)と呼ばれる自動テキストアニメーション方式を提案する。意味的意味を伝えるために文字を変形させ、ユーザプロンプトに基づいて活気ある動きを注入する。本手法は,ベクトルグラフィックス表現とエンドツーエンド最適化に基づくフレームワークを利用する。
論文参考訳（メタデータ） (2024-04-17T17:59:55Z)
Exploring the Potential of Large Language Models in Artistic Creation: Collaboration and Reflection on Creative Programming [10.57792673254363]
プログラム全体を呼び出し、複数のサブタスクを発行する、という2つの一般的なコラボレーションアプローチを比較します。本研究は,アーティストの異なる刺激反射を2つの異なる方法で示すものである。創造的コーディングにおけるLLMの芸術的可能性を明らかにする。
論文参考訳（メタデータ） (2024-02-15T07:00:06Z)
CreativeSynth: Creative Blending and Synthesis of Visual Arts based on Multimodal Diffusion [74.44273919041912]
大規模なテキスト・画像生成モデルは印象的な進歩を遂げ、高品質な画像を合成する能力を示している。しかし、これらのモデルを芸術的な画像編集に適用することは、2つの重要な課題を提起する。我々は,マルチモーダル入力をコーディネートする拡散モデルに基づく,革新的な統一フレームワークCreative Synthを構築した。
論文参考訳（メタデータ） (2024-01-25T10:42:09Z)
DrawTalking: Building Interactive Worlds by Sketching and Speaking [19.421582154948627]
そこで我々はDrawTalkingを紹介した。DrawTalkingは、ストーリーを語りながらスケッチや会話によってインタラクティブな世界を構築し、制御するアプローチである。ユーザコントロールと柔軟性を強調し、コードを必要とせずにプログラミングのような機能を提供する。
論文参考訳（メタデータ） (2024-01-11T03:02:17Z)
Creative Agents: Empowering Agents with Imagination for Creative Tasks [31.920963353890393]
本稿では,言語命令に基づくタスク結果の詳細な想像力を生成するイマジネータを用いて,制御器を拡張したクリエイティブエージェントのためのソリューションのクラスを提案する。私たちは創造的なタスクを、オープンワールドの挑戦的なゲームMinecraftでベンチマークします。我々は、創造的エージェントの詳細な実験分析を行い、創造的エージェントがMinecraftの生存モードにおける多様な建築創造を達成する最初のAIエージェントであることを示した。
論文参考訳（メタデータ） (2023-12-05T06:00:52Z)
Structure-Guided Image Completion with Image-level and Object-level Semantic Discriminators [97.12135238534628]
複雑な意味論やオブジェクトの生成を改善するために,セマンティック・ディミネータとオブジェクトレベル・ディミネータからなる学習パラダイムを提案する。特に、セマンティック・ディミネーターは、事前学習された視覚的特徴を利用して、生成された視覚概念の現実性を改善する。提案手法は, 生成品質を著しく向上させ, 各種タスクの最先端化を実現する。
論文参考訳（メタデータ） (2022-12-13T01:36:56Z)
IR-GAN: Image Manipulation with Linguistic Instruction by Increment Reasoning [110.7118381246156]
Incrment Reasoning Generative Adversarial Network (IR-GAN)は、画像における視覚的インクリメントと命令における意味的インクリメントとの整合性を推論することを目的としている。まず,単語レベルと命令レベルの命令エンコーダを導入し,履歴関連命令からユーザの意図を意味的インクリメントとして学習する。第2に、対象画像を生成するために、意味的インクリメントの表現をソースイメージに組み込んで、ソースイメージが補助的参照の役割を担っている。
論文参考訳（メタデータ） (2022-04-02T07:48:39Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。