論文の概要: WordCraft: Interactive Artistic Typography with Attention Awareness and Noise Blending
- arxiv url: http://arxiv.org/abs/2507.09573v1
- Date: Sun, 13 Jul 2025 10:49:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-15 18:48:23.555029
- Title: WordCraft: Interactive Artistic Typography with Attention Awareness and Noise Blending
- Title(参考訳): WordCraft: 注意力と騒音による対話型アートタイポグラフィー
- Authors: Zhe Wang, Jingbo Zhang, Tianyi Wei, Wanchao Su, Can Wang,
- Abstract要約: アートタイポグラフィーは、創造的かつ妥当な視覚効果を持つ入力文字をスタイリングすることを目的としている。
従来のアプローチは手動設計に大きく依存するが、最近の生成モデル、特に拡散型手法は自動文字スタイリングを可能にしている。
我々はこれらの制限に対処するために拡散モデルを統合するインタラクティブなアートタイポグラフィーシステムであるWordCraftを紹介する。
- 参考スコア(独自算出の注目度): 12.655120187133779
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Artistic typography aims to stylize input characters with visual effects that are both creative and legible. Traditional approaches rely heavily on manual design, while recent generative models, particularly diffusion-based methods, have enabled automated character stylization. However, existing solutions remain limited in interactivity, lacking support for localized edits, iterative refinement, multi-character composition, and open-ended prompt interpretation. We introduce WordCraft, an interactive artistic typography system that integrates diffusion models to address these limitations. WordCraft features a training-free regional attention mechanism for precise, multi-region generation and a noise blending that supports continuous refinement without compromising visual quality. To support flexible, intent-driven generation, we incorporate a large language model to parse and structure both concrete and abstract user prompts. These components allow our framework to synthesize high-quality, stylized typography across single- and multi-character inputs across multiple languages, supporting diverse user-centered workflows. Our system significantly enhances interactivity in artistic typography synthesis, opening up creative possibilities for artists and designers.
- Abstract(参考訳): アートタイポグラフィーは、創造的かつ妥当な視覚効果を持つ入力文字をスタイリングすることを目的としている。
従来のアプローチは手動設計に大きく依存するが、最近の生成モデル、特に拡散型手法は自動文字スタイリングを可能にしている。
しかし、既存のソリューションは対話性に限られており、局所的な編集、反復的な洗練、複数文字合成、オープンなプロンプト解釈がサポートされていない。
我々はこれらの制限に対処するために拡散モデルを統合するインタラクティブなアートタイポグラフィーシステムであるWordCraftを紹介する。
WordCraftは、正確なマルチリージョン生成のためのトレーニング不要な地域注意機構と、視覚的品質を損なうことなく継続的な改善をサポートするノイズブレンディングを備えている。
フレキシブルで意図駆動的な生成をサポートするために,具体的なユーザプロンプトと抽象的なユーザプロンプトの両方を解析・構造化するために,大規模な言語モデルを導入する。
これらのコンポーネントは、複数の言語にまたがる単一文字と複数文字の入力にまたがる高品質なタイポグラフィーを合成し、多様なユーザ中心のワークフローをサポートする。
本システムは,芸術的タイポグラフィ合成における対話性を著しく向上させ,アーティストやデザイナーにとって創造的な可能性を開く。
関連論文リスト
- Calligrapher: Freestyle Text Image Customization [72.71919410487881]
Calligrapherは、高度なテキストのカスタマイズと芸術的なタイポグラフィを統合する、新しい拡散ベースのフレームワークである。
高品質で視覚的に一貫したタイポグラフィーを自動化することで、Calligrapherは従来のモデルを上回っている。
論文 参考訳(メタデータ) (2025-06-30T17:59:06Z) - DesignDiffusion: High-Quality Text-to-Design Image Generation with Diffusion Models [115.62816053600085]
デザインイメージをテキスト記述から合成するフレームワークであるDesignDiffusionを提案する。
提案するフレームワークは,ユーザプロンプトから直接テキストおよびビジュアルデザイン要素を合成する。
視覚テキストから派生した特徴的な文字埋め込みを利用して入力プロンプトを強化する。
論文 参考訳(メタデータ) (2025-03-03T15:22:57Z) - ArtCrafter: Text-Image Aligning Style Transfer via Embedding Reframing [25.610375901522886]
ArtCrafterは、テキストから画像へのスタイル転送のための新しいフレームワークである。
注意に基づくスタイル抽出モジュールを導入する。
また,新たなテキスト画像アライメント拡張コンポーネントを提案する。
論文 参考訳(メタデータ) (2025-01-03T19:17:27Z) - VitaGlyph: Vitalizing Artistic Typography with Flexible Dual-branch Diffusion Models [53.59400446543756]
アーティスティック・タイポグラフィー(Arttic typography)は、入力文字の意味を想像可能で読みやすい方法で視覚化する技法である。
そこで我々は,VitaGlyphと呼ばれる2枝のトレーニング不要な手法を導入し,幾何学的変化を制御可能な,柔軟な芸術的タイポグラフィーを実現する。
論文 参考訳(メタデータ) (2024-10-02T16:48:47Z) - MetaDesigner: Advancing Artistic Typography Through AI-Driven, User-Centric, and Multilingual WordArt Synthesis [65.78359025027457]
MetaDesignerがLarge Language Models(LLM)を利用したアートタイポグラフィーのための変換フレームワークを導入
その基盤は、Pipeline、Glyph、Textureエージェントで構成されるマルチエージェントシステムであり、カスタマイズ可能なWordArtの作成をまとめてオーケストレーションしている。
論文 参考訳(メタデータ) (2024-06-28T11:58:26Z) - ORACLE: Leveraging Mutual Information for Consistent Character Generation with LoRAs in Diffusion Models [3.7599363231894185]
単一テキストプロンプトから一貫した文字表現を生成するための新しいフレームワークを提案する。
我々のフレームワークは、一貫した視覚的アイデンティティを持つ文字を生成する既存の手法よりも優れています。
論文 参考訳(メタデータ) (2024-06-04T23:39:08Z) - Dynamic Typography: Bringing Text to Life via Video Diffusion Prior [73.72522617586593]
動的タイポグラフィー(Dynamic Typography)と呼ばれる自動テキストアニメーション方式を提案する。
意味的意味を伝えるために文字を変形させ、ユーザプロンプトに基づいて活気ある動きを注入する。
本手法は,ベクトルグラフィックス表現とエンドツーエンド最適化に基づくフレームワークを利用する。
論文 参考訳(メタデータ) (2024-04-17T17:59:55Z) - CreativeSynth: Cross-Art-Attention for Artistic Image Synthesis with Multimodal Diffusion [73.08710648258985]
レイアウト、視点、形状、意味といった重要な絵の属性は、しばしばスタイル転送によって伝達され、表現されない。
大規模な事前訓練された画像生成モデルは、大量の高品質な画像を合成できることを実証している。
我々の主要なアイデアは、スタイルを現実の世界に移すのではなく、多モーダルな意味情報を合成ガイドとしてアートに組み込むことである。
論文 参考訳(メタデータ) (2024-01-25T10:42:09Z) - WordArt Designer API: User-Driven Artistic Typography Synthesis with
Large Language Models on ModelScope [43.68826200853858]
本稿では,ModelScope上のLarge Language Models(LLMs)を利用したユーザ主導のアートタイポグラフィ合成のための新しいフレームワークであるWordArt Designer APIを紹介する。
我々は,非専門職に対する芸術的タイポグラフィーを簡素化する上で,従来の定型テンプレートに代わる動的で適応的で,計算的に効率的な代替手段を提供することによって,課題に対処する。
論文 参考訳(メタデータ) (2024-01-03T12:06:02Z) - DS-Fusion: Artistic Typography via Discriminated and Stylized Diffusion [10.75789076591325]
1つ以上の文字フォントをスタイリングすることで,芸術的タイポグラフィーを自動的に生成する新しい手法を提案する。
提案手法では,大規模言語モデルを用いてテキストや視覚画像をブリッジしてスタイリングし,教師なし生成モデルを構築する。
論文 参考訳(メタデータ) (2023-03-16T19:12:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。