論文の概要: WordArt Designer: User-Driven Artistic Typography Synthesis using Large
Language Models
- arxiv url: http://arxiv.org/abs/2310.18332v2
- Date: Mon, 27 Nov 2023 04:22:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-30 13:25:58.020517
- Title: WordArt Designer: User-Driven Artistic Typography Synthesis using Large
Language Models
- Title(参考訳): WordArt Designer:大規模言語モデルを用いたユーザ駆動型アートタイポグラフィ合成
- Authors: Jun-Yan He, Zhi-Qi Cheng, Chenyang Li, Jingdong Sun, Wangmeng Xiang,
Xianhui Lin, Xiaoyang Kang, Zengke Jin, Yusen Hu, Bin Luo, Yifeng Geng,
Xuansong Xie and Jingren Zhou
- Abstract要約: 本稿では,芸術的タイポグラフィ合成のためのユーザ主導のフレームワークであるWordArt Designerを紹介する。
このシステムには、LLMエンジン、SemTypo、StyTypo、TexTypoの4つの主要なモジュールが含まれている。
特にWordArt Designerは、生成AIとアートタイポグラフィーの融合を強調している。
- 参考スコア(独自算出の注目度): 43.68826200853858
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces WordArt Designer, a user-driven framework for artistic
typography synthesis, relying on the Large Language Model (LLM). The system
incorporates four key modules: the LLM Engine, SemTypo, StyTypo, and TexTypo
modules. 1) The LLM Engine, empowered by the LLM (e.g., GPT-3.5), interprets
user inputs and generates actionable prompts for the other modules, thereby
transforming abstract concepts into tangible designs. 2) The SemTypo module
optimizes font designs using semantic concepts, striking a balance between
artistic transformation and readability. 3) Building on the semantic layout
provided by the SemTypo module, the StyTypo module creates smooth, refined
images. 4) The TexTypo module further enhances the design's aesthetics through
texture rendering, enabling the generation of inventive textured fonts.
Notably, WordArt Designer highlights the fusion of generative AI with artistic
typography. Experience its capabilities on ModelScope:
https://www.modelscope.cn/studios/WordArt/WordArt.
- Abstract(参考訳): 本稿では,大言語モデル(llm)に基づく,芸術的タイポグラフィー合成のためのユーザ駆動フレームワークであるwordart designerを提案する。
このシステムには、LLMエンジン、SemTypo、StyTypo、TexTypoの4つの主要なモジュールが含まれている。
1) LLM エンジンは LLM (例: GPT-3.5) によって強化され、ユーザ入力を解釈し、他のモジュールに対して実行可能なプロンプトを生成する。
2) SemTypoモジュールはセマンティックな概念を用いてフォントデザインを最適化し,芸術的変換と可読性のバランスを崩す。
3) SemTypoモジュールが提供するセマンティックレイアウトに基づいて、StyTypoモジュールは滑らかで洗練された画像を生成する。
4) TexTypoモジュールはテクスチャレンダリングによってデザインの美学をさらに強化し、創発的なテクスチャフォントの生成を可能にする。
特にWordArt Designerは、生成AIとアートタイポグラフィーの融合を強調している。
ModelScopeの機能を体験する: https://www.modelscope.cn/studios/WordArt/WordArt。
関連論文リスト
- VitaGlyph: Vitalizing Artistic Typography with Flexible Dual-branch Diffusion Models [53.59400446543756]
柔軟な芸術的タイポグラフィーを実現するために,二枝・無訓練の手法であるVitaGlyphを導入する。
VitaGlyphは入力文字を被写体と周囲からなるシーンとして扱い、次に幾何変換の度合いでそれらをレンダリングする。
実験結果から、VitaGlyphは芸術性や可読性の向上だけでなく、複数のカスタマイズ概念を表現できることがわかった。
論文 参考訳(メタデータ) (2024-10-02T16:48:47Z) - EATXT: A textual concrete syntax for EAST-ADL [5.34855193340848]
本稿では,EAST-ADLを用いた自動車アーキテクチャモデリング用エディタであるEATXTを紹介する。
EATXTエディタはXtextをベースにしており、コンテンツアシストやシリアライゼーションの改善など、基本的な機能と高度な機能を提供している。
本稿では, 編集機能とアーキテクチャ, 実装アプローチ, EATXT の以前の利用について述べる。
論文 参考訳(メタデータ) (2024-07-13T14:05:21Z) - MetaDesigner: Advancing Artistic Typography through AI-Driven, User-Centric, and Multilingual WordArt Synthesis [65.78359025027457]
MetaDesignerは、Large Language Models(LLM)の強みを活用して、ユーザエンゲージメントを中心としたデザインパラダイムを推進することによって、芸術的なタイポグラフィに革命をもたらす。
総合的なフィードバックメカニズムは、マルチモーダルモデルとユーザ評価からの洞察を活用して、設計プロセスを反復的に洗練し、拡張する。
実証的な検証は、MetaDesignerが様々なWordArtアプリケーションに効果的に機能し、審美的に魅力的でコンテキストに敏感な結果を生み出す能力を強調している。
論文 参考訳(メタデータ) (2024-06-28T11:58:26Z) - LASER: Tuning-Free LLM-Driven Attention Control for Efficient Text-conditioned Image-to-Animation [62.232361821779335]
本稿では,プロンプト・アウェア・編集の進歩的プロセスであるStablEアニメーションジェネレーション(LASER)をカプセル化した,チューニング不要なアテンション制御フレームワークを提案する。
アニメーションの整合性を維持するために,モデルの空間的特徴と自己認識機構を操作する。
空間的特徴と自己注意の厳密な制御により,画像の構造的一貫性が確保される。
論文 参考訳(メタデータ) (2024-04-21T07:13:56Z) - WordArt Designer API: User-Driven Artistic Typography Synthesis with
Large Language Models on ModelScope [43.68826200853858]
本稿では,ModelScope上のLarge Language Models(LLMs)を利用したユーザ主導のアートタイポグラフィ合成のための新しいフレームワークであるWordArt Designer APIを紹介する。
我々は,非専門職に対する芸術的タイポグラフィーを簡素化する上で,従来の定型テンプレートに代わる動的で適応的で,計算的に効率的な代替手段を提供することによって,課題に対処する。
論文 参考訳(メタデータ) (2024-01-03T12:06:02Z) - AI Illustrator: Translating Raw Descriptions into Images by Prompt-based
Cross-Modal Generation [61.77946020543875]
本稿では,複雑な意味論による生の記述を意味的に対応する画像に翻訳するフレームワークを提案する。
本フレームワークは,テキスト埋め込みから画像埋め込みへのプロンプトに基づくプロジェクションモジュールと,StyleGAN上に構築された適応画像生成モジュールの2つのコンポーネントから構成される。
本手法は,事前学習モデルに適合し,複雑な記述を処理でき,外部のペアデータを必要としない。
論文 参考訳(メタデータ) (2022-09-07T13:53:54Z) - GenText: Unsupervised Artistic Text Generation via Decoupled Font and
Texture Manipulation [30.654807125764965]
我々は,汎用的な芸術的テクストスタイルの転送を実現するために,GenTextという新しいアプローチを提案する。
具体的には、スタイラス化、デスティル化、フォント転送という3つの異なる段階を取り入れています。
ペアの芸術的テキスト画像の取得が困難であることを考えると,本モデルは教師なし環境下で設計されている。
論文 参考訳(メタデータ) (2022-07-20T04:42:47Z) - Representing ELMo embeddings as two-dimensional text online [5.1525653500591995]
本稿では,Web上の単語埋め込みモデルを提供するWeb Embeddingsツールキットの新たな追加について述べる。
新しいELMoVizモジュールは、コンテキスト化された組み込みアーキテクチャ、特にELMoモデルのサポートを追加する。
提供された可視化は2次元テキストのメタファーに従い、語彙的な代名詞を示す:入力文の単語と文脈的に最もよく似た単語である。
論文 参考訳(メタデータ) (2021-03-30T15:12:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。