論文の概要: WordArt Designer API: User-Driven Artistic Typography Synthesis with
Large Language Models on ModelScope
- arxiv url: http://arxiv.org/abs/2401.01699v2
- Date: Fri, 12 Jan 2024 22:09:09 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-17 23:49:11.706687
- Title: WordArt Designer API: User-Driven Artistic Typography Synthesis with
Large Language Models on ModelScope
- Title(参考訳): WordArt Designer API: ModelScope上の大規模言語モデルを用いたユーザ駆動型アートタイポグラフィ合成
- Authors: Jun-Yan He, Zhi-Qi Cheng, Chenyang Li, Jingdong Sun, Wangmeng Xiang,
Yusen Hu, Xianhui Lin, Xiaoyang Kang, Zengke Jin, Bin Luo, Yifeng Geng,
Xuansong Xie, Jingren Zhou
- Abstract要約: 本稿では,ModelScope上のLarge Language Models(LLMs)を利用したユーザ主導のアートタイポグラフィ合成のための新しいフレームワークであるWordArt Designer APIを紹介する。
我々は,非専門職に対する芸術的タイポグラフィーを簡素化する上で,従来の定型テンプレートに代わる動的で適応的で,計算的に効率的な代替手段を提供することによって,課題に対処する。
- 参考スコア(独自算出の注目度): 43.68826200853858
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces the WordArt Designer API, a novel framework for
user-driven artistic typography synthesis utilizing Large Language Models
(LLMs) on ModelScope. We address the challenge of simplifying artistic
typography for non-professionals by offering a dynamic, adaptive, and
computationally efficient alternative to traditional rigid templates. Our
approach leverages the power of LLMs to understand and interpret user input,
facilitating a more intuitive design process. We demonstrate through various
case studies how users can articulate their aesthetic preferences and
functional requirements, which the system then translates into unique and
creative typographic designs. Our evaluations indicate significant improvements
in user satisfaction, design flexibility, and creative expression over existing
systems. The WordArt Designer API not only democratizes the art of typography
but also opens up new possibilities for personalized digital communication and
design.
- Abstract(参考訳): 本稿では,Large Language Models (LLM) を用いたユーザ主導型タイポグラフィ合成のための新しいフレームワークである WordArt Designer API を紹介する。
従来の定型テンプレートに代わる動的,適応的,計算効率のよい代替手段を提供することで,非プロのタイポグラフィに対する芸術的タイポグラフィの簡易化に挑戦する。
我々のアプローチはLLMの力を利用してユーザ入力を理解し解釈し、より直感的な設計プロセスを容易にする。
ユーザは様々なケーススタディを通して、美的好みと機能的要求を明確化し、システムがユニークで創造的なタイポグラフィーデザインへと変換する方法を実証する。
評価の結果,既存システムに対するユーザ満足度,設計の柔軟性,創造性の向上が示唆された。
wordart designer apiはタイポグラフィの技術を民主化するだけでなく、パーソナライズされたデジタルコミュニケーションとデザインの新たな可能性を開く。
関連論文リスト
- Human Aesthetic Preference-Based Large Text-to-Image Model
Personalization: Kandinsky Generation as an Example [4.744780823386797]
本稿では,パーソナライズされた絵画コンテンツを自動的に生成する,プロンプトフリーな生成手法を提案する。
アーティストモデル生成画像に対するユーザの美的評価と嗜好を頼りにすることで、ユーザをパーソナライズしたモデルにする。
論文 参考訳(メタデータ) (2024-02-09T13:11:19Z) - CreativeSynth: Creative Blending and Synthesis of Visual Arts based on
Multimodal Diffusion [74.44273919041912]
大規模なテキスト・画像生成モデルは印象的な進歩を遂げ、高品質な画像を合成する能力を示している。
しかし、これらのモデルを芸術的な画像編集に適用することは、2つの重要な課題を提起する。
我々は,マルチモーダル入力をコーディネートする拡散モデルに基づく,革新的な統一フレームワークCreative Synthを構築した。
論文 参考訳(メタデータ) (2024-01-25T10:42:09Z) - TypeDance: Creating Semantic Typographic Logos from Image through
Personalized Generation [30.692297222444726]
本稿では,デザインの合理性を考慮したAI支援ツールであるTypeDanceについて,パーソナライズされたセマンティックタイポグラフィロゴ設計のための生成モデルを提案する。
模倣と作成を含む2タスクのユーザ評価により、さまざまな利用シナリオにおける設計におけるTypeDanceのユーザビリティが確認された。
論文 参考訳(メタデータ) (2024-01-20T02:55:11Z) - WordArt Designer: User-Driven Artistic Typography Synthesis using Large
Language Models [43.68826200853858]
本稿では,芸術的タイポグラフィ合成のためのユーザ主導のフレームワークであるWordArt Designerを紹介する。
このシステムには、LLMエンジン、SemTypo、StyTypo、TexTypoの4つの主要なモジュールが含まれている。
特にWordArt Designerは、生成AIとアートタイポグラフィーの融合を強調している。
論文 参考訳(メタデータ) (2023-10-20T12:44:44Z) - Luminate: Structured Generation and Exploration of Design Space with Large Language Models for Human-AI Co-Creation [19.62178304006683]
現在のインタラクションパラダイムは不足しており、限られたアイデアの集合に対して、ユーザを迅速なコンバージェンスへと導くものだ、と私たちは主張する。
本研究では,ユーザがシームレスに探索し,評価し,多数の応答を合成できる設計空間の構造化を促進するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-19T17:53:14Z) - DS-Fusion: Artistic Typography via Discriminated and Stylized Diffusion [10.75789076591325]
1つ以上の文字フォントをスタイリングすることで,芸術的タイポグラフィーを自動的に生成する新しい手法を提案する。
提案手法では,大規模言語モデルを用いてテキストや視覚画像をブリッジしてスタイリングし,教師なし生成モデルを構築する。
論文 参考訳(メタデータ) (2023-03-16T19:12:52Z) - StylerDALLE: Language-Guided Style Transfer Using a Vector-Quantized
Tokenizer of a Large-Scale Generative Model [64.26721402514957]
本論文では,自然言語を用いて抽象芸術スタイルを記述するスタイル転送手法であるStylerDALLEを提案する。
具体的には、非自己回帰的なトークンシーケンス変換として、言語誘導型転送タスクを定式化する。
スタイル情報を組み込むために,CLIPに基づく言語指導による強化学習戦略を提案する。
論文 参考訳(メタデータ) (2023-03-16T12:44:44Z) - TEMOS: Generating diverse human motions from textual descriptions [53.85978336198444]
テキスト記述から多種多様な人間の動作を生成するという課題に対処する。
本研究では,人間の動作データを用いた可変オートエンコーダ(VAE)トレーニングを利用したテキスト条件生成モデルTEMOSを提案する。
TEMOSフレームワークは,従来のような骨格に基づくアニメーションと,より表現力のあるSMPLボディモーションの両方を生成可能であることを示す。
論文 参考訳(メタデータ) (2022-04-25T14:53:06Z) - Modeling Artistic Workflows for Image Generation and Editing [83.43047077223947]
与えられた芸術的ワークフローに従う生成モデルを提案する。
既存の芸術作品の多段画像編集だけでなく、多段画像生成も可能である。
論文 参考訳(メタデータ) (2020-07-14T17:54:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。