論文の概要: Aesthetic Text Logo Synthesis via Content-aware Layout Inferring
- arxiv url: http://arxiv.org/abs/2204.02701v1
- Date: Wed, 6 Apr 2022 09:51:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-07 14:05:49.029781
- Title: Aesthetic Text Logo Synthesis via Content-aware Layout Inferring
- Title(参考訳): コンテンツ認識レイアウト推論による美的テキストロゴ合成
- Authors: Yizhi Wang, Guo Pu, Wenhan Luo, Yexin Wang, Pengfei Xiong, Hongwen
Kang, Zhouhui Lian
- Abstract要約: 本稿では,グリフ画像と対応するテキストを入力として取り出し,美的レイアウトを自動的に合成するコンテンツ認識レイアウト生成ネットワークを提案する。
具体的には、文字配置軌跡と合成テキストロゴの描画形状の両方を評価するために、シーケンス識別器と画像識別器を含む二重識別器モジュールを開発する。
約3500のテキストロゴ画像とピクセルレベルのアノテーションからなるTextLogo3Kというデータセットを構築した。
- 参考スコア(独自算出の注目度): 36.95991028680696
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Text logo design heavily relies on the creativity and expertise of
professional designers, in which arranging element layouts is one of the most
important procedures. However, few attention has been paid to this task which
needs to take many factors (e.g., fonts, linguistics, topics, etc.) into
consideration. In this paper, we propose a content-aware layout generation
network which takes glyph images and their corresponding text as input and
synthesizes aesthetic layouts for them automatically. Specifically, we develop
a dual-discriminator module, including a sequence discriminator and an image
discriminator, to evaluate both the character placing trajectories and rendered
shapes of synthesized text logos, respectively. Furthermore, we fuse the
information of linguistics from texts and visual semantics from glyphs to guide
layout prediction, which both play important roles in professional layout
design. To train and evaluate our approach, we construct a dataset named as
TextLogo3K, consisting of about 3,500 text logo images and their pixel-level
annotations. Experimental studies on this dataset demonstrate the effectiveness
of our approach for synthesizing visually-pleasing text logos and verify its
superiority against the state of the art.
- Abstract(参考訳): テキストロゴのデザインはプロのデザイナーの創造性と専門性に大きく依存しており、要素のレイアウトを配置することが最も重要な手順の1つである。
しかし,多くの要因(フォント,言語学,話題など)を考慮に入れる必要があるこの課題にはほとんど注意が払われていない。
本稿では,glyph画像とそれに対応するテキストを入力として,それらに対する美的レイアウトを自動合成するコンテンツ認識レイアウト生成ネットワークを提案する。
具体的には、文字配置軌跡と合成テキストロゴの描画形状の両方を評価するために、シーケンス識別器と画像識別器を含む二重識別器モジュールを開発する。
さらに,テキストから言語情報,グリフからビジュアルセマンティクスを融合してレイアウト予測を指導し,両者がプロのレイアウト設計において重要な役割を担っている。
このアプローチを訓練し評価するために,約3500のテキストロゴイメージとピクセルレベルのアノテーションからなるTextLogo3Kというデータセットを構築した。
このデータセットに関する実験的研究は、視覚的に満足するテキストロゴを合成し、その技術に対する優位性を検証するための手法の有効性を実証している。
関連論文リスト
- GLDesigner: Leveraging Multi-Modal LLMs as Designer for Enhanced Aesthetic Text Glyph Layouts [53.568057283934714]
コンテンツ対応のテキストロゴレイアウトを生成するVLMベースのフレームワークを提案する。
本稿では,複数のグリフ画像の同時処理における計算量を削減するための2つのモデル手法を提案する。
アウトモデルのインストラクションチューニングを支援するために,既存の公開データセットよりも5倍大きい2つの拡張テキストロゴデータセットを構築した。
論文 参考訳(メタデータ) (2024-11-18T10:04:10Z) - VitaGlyph: Vitalizing Artistic Typography with Flexible Dual-branch Diffusion Models [53.59400446543756]
柔軟な芸術的タイポグラフィーを実現するために,二枝・無訓練の手法であるVitaGlyphを導入する。
VitaGlyphは入力文字を被写体と周囲からなるシーンとして扱い、次に幾何変換の度合いでそれらをレンダリングする。
実験結果から、VitaGlyphは芸術性や可読性の向上だけでなく、複数のカスタマイズ概念を表現できることがわかった。
論文 参考訳(メタデータ) (2024-10-02T16:48:47Z) - LogoSticker: Inserting Logos into Diffusion Models for Customized Generation [73.59571559978278]
テキスト・ツー・イメージ・モデルにロゴを挿入する作業を導入する。
我々の目標は、ロゴのアイデンティティを拡散モデルに挿入し、様々な状況下でシームレスに合成できるようにすることです。
この課題に対処するために,新しい2相パイプラインLogoStickerを提案する。
論文 参考訳(メタデータ) (2024-07-18T17:54:49Z) - Text-guided Image Restoration and Semantic Enhancement for Text-to-Image Person Retrieval [11.798006331912056]
テキスト・ツー・イメージ・パーソナリティ検索(TIPR)の目的は、与えられたテキスト記述に従って特定の人物画像を取得することである。
本稿では,人物画像と対応するテキスト間のきめ細かいインタラクションとアライメントを構築するための新しいTIPRフレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-18T08:23:46Z) - PosterLayout: A New Benchmark and Approach for Content-aware
Visual-Textual Presentation Layout [62.12447593298437]
コンテンツ対応視覚テキスト提示レイアウトは,所定のキャンバス上の空間空間を予め定義された要素にアレンジすることを目的としている。
本稿では,設計過程を模倣するためにレイアウトの要素を再編成する設計シーケンス形成(DSF)を提案する。
CNN-LSTMに基づく新しい条件生成対向ネットワーク(GAN)を提示し、適切なレイアウトを生成する。
論文 参考訳(メタデータ) (2023-03-28T12:48:36Z) - Layout-Bridging Text-to-Image Synthesis [20.261873143881573]
我々は、テキスト・ツー・イメージ生成とレイアウト・ツー・イメージ合成の両方において効果的なモデリングを推し進める。
入力テキストをレイアウト・ツー・イメージ合成プロセスに正確に組み込むために,レイアウト中のオブジェクトごとのテキスト・視覚的セマンティックアライメントを学習することに注力する。
論文 参考訳(メタデータ) (2022-08-12T08:21:42Z) - Toward Understanding WordArt: Corner-Guided Transformer for Scene Text
Recognition [63.6608759501803]
我々は芸術的テキストを3つのレベルで認識することを提案する。
コーナーポイントは、文字内の局所的な特徴の抽出を誘導するために用いられる。
第二に、文字レベルの特徴をモデル化するために文字の対照的な損失を設計し、文字分類のための特徴表現を改善する。
第3に,Transformerを用いて画像レベルのグローバルな特徴を学習し,コーナーポイントのグローバルな関係をモデル化する。
論文 参考訳(メタデータ) (2022-07-31T14:11:05Z) - Composition-aware Graphic Layout GAN for Visual-textual Presentation
Designs [24.29890251913182]
与えられた画像に対して高品質な視覚テキスト提示設計を行う際のグラフィックレイアウト生成問題について検討する。
入力画像のグローバルおよび空間的視覚的内容に基づいてレイアウトを合成するために,合成対応グラフィックレイアウトGAN (CGL-GAN) と呼ばれる深層生成モデルを提案する。
論文 参考訳(メタデータ) (2022-04-30T16:42:13Z) - Copyspace: Where to Write on Images? [0.0]
画像上に描画されたテキストの美的パラメータを「コピースペース検出」として検索する。
このワークショップでは、コピースペース検出のためのそのようなアルゴリズムを検証し、Einstein Designerのような生成設計モデルやパイプラインへの応用を実証する。
論文 参考訳(メタデータ) (2020-12-04T01:58:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。