論文の概要: FontCrafter: High-Fidelity Element-Driven Artistic Font Creation with Visual In-Context Generation
- arxiv url: http://arxiv.org/abs/2603.22054v2
- Date: Sat, 28 Mar 2026 19:37:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 13:48:18.783956
- Title: FontCrafter: High-Fidelity Element-Driven Artistic Font Creation with Visual In-Context Generation
- Title(参考訳): FontCrafter: ビジュアルインコンテキスト生成による高忠実な要素駆動型アートフォント作成
- Authors: Wuyang Luo, Chengkai Tan, Chang Ge, Binye Hong, Su Yang, Yongjiu Ma,
- Abstract要約: アーティスティックフォント生成は、参照スタイルに基づいてスタイリングされたグリフを合成することを目的としている。
既存のアプローチは、限られたスタイルの多様性と粗いコントロールに悩まされている。
フォント作成のための要素駆動フレームワークであるFontCrafterを紹介する。
- 参考スコア(独自算出の注目度): 3.113651550552676
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Artistic font generation aims to synthesize stylized glyphs based on a reference style. However, existing approaches suffer from limited style diversity and coarse control. In this work, we explore the potential of element-driven artistic font generation. Elements are the fundamental visual units of a font, serving as reference images for the desired style. Conceptually, we categorize elements into object elements (e.g., flowers or stones) with distinct structures and amorphous elements (e.g., flames or clouds) with unstructured textures. We introduce FontCrafter, an element-driven framework for font creation, and construct a large-scale dataset, ElementFont, which contains diverse element types and high-quality glyph images. However, achieving high-fidelity reconstruction of both texture and structure of reference elements remains challenging. To address this, we propose an in-context generation strategy that treats element images as visual context and uses an inpainting model to transfer element styles into glyph regions at the pixel level. To further control glyph shapes, we design a lightweight Context-aware Mask Adapter (CMA) that injects shape information. Moreover, a training-free attention redirection mechanism enables region-aware style control and suppresses stroke hallucination. In addition, edge repainting is applied to make boundaries more natural. Extensive experiments demonstrate that FontCrafter achieves strong zero-shot generation performance, particularly in preserving structural and textural fidelity, while also supporting flexible controls such as style mixture.
- Abstract(参考訳): アーティスティックフォント生成は、参照スタイルに基づいてスタイリングされたグリフを合成することを目的としている。
しかし、既存のアプローチは、限られたスタイルの多様性と粗い制御に悩まされている。
本研究では,要素駆動の芸術的フォント生成の可能性を探る。
要素はフォントの基本視覚単位であり、所望のスタイルの参照画像として機能する。
概念的には、要素を異なる構造と非晶質要素(例えば、炎や雲)と非構造的なテクスチャを持つ対象要素(例えば、花や石)に分類する。
フォント作成のための要素駆動フレームワークであるFontCrafterを導入し,多様な要素タイプと高品質なグリフ画像を含む大規模データセットElementFontを構築した。
しかし, 基準要素の構造とテクスチャの高忠実化を実現することは依然として困難である。
そこで本研究では,要素画像を視覚的コンテキストとして扱うインコンテキスト生成手法を提案する。
さらにグリフ形状を制御するために、形状情報を注入する軽量なコンテキスト対応マスクアダプタ(CMA)を設計する。
さらに、訓練不要の注意リダイレクト機構により、領域認識スタイルの制御が可能となり、脳卒中幻覚を抑える。
さらに、境界をより自然にするためにエッジ再塗装が適用される。
大規模な実験により、FontCrafterは、特に構造的およびテクスチュラルな忠実さを保ちながら、スタイルミックスのような柔軟な制御をサポートしながら、強力なゼロショット生成性能を達成することが示された。
関連論文リスト
- AnyArtisticGlyph: Multilingual Controllable Artistic Glyph Generation [19.2293398270178]
アートグリフ画像生成(AGIG)は、そのコンテンツを保存しながら、参照画像のスタイルをソースに転送する。
拡散型多言語制御可能な芸術的グリフ生成モデルであるAnyArtisticGlyphを紹介する。
論文 参考訳(メタデータ) (2025-04-07T05:37:39Z) - VitaGlyph: Vitalizing Artistic Typography with Flexible Dual-branch Diffusion Models [53.59400446543756]
アーティスティック・タイポグラフィー(Arttic typography)は、入力文字の意味を想像可能で読みやすい方法で視覚化する技法である。
そこで我々は,VitaGlyphと呼ばれる2枝のトレーニング不要な手法を導入し,幾何学的変化を制御可能な,柔軟な芸術的タイポグラフィーを実現する。
論文 参考訳(メタデータ) (2024-10-02T16:48:47Z) - VQ-Font: Few-Shot Font Generation with Structure-Aware Enhancement and
Quantization [52.870638830417]
本稿では,VQGANベースのフレームワーク(VQ-Font)を提案する。
具体的には、コードブック内でフォントトークンをカプセル化するために、VQGANを事前訓練する。その後、VQ-Fontは、合成したグリフをコードブックで洗練し、合成されたストロークと実世界のストロークのドメインギャップをなくす。
論文 参考訳(メタデータ) (2023-08-27T06:32:20Z) - GlyphDraw: Seamlessly Rendering Text with Intricate Spatial Structures
in Text-to-Image Generation [18.396131717250793]
GlyphDrawは、画像生成モデルに特定の言語に対して、テキストにコヒーレントに埋め込まれた画像を生成する能力を持たせることを目的とした、一般的な学習フレームワークである。
提案手法は,プロンプトのように正確な言語文字を生成するだけでなく,生成したテキストを背景にシームレスにブレンドする。
論文 参考訳(メタデータ) (2023-03-31T08:06:33Z) - Few-shot Font Generation by Learning Style Difference and Similarity [84.76381937516356]
異なるスタイルの違いと同一スタイルの類似性(DS-Font)を学習する新しいフォント生成手法を提案する。
具体的には,提案するクラスタレベルコントラシブ・スタイル(CCS)の損失により,スタイルエンコーディングを実現する多層型プロジェクタを提案する。
論文 参考訳(メタデータ) (2023-01-24T13:57:25Z) - GenText: Unsupervised Artistic Text Generation via Decoupled Font and
Texture Manipulation [30.654807125764965]
我々は,汎用的な芸術的テクストスタイルの転送を実現するために,GenTextという新しいアプローチを提案する。
具体的には、スタイラス化、デスティル化、フォント転送という3つの異なる段階を取り入れています。
ペアの芸術的テキスト画像の取得が困難であることを考えると,本モデルは教師なし環境下で設計されている。
論文 参考訳(メタデータ) (2022-07-20T04:42:47Z) - Few-Shot Font Generation by Learning Fine-Grained Local Styles [90.39288370855115]
フラッシュショットフォント生成(FFG)は、いくつかの例で新しいフォントを生成することを目的としている。
提案手法は,1)参照からきめ細かな局所スタイルを学習し,2)コンテンツと参照グリフの空間的対応を学習するフォント生成手法である。
論文 参考訳(メタデータ) (2022-05-20T05:07:05Z) - Few-shot Font Generation with Localized Style Representations and
Factorization [23.781619323447003]
ユニバーサルスタイルの代わりに,局所化スタイル,すなわちコンポーネントワイドスタイル表現を学習し,新しいフォント生成手法を提案する。
提案手法は,8つの基準グリフ画像しか持たない少数のフォント生成結果が,他の最先端のフォントよりも著しく優れていることを示す。
論文 参考訳(メタデータ) (2020-09-23T10:33:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。