論文の概要: ZiGAN: Fine-grained Chinese Calligraphy Font Generation via a Few-shot
Style Transfer Approach
- arxiv url: http://arxiv.org/abs/2108.03596v1
- Date: Sun, 8 Aug 2021 09:50:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-10 15:28:57.688677
- Title: ZiGAN: Fine-grained Chinese Calligraphy Font Generation via a Few-shot
Style Transfer Approach
- Title(参考訳): ZiGAN:Few-shotスタイル転送による微粒中国書道フォント生成
- Authors: Qi Wen, Shuang Li, Bingfeng Han, Yi Yuan
- Abstract要約: ZiGANは、強力なエンドツーエンドの漢字フォント生成フレームワークである。
微粒なターゲットスタイルの文字を生成するために手動操作や冗長な前処理を一切必要としない。
提案手法は,数発の漢字スタイル転送における最先端の一般化能力を有する。
- 参考スコア(独自算出の注目度): 7.318027179922774
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Chinese character style transfer is a very challenging problem because of the
complexity of the glyph shapes or underlying structures and large numbers of
existed characters, when comparing with English letters. Moreover, the
handwriting of calligraphy masters has a more irregular stroke and is difficult
to obtain in real-world scenarios. Recently, several GAN-based methods have
been proposed for font synthesis, but some of them require numerous reference
data and the other part of them have cumbersome preprocessing steps to divide
the character into different parts to be learned and transferred separately. In
this paper, we propose a simple but powerful end-to-end Chinese calligraphy
font generation framework ZiGAN, which does not require any manual operation or
redundant preprocessing to generate fine-grained target-style characters with
few-shot references. To be specific, a few paired samples from different
character styles are leveraged to attain a fine-grained correlation between
structures underlying different glyphs. To capture valuable style knowledge in
target and strengthen the coarse-grained understanding of character content, we
utilize multiple unpaired samples to align the feature distributions belonging
to different character styles. By doing so, only a few target Chinese
calligraphy characters are needed to generated expected style transferred
characters. Experiments demonstrate that our method has a state-of-the-art
generalization ability in few-shot Chinese character style transfer.
- Abstract(参考訳): 英語の文字と比較すると、グリフの形状や基本構造が複雑で、多数の文字が存在しているため、漢字のスタイル変換は非常に難しい問題である。
また、書道師匠の筆跡はより不規則なストロークであり、現実のシナリオでは入手が困難である。
近年, フォント合成のためのいくつかのGAN法が提案されているが, その一部には多数の参照データが必要であり, その他の部分では, 文字を異なる部分に分割し, 個別に学習し, 転送する作業が煩雑である。
本稿では、手動操作や冗長な前処理を必要とせず、少ない参照で微粒なターゲットスタイルの文字を生成する簡易かつ強力な中国語書体生成フレームワークZiGANを提案する。
具体的には、異なるキャラクタスタイルのいくつかのペアサンプルを活用して、異なるグリフの構造間のきめ細かい相関を得る。
対象に価値あるスタイル知識を取り込み,文字内容の粗い理解を強化するため,複数の非ペアサンプルを用いて,異なるキャラクタスタイルに属する特徴分布の調整を行う。
これにより、期待されたスタイルの転写文字を生成するには、少数の漢字が必要とされる。
実験により,この手法は,漢字の文字変換における最先端の一般化能力を有することを示す。
関連論文リスト
- Decoupling Layout from Glyph in Online Chinese Handwriting Generation [6.566541829858544]
テキスト行レイアウト生成器とスタイル化フォント合成器を開発した。
レイアウトジェネレータは、テキスト内容と提供されたスタイル参照に基づいて、コンテキスト内学習を行い、各グリフに対する位置を自己回帰的に生成する。
文字埋め込み辞書、マルチスケールの書体スタイルエンコーダ、及び1DのU-Netベースの拡散デノイザからなるフォントシンセサイザは、所定のスタイル参照から抽出された書体スタイルを模倣しつつ、その位置に各フォントを生成する。
論文 参考訳(メタデータ) (2024-10-03T08:46:17Z) - VQ-Font: Few-Shot Font Generation with Structure-Aware Enhancement and
Quantization [52.870638830417]
本稿では,VQGANベースのフレームワーク(VQ-Font)を提案する。
具体的には、コードブック内でフォントトークンをカプセル化するために、VQGANを事前訓練する。その後、VQ-Fontは、合成したグリフをコードブックで洗練し、合成されたストロークと実世界のストロークのドメインギャップをなくす。
論文 参考訳(メタデータ) (2023-08-27T06:32:20Z) - Handwritten Text Generation from Visual Archetypes [25.951540903019467]
Few-Shotスタイルの手書きテキスト生成のためのTransformerベースのモデルを提案する。
我々は,大規模な合成データセット上で,特定の事前学習を活用することで,目に見えない作者の書跡の堅牢な表現を得る。
論文 参考訳(メタデータ) (2023-03-27T14:58:20Z) - Learning Generative Structure Prior for Blind Text Image
Super-resolution [153.05759524358467]
我々は、キャラクター構造にもっと焦点をあてた小説を提示する。
StyleGANの生成空間を制限するため、各文字の離散的な特徴をコードブックに格納する。
提案した構造は, 従来より強い文字特異的指導を行い, 指定された文字の忠実で正確なストロークを復元する。
論文 参考訳(メタデータ) (2023-03-26T13:54:28Z) - Few-shot Font Generation by Learning Style Difference and Similarity [84.76381937516356]
異なるスタイルの違いと同一スタイルの類似性(DS-Font)を学習する新しいフォント生成手法を提案する。
具体的には,提案するクラスタレベルコントラシブ・スタイル(CCS)の損失により,スタイルエンコーディングを実現する多層型プロジェクタを提案する。
論文 参考訳(メタデータ) (2023-01-24T13:57:25Z) - Diff-Font: Diffusion Model for Robust One-Shot Font Generation [110.45944936952309]
Diff-Fontという拡散モデルに基づく新しいワンショットフォント生成手法を提案する。
提案するモデルは,フォントライブラリ全体を生成することを目的として,参照として1つのサンプルのみを与える。
十分に訓練されたDiff-Fontは、フォントギャップやフォントのバリエーションに対して堅牢であるだけでなく、難しい文字生成において有望なパフォーマンスを実現している。
論文 参考訳(メタデータ) (2022-12-12T13:51:50Z) - Few-Shot Font Generation by Learning Fine-Grained Local Styles [90.39288370855115]
フラッシュショットフォント生成(FFG)は、いくつかの例で新しいフォントを生成することを目的としている。
提案手法は,1)参照からきめ細かな局所スタイルを学習し,2)コンテンツと参照グリフの空間的対応を学習するフォント生成手法である。
論文 参考訳(メタデータ) (2022-05-20T05:07:05Z) - Scalable Font Reconstruction with Dual Latent Manifolds [55.29525824849242]
タイポグラフィー解析とフォント再構成を行う深層生成モデルを提案する。
このアプローチによって、効果的にモデル化できるキャラクタの種類を大規模にスケールアップすることが可能になります。
多くの言語の文字タイプを表す様々なデータセット上でフォント再構成のタスクを評価する。
論文 参考訳(メタデータ) (2021-09-10T20:37:43Z) - Few-Shot Font Generation with Deep Metric Learning [33.12829580813688]
提案するフレームワークは、スタイルエンコーダにディープメトリック学習を導入している。
白黒フォントと形状識別フォントのデータセットを用いて実験を行った。
論文 参考訳(メタデータ) (2020-11-04T10:12:10Z) - Few-shot Font Generation with Localized Style Representations and
Factorization [23.781619323447003]
ユニバーサルスタイルの代わりに,局所化スタイル,すなわちコンポーネントワイドスタイル表現を学習し,新しいフォント生成手法を提案する。
提案手法は,8つの基準グリフ画像しか持たない少数のフォント生成結果が,他の最先端のフォントよりも著しく優れていることを示す。
論文 参考訳(メタデータ) (2020-09-23T10:33:01Z) - CalliGAN: Style and Structure-aware Chinese Calligraphy Character
Generator [6.440233787863018]
書道(きゅうりょう)とは、筆で行う芸術形式としての漢字の書法である。
近年の研究では、1つのモデルを用いて複数のスタイルのイメージ・ツー・イメージ翻訳によって漢字を生成することができることが示されている。
そこで本研究では,漢字の成分情報をモデルに組み込んだ新しい手法を提案する。
論文 参考訳(メタデータ) (2020-05-26T03:15:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。