論文の概要: StrokeGAN: Reducing Mode Collapse in Chinese Font Generation via Stroke
Encoding
- arxiv url: http://arxiv.org/abs/2012.08687v2
- Date: Mon, 11 Jan 2021 01:41:46 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-07 03:20:29.453520
- Title: StrokeGAN: Reducing Mode Collapse in Chinese Font Generation via Stroke
Encoding
- Title(参考訳): ストロークGAN:ストロークエンコーディングによる中国のフォント生成におけるモード崩壊の低減
- Authors: Jinshan Zeng, Qi Chen, Yunxin Liu, Mingwen Wang, Yuan Yao
- Abstract要約: 漢字のキーモード情報をキャプチャするための1ビットストロークエンコーディングを紹介します。
我々はこのモード情報を中国語フォント生成のための人気の深層生成モデルであるCycleGANに組み込む。
StrokeGANは一般的に、コンテンツと認識の精度で最先端の手法より優れている。
- 参考スコア(独自算出の注目度): 20.877391644999534
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The generation of stylish Chinese fonts is an important problem involved in
many applications. Most of existing generation methods are based on the deep
generative models, particularly, the generative adversarial networks (GAN)
based models. However, these deep generative models may suffer from the mode
collapse issue, which significantly degrades the diversity and quality of
generated results. In this paper, we introduce a one-bit stroke encoding to
capture the key mode information of Chinese characters and then incorporate it
into CycleGAN, a popular deep generative model for Chinese font generation. As
a result we propose an efficient method called StrokeGAN, mainly motivated by
the observation that the stroke encoding contains amount of mode information of
Chinese characters. In order to reconstruct the one-bit stroke encoding of the
associated generated characters, we introduce a stroke-encoding reconstruction
loss imposed on the discriminator. Equipped with such one-bit stroke encoding
and stroke-encoding reconstruction loss, the mode collapse issue of CycleGAN
can be significantly alleviated, with an improved preservation of strokes and
diversity of generated characters. The effectiveness of StrokeGAN is
demonstrated by a series of generation tasks over nine datasets with different
fonts. The numerical results demonstrate that StrokeGAN generally outperforms
the state-of-the-art methods in terms of content and recognition accuracies, as
well as certain stroke error, and also generates more realistic characters.
- Abstract(参考訳): スタイリッシュな中国語フォントの生成は多くのアプリケーションにおいて重要な問題である。
既存の生成手法のほとんどは、特にgan(generative adversarial networks)に基づく深層生成モデルに基づいている。
しかし、これらの深層生成モデルはモード崩壊問題に悩まされ、生成した結果の多様性と品質が著しく低下する。
本稿では,漢字のキーモード情報を取り込んで,中国語フォント生成のための一般的な深層生成モデルである cyclegan に組み込む1ビットストローク符号化を提案する。
そこで本研究では,ストロークエンコーディングが漢字のモード情報を含むという観測を主目的とした,効率的なストロークガン法を提案する。
関連する生成文字の1ビットストローク符号化を再構築するために、識別器に課されるストロークエンコード復元損失を導入する。
このような1ビットのストロークエンコーディングとストロークエンコード再構成損失により、CycleGANのモード崩壊問題を大幅に軽減し、ストロークの保存と生成された文字の多様性を改善した。
StrokeGANの有効性は、異なるフォントを持つ9つのデータセットに対して一連の生成タスクによって実証される。
数値的な結果から,StrokeGANはコンテントや認識精度,ストロークエラーなど,最先端の手法よりも優れ,より現実的な文字を生成することがわかった。
関連論文リスト
- DeepCalliFont: Few-shot Chinese Calligraphy Font Synthesis by
Integrating Dual-modality Generative Models [20.76773399161289]
特に中国語のフォントのフォント生成は困難で、進行中の課題である。
本稿では,2つのモダリティ生成モデルを統合することで,数ショットの漢字フォント合成のための新しいモデルDeepCalliFontを提案する。
論文 参考訳(メタデータ) (2023-12-16T04:23:12Z) - VQ-Font: Few-Shot Font Generation with Structure-Aware Enhancement and
Quantization [52.870638830417]
本稿では,VQGANベースのフレームワーク(VQ-Font)を提案する。
具体的には、コードブック内でフォントトークンをカプセル化するために、VQGANを事前訓練する。その後、VQ-Fontは、合成したグリフをコードブックで洗練し、合成されたストロークと実世界のストロークのドメインギャップをなくす。
論文 参考訳(メタデータ) (2023-08-27T06:32:20Z) - DGFont++: Robust Deformable Generative Networks for Unsupervised Font
Generation [19.473023811252116]
教師なしフォント生成のための頑健な変形可能な生成ネットワークを提案する(略してDGFont++)。
異なるスタイルを区別するために、我々はマルチタスク判別器を用いてモデルを訓練し、それぞれのスタイルを独立して識別できるようにした。
実験により,本モデルは最先端手法よりも高品質なキャラクタ画像を生成することができることが示された。
論文 参考訳(メタデータ) (2022-12-30T14:35:10Z) - Diff-Font: Diffusion Model for Robust One-Shot Font Generation [110.45944936952309]
Diff-Fontという拡散モデルに基づく新しいワンショットフォント生成手法を提案する。
提案するモデルは,フォントライブラリ全体を生成することを目的として,参照として1つのサンプルのみを与える。
十分に訓練されたDiff-Fontは、フォントギャップやフォントのバリエーションに対して堅牢であるだけでなく、難しい文字生成において有望なパフォーマンスを実現している。
論文 参考訳(メタデータ) (2022-12-12T13:51:50Z) - SGCE-Font: Skeleton Guided Channel Expansion for Chinese Font Generation [19.20334101519465]
本稿では,中国語フォント生成のためのスケルトンガイドチャネル拡張(SGCE)モジュールと呼ばれる新しい情報誘導モジュールを提案する。
数値計算の結果, 既知のCycleGANによるモード崩壊問題は, 提案したSGCEモジュールを装備することで効果的に軽減できることがわかった。
論文 参考訳(メタデータ) (2022-11-26T04:21:46Z) - Chinese Character Recognition with Radical-Structured Stroke Trees [51.8541677234175]
我々は各漢字を,その根本的構造に従って整理されたストロークツリーとして表現する。
本稿では,2段階の分解フレームワークを提案し,特徴-ラディカルデコーダがラジカル構造とラジカル領域を知覚する。
Radical-to-Stroke Decoderはさらに、ラジカル領域の特徴に応じてストロークシーケンスを予測する。
論文 参考訳(メタデータ) (2022-11-24T10:28:55Z) - StrokeGAN+: Few-Shot Semi-Supervised Chinese Font Generation with Stroke
Encoding [23.886977380061662]
本稿では,ストロークエンコーディングと数発の半教師付きスキームをCycleGANモデルに組み込んだ,textitGAN+Strokeと呼ばれる効果的なモデルを提案する。
実験結果から, モード崩壊問題は, 導入した1ビットストロークエンコーディングと数発の半教師付きトレーニングスキームにより効果的に軽減できることがわかった。
論文 参考訳(メタデータ) (2022-11-11T13:39:26Z) - FontTransformer: Few-shot High-resolution Chinese Glyph Image Synthesis
via Stacked Transformers [21.705680113996742]
本稿では,高精度な中国語グリフ画像合成のための新しい数ショット学習モデルであるFontTransformerを提案する。
また、よりグリフ情報と事前知識をモデルに供給する新しい符号化方式を設計する。
論文 参考訳(メタデータ) (2022-10-12T15:09:22Z) - Scalable Font Reconstruction with Dual Latent Manifolds [55.29525824849242]
タイポグラフィー解析とフォント再構成を行う深層生成モデルを提案する。
このアプローチによって、効果的にモデル化できるキャラクタの種類を大規模にスケールアップすることが可能になります。
多くの言語の文字タイプを表す様々なデータセット上でフォント再構成のタスクを評価する。
論文 参考訳(メタデータ) (2021-09-10T20:37:43Z) - A Multi-Implicit Neural Representation for Fonts [79.6123184198301]
エッジやコーナーのようなフォント固有の不連続性は、ニューラルネットワークを使って表現することが難しい。
そこで我々は,フォントを文順に表現するためのtextitmulti-implicitsを導入する。
論文 参考訳(メタデータ) (2021-06-12T21:40:11Z) - Blind Face Restoration via Deep Multi-scale Component Dictionaries [75.02640809505277]
劣化した観測の復元過程をガイドするディープフェイス辞書ネットワーク(DFDNet)を提案する。
DFDNetは高品質な画像から知覚的に重要な顔成分のディープ辞書を生成する。
コンポーネントAdaINは、入力機能と辞書機能の間のスタイルの多様性を取り除くために利用される。
論文 参考訳(メタデータ) (2020-08-02T07:02:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。