論文の概要: SGCE-Font: Skeleton Guided Channel Expansion for Chinese Font Generation
- arxiv url: http://arxiv.org/abs/2211.14475v1
- Date: Sat, 26 Nov 2022 04:21:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-29 14:44:50.055418
- Title: SGCE-Font: Skeleton Guided Channel Expansion for Chinese Font Generation
- Title(参考訳): SGCE-Font:中国語フォント生成のための骨格誘導チャネル拡張
- Authors: Jie Zhou, Yefei Wang, Yiyang Yuan, Qing Huang, Jinshan Zeng
- Abstract要約: 本稿では,中国語フォント生成のためのスケルトンガイドチャネル拡張(SGCE)モジュールと呼ばれる新しい情報誘導モジュールを提案する。
数値計算の結果, 既知のCycleGANによるモード崩壊問題は, 提案したSGCEモジュールを装備することで効果的に軽減できることがわかった。
- 参考スコア(独自算出の注目度): 19.20334101519465
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The automatic generation of Chinese fonts is an important problem involved in
many applications. The predominated methods for the Chinese font generation are
based on the deep generative models, especially the generative adversarial
networks (GANs). However, existing GAN-based methods (say, CycleGAN) for the
Chinese font generation usually suffer from the mode collapse issue, mainly due
to the lack of effective guidance information. This paper proposes a novel
information guidance module called the skeleton guided channel expansion (SGCE)
module for the Chinese font generation through integrating the skeleton
information into the generator with the channel expansion way, motivated by the
observation that the skeleton embodies both local and global structure
information of Chinese characters. We conduct extensive experiments to show the
effectiveness of the proposed module. Numerical results show that the mode
collapse issue suffered by the known CycleGAN can be effectively alleviated by
equipping with the proposed SGCE module, and the CycleGAN equipped with SGCE
outperforms the state-of-the-art models in terms of four important evaluation
metrics and visualization quality. Besides CycleGAN, we also show that the
suggested SGCE module can be adapted to other models for Chinese font
generation as a plug-and-play module to further improve their performance.
- Abstract(参考訳): 中国語フォントの自動生成は多くのアプリケーションにおいて重要な問題である。
中国語フォント生成の優先的な方法は、特に生成逆ネットワーク(GAN)の深層生成モデルに基づいている。
しかし、中国語フォント生成のための既存のGANベースの手法(例えばCycleGAN)は、主に効果的なガイダンス情報がないためにモード崩壊の問題に悩まされる。
本稿では,漢字の局所構造情報とグローバル構造情報の両方を具現化して,文字生成のためのスケルトンガイドチャネル拡張(SGCE)モジュールと呼ばれる新しい情報誘導モジュールを提案する。
提案モジュールの有効性を示すため,広範な実験を行った。
シミュレーションの結果,提案したSGCEモジュールを装着することで,既知のCycleGANが抱えるモード崩壊問題を効果的に軽減でき,SGCEを搭載したCycleGANは4つの重要な評価指標と可視化品質で最先端のモデルより優れていることがわかった。
cycleganの他に,提案するsgceモジュールを,中国フォント生成のための他のモデルにプラグインアンドプレイモジュールとして適用することで,パフォーマンスをさらに向上できることを示す。
関連論文リスト
- A Review of Modern Recommender Systems Using Generative Models (Gen-RecSys) [57.30228361181045]
この調査は、ジェネレーティブモデル(Gen-RecSys)を用いたレコメンデーションシステムにおける重要な進歩を結びつける。
対話駆動生成モデル、自然言語レコメンデーションのための大規模言語モデル(LLM)とテキストデータの使用、RSにおける画像やビデオの生成と処理のためのマルチモーダルモデルの統合。
我々の研究は、Gen-RecSysの影響と害を評価するために必要なパラダイムを強調し、オープンな課題を特定します。
論文 参考訳(メタデータ) (2024-03-31T06:57:57Z) - Contextualization Distillation from Large Language Model for Knowledge
Graph Completion [51.126166442122546]
我々は、差別的かつ生成的なKGCフレームワークと互換性のあるプラグイン・アンド・プレイ方式であるContextualization Distillation戦略を導入する。
提案手法は,大規模言語モデルに対して,コンパクトで構造的な三重項を文脈に富んだセグメントに変換するように指示することから始まる。
多様なデータセットとKGC技術にわたる総合的な評価は、我々のアプローチの有効性と適応性を強調している。
論文 参考訳(メタデータ) (2024-01-28T08:56:49Z) - DeepCalliFont: Few-shot Chinese Calligraphy Font Synthesis by
Integrating Dual-modality Generative Models [20.76773399161289]
特に中国語のフォントのフォント生成は困難で、進行中の課題である。
本稿では,2つのモダリティ生成モデルを統合することで,数ショットの漢字フォント合成のための新しいモデルDeepCalliFontを提案する。
論文 参考訳(メタデータ) (2023-12-16T04:23:12Z) - PAI-Diffusion: Constructing and Serving a Family of Open Chinese
Diffusion Models for Text-to-image Synthesis on the Cloud [54.046884854230555]
本稿では,中国語のテキスト・画像合成のための総合的なフレームワークであるPAI-Diffusionを紹介する。
一般とドメイン固有の中国語拡散モデルが組み込まれており、文脈に関連のある画像の生成を可能にしている。
Alibaba CloudのMachine Learning Platform for AIとシームレスに統合され、アクセス可能でスケーラブルなソリューションを提供する。
論文 参考訳(メタデータ) (2023-09-11T15:18:28Z) - VQ-Font: Few-Shot Font Generation with Structure-Aware Enhancement and
Quantization [52.870638830417]
本稿では,VQGANベースのフレームワーク(VQ-Font)を提案する。
具体的には、コードブック内でフォントトークンをカプセル化するために、VQGANを事前訓練する。その後、VQ-Fontは、合成したグリフをコードブックで洗練し、合成されたストロークと実世界のストロークのドメインギャップをなくす。
論文 参考訳(メタデータ) (2023-08-27T06:32:20Z) - Chinese Financial Text Emotion Mining: GCGTS -- A Character
Relationship-based Approach for Simultaneous Aspect-Opinion Pair Extraction [7.484918031250864]
中国の財務文献からのアスペクト・オピニオン・ペア抽出(AOPE)は、微粒テキスト感情分析の専門課題である。
従来の研究は主に、この抽出プロセスを容易にするためにグリッドモデル内のグリッドアノテーションスキームの開発に重点を置いてきた。
我々は、GCGTS(Graph-based Character-level Grid Tagging Scheme)と呼ばれる新しい手法を提案する。
GCGTS法は、グラフ畳み込みネットワーク(GCN)を用いた構文構造を明示的に取り入れ、同じ意味単位(中国語の単語レベル)内で文字の符号化を統一する。
論文 参考訳(メタデータ) (2023-08-04T02:20:56Z) - Diff-Font: Diffusion Model for Robust One-Shot Font Generation [110.45944936952309]
Diff-Fontという拡散モデルに基づく新しいワンショットフォント生成手法を提案する。
提案するモデルは,フォントライブラリ全体を生成することを目的として,参照として1つのサンプルのみを与える。
十分に訓練されたDiff-Fontは、フォントギャップやフォントのバリエーションに対して堅牢であるだけでなく、難しい文字生成において有望なパフォーマンスを実現している。
論文 参考訳(メタデータ) (2022-12-12T13:51:50Z) - StrokeGAN+: Few-Shot Semi-Supervised Chinese Font Generation with Stroke
Encoding [23.886977380061662]
本稿では,ストロークエンコーディングと数発の半教師付きスキームをCycleGANモデルに組み込んだ,textitGAN+Strokeと呼ばれる効果的なモデルを提案する。
実験結果から, モード崩壊問題は, 導入した1ビットストロークエンコーディングと数発の半教師付きトレーニングスキームにより効果的に軽減できることがわかった。
論文 参考訳(メタデータ) (2022-11-11T13:39:26Z) - GRETEL: Graph Contrastive Topic Enhanced Language Model for Long
Document Extractive Summarization [22.053942327552583]
グローバルな意味情報を取得するためのグラフコントラストトピック拡張言語モデル(GRETEL)を提案する。
GRETELは階層型トランスフォーマーエンコーダとグラフコントラスト学習を統合し,グローバル文書コンテキストとゴールド要約から意味情報を融合する。
一般領域およびバイオメディカルデータセットの実験結果から,提案手法がSOTA法より優れていることが示された。
論文 参考訳(メタデータ) (2022-08-21T23:09:29Z) - Lattice-BERT: Leveraging Multi-Granularity Representations in Chinese
Pre-trained Language Models [62.41139712595334]
中国語のための新しい事前学習パラダイムであるLattice-BERTを提案する。
文中の文字や単語から格子グラフを構築し、これらすべてのテキスト単位をトランスフォーマーに供給します。
本モデルが12層設定で平均1.5%の増加をもたらすことを示した。
論文 参考訳(メタデータ) (2021-04-15T02:36:49Z) - StrokeGAN: Reducing Mode Collapse in Chinese Font Generation via Stroke
Encoding [20.877391644999534]
漢字のキーモード情報をキャプチャするための1ビットストロークエンコーディングを紹介します。
我々はこのモード情報を中国語フォント生成のための人気の深層生成モデルであるCycleGANに組み込む。
StrokeGANは一般的に、コンテンツと認識の精度で最先端の手法より優れている。
論文 参考訳(メタデータ) (2020-12-16T01:36:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。