論文の概要: Calliffusion: Chinese Calligraphy Generation and Style Transfer with
Diffusion Modeling
- arxiv url: http://arxiv.org/abs/2305.19124v1
- Date: Tue, 30 May 2023 15:34:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-31 15:36:14.567882
- Title: Calliffusion: Chinese Calligraphy Generation and Style Transfer with
Diffusion Modeling
- Title(参考訳): カリーフフュージョン:拡散モデルによる中国の書道生成と書体伝達
- Authors: Qisheng Liao, Gus Xia, Zhinuo Wang
- Abstract要約: 拡散モデルを用いて高品質な漢字書体を生成するシステムであるCaliffusionを提案する。
我々のモデルアーキテクチャはDDPM(Denoising Diffusion Probabilistic Models)に基づいている
- 参考スコア(独自算出の注目度): 1.856334276134661
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In this paper, we propose Calliffusion, a system for generating high-quality
Chinese calligraphy using diffusion models. Our model architecture is based on
DDPM (Denoising Diffusion Probabilistic Models), and it is capable of
generating common characters in five different scripts and mimicking the styles
of famous calligraphers. Experiments demonstrate that our model can generate
calligraphy that is difficult to distinguish from real artworks and that our
controls for characters, scripts, and styles are effective. Moreover, we
demonstrate one-shot transfer learning, using LoRA (Low-Rank Adaptation) to
transfer Chinese calligraphy art styles to unseen characters and even
out-of-domain symbols such as English letters and digits.
- Abstract(参考訳): 本稿では,拡散モデルを用いた高品質中国語書道作成システムであるcalliffusionを提案する。
我々のモデルアーキテクチャはDDPM(Denoising Diffusion Probabilistic Models)に基づいており、5つの異なるスクリプトで共通文字を生成し、有名な書体のスタイルを模倣することができる。
実験により,本モデルは実際の美術品と区別が難しい書跡を生成でき,文字,スクリプト,スタイルの制御が効果的であることを実証した。
さらに,LoRA(Low-Rank Adaptation)を用いて中国語の書風を未知の文字や,英語の文字や数字などドメイン外記号に変換する一発転写学習を実演する。
関連論文リスト
- Moyun: A Diffusion-Based Model for Style-Specific Chinese Calligraphy Generation [10.7430517947254]
「もゆん」は、生成過程を効果的に制御し、特定の様式で書を書ける。
書道においても「もゆん」は書道の様式にマッチした書風を書ける。
論文 参考訳(メタデータ) (2024-10-10T05:14:03Z) - Ada-adapter:Fast Few-shot Style Personlization of Diffusion Model with Pre-trained Image Encoder [57.574544285878794]
Ada-Adapterは拡散モデルの少数ショットスタイルのパーソナライズのための新しいフレームワークである。
提案手法は,単一の参照画像を用いたゼロショット方式の効率的な転送を可能にする。
フラットアートや3Dレンダリング,ロゴデザインなど,さまざまな芸術的スタイルに対するアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2024-07-08T02:00:17Z) - CalliPaint: Chinese Calligraphy Inpainting with Diffusion Model [17.857394263321538]
本稿では,中国書道の書道とイメージインペインティングの両面での最近の進歩を生かした新しいモデルを提案する。
提案したモデルであるCalliPaintは、説得力のある漢字を書けることを示す。
論文 参考訳(メタデータ) (2023-12-03T23:29:59Z) - Discffusion: Discriminative Diffusion Models as Few-shot Vision and Language Learners [88.07317175639226]
本稿では,事前学習したテキストと画像の拡散モデルを数ショットの識別学習者に変換する新しい手法,DSDを提案する。
本手法は, 安定拡散モデルにおいて, 視覚情報とテキスト情報の相互影響を捉えるために, クロスアテンションスコアを用いている。
論文 参考訳(メタデータ) (2023-05-18T05:41:36Z) - DS-Fusion: Artistic Typography via Discriminated and Stylized Diffusion [10.75789076591325]
1つ以上の文字フォントをスタイリングすることで,芸術的タイポグラフィーを自動的に生成する新しい手法を提案する。
提案手法では,大規模言語モデルを用いてテキストや視覚画像をブリッジしてスタイリングし,教師なし生成モデルを構築する。
論文 参考訳(メタデータ) (2023-03-16T19:12:52Z) - StylerDALLE: Language-Guided Style Transfer Using a Vector-Quantized
Tokenizer of a Large-Scale Generative Model [64.26721402514957]
本論文では,自然言語を用いて抽象芸術スタイルを記述するスタイル転送手法であるStylerDALLEを提案する。
具体的には、非自己回帰的なトークンシーケンス変換として、言語誘導型転送タスクを定式化する。
スタイル情報を組み込むために,CLIPに基づく言語指導による強化学習戦略を提案する。
論文 参考訳(メタデータ) (2023-03-16T12:44:44Z) - Few-shot Font Generation by Learning Style Difference and Similarity [84.76381937516356]
異なるスタイルの違いと同一スタイルの類似性(DS-Font)を学習する新しいフォント生成手法を提案する。
具体的には,提案するクラスタレベルコントラシブ・スタイル(CCS)の損失により,スタイルエンコーディングを実現する多層型プロジェクタを提案する。
論文 参考訳(メタデータ) (2023-01-24T13:57:25Z) - Diff-Font: Diffusion Model for Robust One-Shot Font Generation [110.45944936952309]
Diff-Fontという拡散モデルに基づく新しいワンショットフォント生成手法を提案する。
提案するモデルは,フォントライブラリ全体を生成することを目的として,参照として1つのサンプルのみを与える。
十分に訓練されたDiff-Fontは、フォントギャップやフォントのバリエーションに対して堅牢であるだけでなく、難しい文字生成において有望なパフォーマンスを実現している。
論文 参考訳(メタデータ) (2022-12-12T13:51:50Z) - ShufaNet: Classification method for calligraphers who have reached the
professional level [0.0]
そこで我々は,中国の書道スタイルを計量学習に基づいて分類する新しい手法,ShufaNetを提案する。
提案手法は,resNetや他の主流CNNを超越した,数ショット学習のためのデータセットの精度を65%向上した。
論文 参考訳(メタデータ) (2021-11-22T16:55:31Z) - Scalable Font Reconstruction with Dual Latent Manifolds [55.29525824849242]
タイポグラフィー解析とフォント再構成を行う深層生成モデルを提案する。
このアプローチによって、効果的にモデル化できるキャラクタの種類を大規模にスケールアップすることが可能になります。
多くの言語の文字タイプを表す様々なデータセット上でフォント再構成のタスクを評価する。
論文 参考訳(メタデータ) (2021-09-10T20:37:43Z) - CalliGAN: Style and Structure-aware Chinese Calligraphy Character
Generator [6.440233787863018]
書道(きゅうりょう)とは、筆で行う芸術形式としての漢字の書法である。
近年の研究では、1つのモデルを用いて複数のスタイルのイメージ・ツー・イメージ翻訳によって漢字を生成することができることが示されている。
そこで本研究では,漢字の成分情報をモデルに組み込んだ新しい手法を提案する。
論文 参考訳(メタデータ) (2020-05-26T03:15:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。