論文の概要: Shared Latent Space of Font Shapes and Impressions
- arxiv url: http://arxiv.org/abs/2103.12347v1
- Date: Tue, 23 Mar 2021 06:54:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-25 01:09:26.827476
- Title: Shared Latent Space of Font Shapes and Impressions
- Title(参考訳): フォント形状と印象の共有潜在空間
- Authors: Jihun Kang, Daichi Haraguchi, Akisato Kimura, Seiichi Uchida
- Abstract要約: フォント形状のイメージとその印象語がクロスモーダルな方法で埋め込まれた共有潜在空間を実現する。
この潜在空間は、スタイル印象相関を理解し、複数の印象語を指定してフォント画像を生成するのに有用である。
- 参考スコア(独自算出の注目度): 9.205278113241473
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We have specific impressions from the style of a typeface (font), suggesting
that there are correlations between font shape and its impressions. Based on
this hypothesis, we realize a shared latent space where a font shape image and
its impression words are embedded in a cross-modal manner. This latent space is
useful to understand the style-impression correlation and generate font images
by specifying several impression words. Experimental results with a large
style-impression dataset prove that it is possible to accurately realize the
shared latent space, especially for shape-relevant impression words, and then
use the space to generate font images with various impressions.
- Abstract(参考訳): フォントのスタイル(font)から特定の印象があり、フォントの形状と印象の間に相関があることを示唆している。
この仮説に基づいて,フォント形状画像とその印象語がクロスモーダルな方法で埋め込まれた共有潜在空間を実現する。
この潜在空間は、スタイル印象相関を理解し、複数の印象語を指定してフォント画像を生成するのに有用である。
大きなスタイルインプレッションデータセットを用いた実験結果は、特に形状関連印象語において、共有潜在空間を正確に認識することができ、その空間を用いて様々な印象を持つフォント画像を生成することができることを証明している。
関連論文リスト
- StyleDistance: Stronger Content-Independent Style Embeddings with Synthetic Parallel Examples [48.44036251656947]
スタイル表現は、内容に関係なく、類似した書体スタイルのテキストを密に埋め込み、異なる書体スタイルのテキストを遠くに埋め込むことを目的としている。
より強力なコンテンツに依存しないスタイル埋め込みをトレーニングするための新しいアプローチであるStyleDistanceを紹介する。
論文 参考訳(メタデータ) (2024-10-16T17:25:25Z) - GRIF-DM: Generation of Rich Impression Fonts using Diffusion Models [18.15911470339845]
我々は、特定の印象を鮮明に具現化するフォントを生成するための拡散法である「usmethod」を導入する。
MyFontsデータセットを用いて,本手法が現実的で活気があり,高忠実なフォントを生成可能であることを確認した。
論文 参考訳(メタデータ) (2024-08-14T02:26:46Z) - Impression-CLIP: Contrastive Shape-Impression Embedding for Fonts [7.542892664684078]
CLIP(Contrastive Language- Image Pre-training)に基づく新しい機械学習モデルであるImpression-CLIPを提案する。
実験では,共埋め込みによるフォントと印象間の相互モーダル検索を行った。
その結果,Impression-CLIPは最先端手法よりも精度が高いことがわかった。
論文 参考訳(メタデータ) (2024-02-26T07:07:18Z) - Font Impression Estimation in the Wild [7.542892664684078]
フォントインプレッションに関するアノテーションを備えたフォントデータセットと、このタスクのための畳み込みニューラルネットワーク(CNN)フレームワークを使用する。
本稿では,入力画像に類似したフォントの印象をアンサンブルする戦略に依拠した,模範的な印象推定手法を提案する。
そこで本研究では,書籍のジャンルとフォント印象の相関分析を行った。
論文 参考訳(メタデータ) (2024-02-23T10:00:25Z) - Analyzing Font Style Usage and Contextual Factors in Real Images [12.387676601792899]
本稿では,大規模データセットを用いたフォントスタイル選択に影響を及ぼす可能性のあるフォントスタイルと文脈要因の関係を解析する。
オープン画像データセットの約80万語を用いてフォントスタイルとその周辺オブジェクト(バスなど)の関係を解析する。
論文 参考訳(メタデータ) (2023-06-21T06:43:22Z) - CF-Font: Content Fusion for Few-shot Font Generation [63.79915037830131]
本稿では、コンテンツ特徴をベースフォントのコンテンツ特徴によって定義される線形空間に投影するコンテンツ融合モジュール(CFM)を提案する。
提案手法では,参照画像のスタイル表現ベクトルの最適化も可能である。
我々は,6.5k文字の300フォントのデータセットを用いて評価を行った。
論文 参考訳(メタデータ) (2023-03-24T14:18:40Z) - Few-shot Font Generation by Learning Style Difference and Similarity [84.76381937516356]
異なるスタイルの違いと同一スタイルの類似性(DS-Font)を学習する新しいフォント生成手法を提案する。
具体的には,提案するクラスタレベルコントラシブ・スタイル(CCS)の損失により,スタイルエンコーディングを実現する多層型プロジェクタを提案する。
論文 参考訳(メタデータ) (2023-01-24T13:57:25Z) - Few-Shot Font Generation by Learning Fine-Grained Local Styles [90.39288370855115]
フラッシュショットフォント生成(FFG)は、いくつかの例で新しいフォントを生成することを目的としている。
提案手法は,1)参照からきめ細かな局所スタイルを学習し,2)コンテンツと参照グリフの空間的対応を学習するフォント生成手法である。
論文 参考訳(メタデータ) (2022-05-20T05:07:05Z) - Generating More Pertinent Captions by Leveraging Semantics and Style on
Multi-Source Datasets [56.018551958004814]
本稿では,データソースの非一様結合をトレーニングすることで,流動的な記述を生成するタスクに対処する。
ノイズの多い画像とテキストのペアを持つ大規模データセットは、サブ最適の監視源を提供する。
本稿では,検索コンポーネントから抽出したスタイルトークンとキーワードを組み込むことにより,セマンティクスと記述スタイルを活用・分離することを提案する。
論文 参考訳(メタデータ) (2021-11-24T19:00:05Z) - Scalable Font Reconstruction with Dual Latent Manifolds [55.29525824849242]
タイポグラフィー解析とフォント再構成を行う深層生成モデルを提案する。
このアプローチによって、効果的にモデル化できるキャラクタの種類を大規模にスケールアップすることが可能になります。
多くの言語の文字タイプを表す様々なデータセット上でフォント再構成のタスクを評価する。
論文 参考訳(メタデータ) (2021-09-10T20:37:43Z) - Which Parts determine the Impression of the Font? [0.0]
様々なフォントは、レグレッシブル、ラフ、コミックテキストなど様々な印象を与える。
文字全体の形状ではなく、局所的な形状に焦点を合わせることで、文字型の独立でより一般的な分析を実現できます。
論文 参考訳(メタデータ) (2021-03-26T02:13:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。