論文の概要: Hierarchical Co-Embedding of Font Shapes and Impression Tags
- arxiv url: http://arxiv.org/abs/2604.04158v1
- Date: Sun, 05 Apr 2026 15:55:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:18.951053
- Title: Hierarchical Co-Embedding of Font Shapes and Impression Tags
- Title(参考訳): フォント形状と印象タグの階層的共埋め込み
- Authors: Yugo Kubota, Kaito Shiku, Seiichi Uchida,
- Abstract要約: フォントの形状は様々な印象を引き起こすが、フォントと印象記述の対応は1対1ではない。
本稿では,単純なペアアライメントではなく,エンテーメントによるフォント印象対応をモデル化した双曲的共埋め込みフレームワークを提案する。
- 参考スコア(独自算出の注目度): 7.423684794798727
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Font shapes can evoke a wide range of impressions, but the correspondence between fonts and impression descriptions is not one-to-one: some impressions are broadly compatible with diverse styles, whereas others strongly constrain the set of plausible fonts. We refer to this graded constraint strength as style specificity. In this paper, we propose a hyperbolic co-embedding framework that models font--impression correspondence through entailment rather than simple paired alignment. Font images and impression descriptions, represented as single tags or tag sets, are embedded in a shared hyperbolic space with two complementary entailment constraints: impression-to-font entailment and low-to-high style-specificity entailment among impressions. This formulation induces a radial structure in which low style-specificity impressions lie near the origin and high style-specificity impressions lie farther away, yielding an interpretable geometric measure of how strongly an impression constrains font style. Experiments on the MyFonts dataset demonstrate improved bidirectional retrieval over strong one-to-one baselines. In addition, traversal and tag-level analyses show that the learned space captures a coherent progression from ambiguous to more style-specific impressions and provides a meaningful, data-driven quantification of style specificity.
- Abstract(参考訳): フォントの形は様々な印象を引き起こすが、フォントと印象記述の対応は1対1ではない。
この段階的制約強度をスタイル特異性(style specificity)と呼ぶ。
本稿では,単純なペアアライメントではなく,エンテーメントによるフォント印象対応をモデル化するハイパーボリックな共埋め込みフレームワークを提案する。
単一タグやタグセットとして表現されたフォント画像や印象記述は、2つの相補的エンタテインメント制約(インプレッション・ツー・フォント・エンタテインメントと、インプレッション間の低・高・高・高・高のスタイル特化エンタテインメント)を持つ共有双曲空間に埋め込まれる。
この定式化は、低スタイル特異性印象が原点付近に在り、高スタイル特異性印象が遠方にあるラジアル構造を誘導し、印象がフォントスタイルをいかに強く制約するかの解釈可能な幾何学的尺度を与える。
MyFontsデータセットの実験では、強い1対1のベースライン上での双方向検索の改善が示されている。
さらに、トラバーサルとタグレベルの分析により、学習空間はあいまいな印象からよりスタイル特異的な印象へのコヒーレントな進行を捉え、スタイル特異性の有意義でデータ駆動的な定量化を提供することを示した。
関連論文リスト
- Embedding Font Impression Word Tags Based on Co-occurrence [7.312180925669324]
異なるフォントスタイルは異なる印象を伝達し、フォントの形状とそれらの印象を記述する単語タグの密接な関係を示す。
本稿では,これらの形状印象関係を利用した印象タグの埋め込み手法を提案する。
論文 参考訳(メタデータ) (2025-08-26T09:02:17Z) - Calligrapher: Freestyle Text Image Customization [72.71919410487881]
Calligrapherは、高度なテキストのカスタマイズと芸術的なタイポグラフィを統合する、新しい拡散ベースのフレームワークである。
高品質で視覚的に一貫したタイポグラフィーを自動化することで、Calligrapherは従来のモデルを上回っている。
論文 参考訳(メタデータ) (2025-06-30T17:59:06Z) - StyleDistance: Stronger Content-Independent Style Embeddings with Synthetic Parallel Examples [48.44036251656947]
スタイル表現は、内容に関係なく、類似した書体スタイルのテキストを密に埋め込み、異なる書体スタイルのテキストを遠くに埋め込むことを目的としている。
より強力なコンテンツに依存しないスタイル埋め込みをトレーニングするための新しいアプローチであるStyleDistanceを紹介する。
論文 参考訳(メタデータ) (2024-10-16T17:25:25Z) - GRIF-DM: Generation of Rich Impression Fonts using Diffusion Models [18.15911470339845]
我々は、特定の印象を鮮明に具現化するフォントを生成するための拡散法である「usmethod」を導入する。
MyFontsデータセットを用いて,本手法が現実的で活気があり,高忠実なフォントを生成可能であることを確認した。
論文 参考訳(メタデータ) (2024-08-14T02:26:46Z) - Impression-CLIP: Contrastive Shape-Impression Embedding for Fonts [7.542892664684078]
CLIP(Contrastive Language- Image Pre-training)に基づく新しい機械学習モデルであるImpression-CLIPを提案する。
実験では,共埋め込みによるフォントと印象間の相互モーダル検索を行った。
その結果,Impression-CLIPは最先端手法よりも精度が高いことがわかった。
論文 参考訳(メタデータ) (2024-02-26T07:07:18Z) - Few-shot Font Generation by Learning Style Difference and Similarity [84.76381937516356]
異なるスタイルの違いと同一スタイルの類似性(DS-Font)を学習する新しいフォント生成手法を提案する。
具体的には,提案するクラスタレベルコントラシブ・スタイル(CCS)の損失により,スタイルエンコーディングを実現する多層型プロジェクタを提案する。
論文 参考訳(メタデータ) (2023-01-24T13:57:25Z) - Font Generation with Missing Impression Labels [15.228202509283248]
本稿では,欠落した印象ラベルに対して頑健なフォント生成モデルを提案する。
提案手法の主な考え方は,(1)共起型ラベル推定器と(2)印象ラベル空間圧縮器である。
定性的,定量的な評価により,ラベルを欠いた多ラベルデータを用いて高品質なフォント画像を生成することを実証した。
論文 参考訳(メタデータ) (2022-03-19T16:02:54Z) - Generating More Pertinent Captions by Leveraging Semantics and Style on
Multi-Source Datasets [56.018551958004814]
本稿では,データソースの非一様結合をトレーニングすることで,流動的な記述を生成するタスクに対処する。
ノイズの多い画像とテキストのペアを持つ大規模データセットは、サブ最適の監視源を提供する。
本稿では,検索コンポーネントから抽出したスタイルトークンとキーワードを組み込むことにより,セマンティクスと記述スタイルを活用・分離することを提案する。
論文 参考訳(メタデータ) (2021-11-24T19:00:05Z) - Scalable Font Reconstruction with Dual Latent Manifolds [55.29525824849242]
タイポグラフィー解析とフォント再構成を行う深層生成モデルを提案する。
このアプローチによって、効果的にモデル化できるキャラクタの種類を大規模にスケールアップすることが可能になります。
多くの言語の文字タイプを表す様々なデータセット上でフォント再構成のタスクを評価する。
論文 参考訳(メタデータ) (2021-09-10T20:37:43Z) - Shared Latent Space of Font Shapes and Impressions [9.205278113241473]
フォント形状のイメージとその印象語がクロスモーダルな方法で埋め込まれた共有潜在空間を実現する。
この潜在空間は、スタイル印象相関を理解し、複数の印象語を指定してフォント画像を生成するのに有用である。
論文 参考訳(メタデータ) (2021-03-23T06:54:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。