論文の概要: AI Based Font Pair Suggestion Modelling For Graphic Design
- arxiv url: http://arxiv.org/abs/2501.10969v1
- Date: Sun, 19 Jan 2025 07:08:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-22 14:25:36.502008
- Title: AI Based Font Pair Suggestion Modelling For Graphic Design
- Title(参考訳): グラフィックデザインのためのAIベースのFont Pair Suggestion Modelling
- Authors: Aryan Singh, Sumithra Bhakthavatsalam,
- Abstract要約: Microsoft DesignerにおけるAI生成設計の重要な課題の1つは、デザイン提案に最もコンテキスト的に関連があり、新しいフォントを選択することである。
本研究は,フォントの視覚埋め込み,フォントストローク幅アルゴリズム,フォントマッピングデータセットへのフォントカテゴリ,および軽量で低レイテンシで知識に富んだミニ言語モデル(Mini LM V2)を作成し,複数の組のコンテキスト方向およびサブヘッドフォントを推奨する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: One of the key challenges of AI generated designs in Microsoft Designer is selecting the most contextually relevant and novel fonts for the design suggestions. Previous efforts involved manually mapping design intent to fonts. Though this was high quality, this method does not scale for a large number of fonts (3000+) and numerous user intents for graphic design. In this work we create font visual embeddings, a font stroke width algorithm, a font category to font mapping dataset, an LLM-based category utilization description and a lightweight, low latency knowledge-distilled mini language model (Mini LM V2) to recommend multiple pairs of contextual heading and subheading fonts for beautiful and intuitive designs. We also utilize a weighted scoring mechanism, nearest neighbor approach and stratified sampling to rank the font pairs and bring novelty to the predictions.
- Abstract(参考訳): Microsoft DesignerにおけるAI生成設計の重要な課題の1つは、デザイン提案に最もコンテキスト的に関連があり、新しいフォントを選択することである。
それまでの取り組みは、デザイン意図をフォントに手動でマッピングすることであった。
高品質であったが、この方法は多数のフォント(3000以上)と多くのユーザ意図をグラフィックデザインに拡張するものではない。
本研究は,フォントの視覚埋め込み,フォントストローク幅アルゴリズム,フォントマッピングデータセットへのフォントカテゴリ,LLMに基づくカテゴリ利用記述,および軽量で低レイテンシで知識に富んだミニ言語モデル(Mini LM V2)を作成し,美しいデザインと直感的なデザインのために複数のコンテキスト方向とサブヘッダフォントを推奨する。
また、重み付けされたスコアリング機構、近傍のアプローチ、および階層化サンプリングを利用してフォントペアをランク付けし、予測に新規性をもたらす。
関連論文リスト
- GLDesigner: Leveraging Multi-Modal LLMs as Designer for Enhanced Aesthetic Text Glyph Layouts [53.568057283934714]
コンテンツ対応のテキストロゴレイアウトを生成するVLMベースのフレームワークを提案する。
本稿では,複数のグリフ画像の同時処理における計算量を削減するための2つのモデル手法を提案する。
アウトモデルのインストラクションチューニングを支援するために,既存の公開データセットよりも5倍大きい2つの拡張テキストロゴデータセットを構築した。
論文 参考訳(メタデータ) (2024-11-18T10:04:10Z) - TextLap: Customizing Language Models for Text-to-Layout Planning [65.02105936609021]
メソッドをTextLap(テキストベースのレイアウト計画)と呼びます。
キュレートされた命令ベースのレイアウト計画データセット(InsLap)を使用して、グラフィックデザイナとしてLarge Language Model(LLM)をカスタマイズする。
我々はTextLapの有効性を実証し、画像生成やグラフィカルデザインベンチマークのためのGPT-4ベースの手法を含む強力なベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2024-10-09T19:51:38Z) - Automatic Layout Planning for Visually-Rich Documents with Instruction-Following Models [81.6240188672294]
グラフィックデザインでは、プロでないユーザは、限られたスキルとリソースのために視覚的に魅力的なレイアウトを作成するのに苦労することが多い。
レイアウト計画のための新しいマルチモーダル・インストラクション・フォロー・フレームワークを導入し、視覚的要素をカスタマイズしたレイアウトに簡単に配置できるようにする。
本手法は,非専門職の設計プロセスを単純化するだけでなく,数ショット GPT-4V モデルの性能を上回り,mIoU は Crello で 12% 向上する。
論文 参考訳(メタデータ) (2024-04-23T17:58:33Z) - VQ-Font: Few-Shot Font Generation with Structure-Aware Enhancement and
Quantization [52.870638830417]
本稿では,VQGANベースのフレームワーク(VQ-Font)を提案する。
具体的には、コードブック内でフォントトークンをカプセル化するために、VQGANを事前訓練する。その後、VQ-Fontは、合成したグリフをコードブックで洗練し、合成されたストロークと実世界のストロークのドメインギャップをなくす。
論文 参考訳(メタデータ) (2023-08-27T06:32:20Z) - VecFontSDF: Learning to Reconstruct and Synthesize High-quality Vector
Fonts via Signed Distance Functions [15.47282857047361]
本稿では,高品質なベクトルフォントの再構成と合成を行うために,エンドツーエンドのトレーニング可能なVecFontSDFを提案する。
提案したSDFに基づく暗黙的形状表現に基づいて、VecFontSDFは、各グリフを複数のパラボラ曲線で囲まれた形状プリミティブとしてモデル化することを学ぶ。
論文 参考訳(メタデータ) (2023-03-22T16:14:39Z) - Diff-Font: Diffusion Model for Robust One-Shot Font Generation [110.45944936952309]
Diff-Fontという拡散モデルに基づく新しいワンショットフォント生成手法を提案する。
提案するモデルは,フォントライブラリ全体を生成することを目的として,参照として1つのサンプルのみを与える。
十分に訓練されたDiff-Fontは、フォントギャップやフォントのバリエーションに対して堅牢であるだけでなく、難しい文字生成において有望なパフォーマンスを実現している。
論文 参考訳(メタデータ) (2022-12-12T13:51:50Z) - Font Representation Learning via Paired-glyph Matching [15.358456947574913]
本稿では,フォントスタイルを潜在空間に埋め込む新しいフォント表現学習手法を提案する。
フォントを他者から識別的に表現するために,マッチングに基づくフォント表現学習モデルを提案する。
フォント表現学習方式は,既存のフォント表現学習手法よりも優れた一般化性能が得られることを示す。
論文 参考訳(メタデータ) (2022-11-20T12:27:27Z) - FontNet: Closing the gap to font designer performance in font synthesis [3.991334489146843]
本稿では,フォント間の距離がフォント類似度と直接対応するような埋め込み空間において,フォントスタイルの分離を学習するFontNetというモデルを提案する。
我々は,任意の言語システムに適用可能なネットワークアーキテクチャと訓練手順を設計し,高解像度フォント画像を生成する。
論文 参考訳(メタデータ) (2022-05-13T08:37:10Z) - Scalable Font Reconstruction with Dual Latent Manifolds [55.29525824849242]
タイポグラフィー解析とフォント再構成を行う深層生成モデルを提案する。
このアプローチによって、効果的にモデル化できるキャラクタの種類を大規模にスケールアップすることが可能になります。
多くの言語の文字タイプを表す様々なデータセット上でフォント再構成のタスクを評価する。
論文 参考訳(メタデータ) (2021-09-10T20:37:43Z) - Few-shot Compositional Font Generation with Dual Memory [16.967987801167514]
我々は、新しいフォント生成フレームワークDual Memory-augmented Font Generation Network (DM-Font)を提案する。
我々は、構成性を活用するために、メモリコンポーネントとグローバルコンテキスト認識をジェネレータに採用する。
韓国手書きフォントとタイ手書きフォントの実験では,本手法が忠実なスタイリングによるサンプルの品質を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2020-05-21T08:13:40Z) - Neural Style Difference Transfer and Its Application to Font Generation [14.567067583556717]
フォントを自動生成する手法を導入する。
2つの異なるフォント間のフォントスタイルの違いを見つけ出し、ニューラルスタイル転送を用いて別のフォントに転送する。
論文 参考訳(メタデータ) (2020-01-21T03:32:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。