論文の概要: SplatFont3D: Structure-Aware Text-to-3D Artistic Font Generation with Part-Level Style Control
- arxiv url: http://arxiv.org/abs/2512.00413v1
- Date: Sat, 29 Nov 2025 09:46:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.229311
- Title: SplatFont3D: Structure-Aware Text-to-3D Artistic Font Generation with Part-Level Style Control
- Title(参考訳): SplatFont3D:部分レベルスタイル制御による構造対応テキスト・ツー・3Dアートフォント生成
- Authors: Ji Gan, Lingxu Chen, Jiaxu Leng, Xinbo Gao,
- Abstract要約: アーティスティックフォント生成(AFG)は、人間のデザイナーが革新的な芸術的フォントを作成するのを助ける。
SplatFont3Dは3次元ガウススプラッティングを用いた構造対応のテキスト・ツー・3DAFGフレームワークである。
SplatFont3Dは、スタイルテキストの一貫性、視覚的品質、レンダリング効率において、既存の3D-AFGモデルよりも優れています。
- 参考スコア(独自算出の注目度): 54.710973953274724
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Artistic font generation (AFG) can assist human designers in creating innovative artistic fonts. However, most previous studies primarily focus on 2D artistic fonts in flat design, leaving personalized 3D-AFG largely underexplored. 3D-AFG not only enables applications in immersive 3D environments such as video games and animations, but also may enhance 2D-AFG by rendering 2D fonts of novel views. Moreover, unlike general 3D objects, 3D fonts exhibit precise semantics with strong structural constraints and also demand fine-grained part-level style control. To address these challenges, we propose SplatFont3D, a novel structure-aware text-to-3D AFG framework with 3D Gaussian splatting, which enables the creation of 3D artistic fonts from diverse style text prompts with precise part-level style control. Specifically, we first introduce a Glyph2Cloud module, which progressively enhances both the shapes and styles of 2D glyphs (or components) and produces their corresponding 3D point clouds for Gaussian initialization. The initialized 3D Gaussians are further optimized through interaction with a pretrained 2D diffusion model using score distillation sampling. To enable part-level control, we present a dynamic component assignment strategy that exploits the geometric priors of 3D Gaussians to partition components, while alleviating drift-induced entanglement during 3D Gaussian optimization. Our SplatFont3D provides more explicit and effective part-level style control than NeRF, attaining faster rendering efficiency. Experiments show that our SplatFont3D outperforms existing 3D models for 3D-AFG in style-text consistency, visual quality, and rendering efficiency.
- Abstract(参考訳): アーティスティックフォント生成(AFG)は、人間のデザイナーが革新的な芸術的フォントを作成するのを助ける。
しかし、これまでの研究は主にフラットデザインの2Dアートフォントに焦点を当てており、パーソナライズされた3D-AFGはほとんど探索されていない。
3D-AFGは、ビデオゲームやアニメーションのような没入型3D環境に応用できるだけでなく、新しいビューの2Dフォントをレンダリングすることで2D-AFGを強化することができる。
さらに、一般的な3Dオブジェクトとは異なり、3Dフォントは強い構造制約を持つ正確なセマンティックスを示し、きめ細かい部分レベルのスタイル制御を要求する。
これらの課題に対処するため,SplatFont3Dを提案する。SplatFont3Dは3Dガウススプラッティングを備えた新しい構造対応のテキスト・ツー・3D AFGフレームワークである。
具体的には、まずGlyph2Cloudモジュールを導入し、2Dグリフ(またはコンポーネント)の形状とスタイルを段階的に拡張し、ガウスの初期化のために対応する3D点雲を生成する。
初期化された3次元ガウシアンは、あらかじめ訓練された2次元拡散モデルと相互作用して、スコア蒸留サンプリングによりさらに最適化される。
部分レベル制御を実現するために,3次元ガウス最適化時のドリフト誘起絡みを緩和しつつ,3次元ガウスの幾何的先行を利用して成分を分割する動的成分割り当て戦略を提案する。
我々のSplatFont3DはNeRFよりも明示的で効果的な部分レベルのスタイル制御を提供し、より高速なレンダリングを実現する。
SplatFont3Dは、スタイルテキストの一貫性、視覚的品質、レンダリング効率において、既存の3D-AFGモデルよりも優れています。
関連論文リスト
- Art3D: Training-Free 3D Generation from Flat-Colored Illustration [22.358983277403233]
Art3Dは、フラットカラーの2Dデザインを3Dに持ち上げる訓練不要の方法だ。
3次元感のないフラットカラー画像に対して,既存の画像から3次元モデルへの一般化性能をベンチマークした。
論文 参考訳(メタデータ) (2025-04-14T17:53:10Z) - Meta 3D Gen [57.313835190702484]
3DGenは、3Dアセットを作成でき、高速な忠実さと高品質な3D形状とテクスチャを1分以内で提供する。
3DGenは、現実世界のアプリケーションで3Dアセットのリライトに必要な物理ベースのレンダリング(PBR)をサポートする。
論文 参考訳(メタデータ) (2024-07-02T18:37:52Z) - Control3D: Towards Controllable Text-to-3D Generation [107.81136630589263]
本稿では,手書きスケッチ,すなわちコントロール3Dについてテキストから3D生成条件を提案する。
2次元条件付き拡散モデル(ControlNet)を再構成し、NeRFとしてパラメータ化された3次元シーンの学習を誘導する。
合成3Dシーン上での描画画像のスケッチを直接推定するために,事前学習可能なフォト・ツー・スケッチ・モデルを利用する。
論文 参考訳(メタデータ) (2023-11-09T15:50:32Z) - HyperStyle3D: Text-Guided 3D Portrait Stylization via Hypernetworks [101.36230756743106]
本論文は,2次元画像の中間表現として,2次元領域と3次元領域を3次元フィールドで橋渡しする3次元GANの成功に着想を得たものである。
本稿では,3次元ポートレートスタイリングのための3次元認識型GANをベースとしたHyperStyle3Dという新しい手法を提案する。
論文 参考訳(メタデータ) (2023-04-19T07:22:05Z) - 3DAvatarGAN: Bridging Domains for Personalized Editable Avatars [75.31960120109106]
3D-GANは、一貫した構造を持つ大規模データセットのトレーニングにより、幾何学とテクスチャを合成する。
本稿では,ソースドメインが事前訓練された3D-GANであり,ターゲットドメインが2D-GANである適応フレームワークを提案する。
本稿では,芸術領域の誇張された幾何学をモデル化するための変形に基づく手法について述べる。
論文 参考訳(メタデータ) (2023-01-06T19:58:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。