論文の概要: CASHG: Context-Aware Stylized Online Handwriting Generation
- arxiv url: http://arxiv.org/abs/2604.02103v2
- Date: Mon, 06 Apr 2026 05:46:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:18.466433
- Title: CASHG: Context-Aware Stylized Online Handwriting Generation
- Title(参考訳): CASHG: コンテキスト対応のオンライン手書き文字生成
- Authors: Jinsu Shin, Sungeun Hong, JinYeong Bak,
- Abstract要約: 本稿では,コンテキスト認識型オンライン手書き文字生成器CASHGを提案する。
CASHGは、スタイル一貫性のある文レベルの軌道合成のための文字間接続を明示的にモデル化する。
本稿では,CSM(Connectivity and Spacing Metrics)について紹介する。
- 参考スコア(独自算出の注目度): 12.580543720353043
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Online handwriting represents strokes as time-ordered trajectories, which makes handwritten content easier to transform and reuse in a wide range of applications. However, generating natural sentence-level online handwriting that faithfully reflects a writer's style remains challenging, since sentence synthesis demands context-dependent characters with stroke continuity and spacing. Prior methods treat these boundary properties as implicit outcomes of sequence modeling, which becomes unreliable at the sentence scale and under limited compositional diversity. We propose CASHG, a context-aware stylized online handwriting generator that explicitly models inter-character connectivity for style-consistent sentence-level trajectory synthesis. CASHG uses a Character Context Encoder to obtain character identity and sentence-dependent context memory and fuses them in a bigram-aware sliding-window Transformer decoder that emphasizes local predecessor--current transitions, complemented by gated context fusion for sentence-level context.Training proceeds through a three-stage curriculum from isolated glyphs to full sentences, improving robustness under sparse transition coverage. We further introduce Connectivity and Spacing Metrics (CSM), a boundary-aware evaluation suite that quantifies cursive connectivity and spacing similarity. Under benchmark-matched evaluation protocols, CASHG consistently improves CSM over comparison methods while remaining competitive in DTW-based trajectory similarity, with gains corroborated by a human evaluation.
- Abstract(参考訳): オンライン手書きは、ストロークを時間順のトラジェクトリとして表現するので、手書きのコンテンツは、広範囲のアプリケーションで簡単に変換および再利用できる。
しかし,文章合成では,ストローク連続性とスペーシングが要求されるため,文章のスタイルを忠実に反映した自然な文レベルのオンライン手書き生成は依然として困難である。
従来の手法では、これらの境界特性をシーケンスモデリングの暗黙的な結果として扱うが、これは文スケールでは信頼できなくなり、構成の多様性が制限される。
そこで我々は,文レベルの文合成のための文字間接続を明示的にモデル化した,文脈認識型オンライン手書き生成器CASHGを提案する。
CASHGはキャラクタコンテキストエンコーダを用いて文字識別と文依存コンテキストメモリを取得し、それらを大文字対応のスライドウインドウ変換器(英語版)に融合させる。
さらに,コネクティビティ・アンド・スペーシング・メトリックス(CSM)という,カーシブ・コネクティビティとスペーシングの類似性を定量化する境界対応評価スイートについても紹介する。
ベンチマークマッチングされた評価プロトコルの下では、CASHGは、DTWに基づく軌道類似性において競争力を維持しながら、比較方法よりもCSMを一貫して改善する。
関連論文リスト
- HTR-ConvText: Leveraging Convolution and Textual Information for Handwritten Text Recognition [4.5311655360445515]
既存のアプローチはこれらの問題に部分的に対処するが、大規模な合成データなしでは一般化に苦慮することが多い。
我々は,グローバルなコンテキスト依存を保ちながら,細粒度でストロークレベルの局所的特徴を捉えるモデルであるHTR-ConvTextを提案する。
次に,グローバルコンテキストと階層構造内の局所的特徴を組み合わせたハイブリッドアーキテクチャであるConvTextエンコーダを紹介する。
論文 参考訳(メタデータ) (2025-12-04T17:35:05Z) - DiffInk: Glyph- and Style-Aware Latent Diffusion Transformer for Text to Online Handwriting Generation [41.08176249345279]
DiffInkは、完全な手書き文字を生成するための最初の遅延拡散トランスフォーマーフレームワークである。
InkVAEは2つの相補的な潜在空間正規化損失で拡張された新しい逐次変分オートエンコーダである。
次に、ターゲットテキストと参照スタイルを統合し、コヒーレントペントラジェクトリを生成する新しい遅延拡散変換器InkDiTを紹介する。
論文 参考訳(メタデータ) (2025-09-28T03:58:15Z) - A Transformer Based Handwriting Recognition System Jointly Using Online and Offline Features [8.419663258260671]
オフライン画像とオンラインストロークデータの早期融合を行うエンド・ツー・エンド・ネットワークを提案する。
我々の手法は最先端の精度を達成し、過去のベストを最大1%上回っている。
論文 参考訳(メタデータ) (2025-06-25T08:58:47Z) - Implementing Long Text Style Transfer with LLMs through Dual-Layered Sentence and Paragraph Structure Extraction and Mapping [6.445040420833822]
文レベルのスタイリスティック適応と段落レベルの構造的コヒーレンスを組み合わせた階層的枠組みを提案する。
提案するフレームワークであるZeroStylusは,参照テキストからの階層的テンプレート取得とマルチグラニュラマッチングによるテンプレート誘導生成という,2つの体系的なフェーズで運用する。
論文 参考訳(メタデータ) (2025-05-11T05:53:33Z) - Scalable Learning of Latent Language Structure With Logical Offline
Cycle Consistency [71.42261918225773]
概念的には、LOCCOは、トレーニング対象のセマンティクスを使用してラベルなしテキストのアノテーションを生成する、自己学習の一形態と見なすことができる。
追加ボーナスとして、LOCCOによって生成されたアノテーションは、神経テキスト生成モデルをトレーニングするために自明に再利用することができる。
論文 参考訳(メタデータ) (2023-05-31T16:47:20Z) - Hierarchical Sketch Induction for Paraphrase Generation [79.87892048285819]
本稿では、高密度符号化の分解を学習するHRQ-VAE(Hierarchical Refinement Quantized Variational Autoencoders)を紹介する。
HRQ-VAEを用いて、入力文の構文形式を階層化の経路としてエンコードすることで、テスト時の構文スケッチをより容易に予測できる。
論文 参考訳(メタデータ) (2022-03-07T15:28:36Z) - GTAE: Graph-Transformer based Auto-Encoders for Linguistic-Constrained
Text Style Transfer [119.70961704127157]
近年,非並列テキストスタイルの転送が研究の関心を集めている。
現在のアプローチでは、元の文の内容やロジックを保存できない。
文を言語グラフとしてモデル化し,グラフレベルで特徴抽出とスタイル転送を行う,グラフトランスフォーマーベースのAuto-GTAEを提案する。
論文 参考訳(メタデータ) (2021-02-01T11:08:45Z) - Exploring Contextual Word-level Style Relevance for Unsupervised Style
Transfer [60.07283363509065]
教師なしのスタイル転送は、元のコンテンツを保持しながら入力文のスタイルを変更することを目的としている。
本稿では,各出力語がターゲットスタイルに関連性があることを活かした,新たな注目シーケンス・ツー・シーケンスモデルを提案する。
実験結果から,提案手法は転送精度とコンテンツ保存の両面から,最先端の性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2020-05-05T10:24:28Z) - POINTER: Constrained Progressive Text Generation via Insertion-based
Generative Pre-training [93.79766670391618]
ハードコントラストテキスト生成のための新しい挿入ベースアプローチであるPOINTERを提案する。
提案手法は,既存のトークン間で段階的に新しいトークンを並列に挿入することによって動作する。
結果として生じる粗大な階層構造は、生成プロセスを直感的で解釈可能である。
論文 参考訳(メタデータ) (2020-05-01T18:11:54Z) - Contextual Text Style Transfer [73.66285813595616]
コンテキストテキストスタイル転送は、文をその周囲のコンテキストを考慮した所望のスタイルに変換することを目的としている。
本稿では,各入力文とその周辺コンテキストに対して2つの異なるエンコーダを使用するコンテキスト認識スタイル転送(CAST)モデルを提案する。
Enron-ContextとReddit-Contextという2つの新しいベンチマークが、フォーマル性と攻撃性スタイルの転送のために導入された。
論文 参考訳(メタデータ) (2020-04-30T23:01:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。