論文の概要: DNA: Dual-branch Network with Adaptation for Open-Set Online Handwriting Generation
- arxiv url: http://arxiv.org/abs/2511.22064v1
- Date: Thu, 27 Nov 2025 03:30:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-01 19:47:55.375506
- Title: DNA: Dual-branch Network with Adaptation for Open-Set Online Handwriting Generation
- Title(参考訳): DNA: オープンセットオンライン手書き生成に適応したデュアルブランチネットワーク
- Authors: Tsai-Ling Huang, Nhat-Tuong Do-Tran, Ngoc-Hoang-Lam Le, Hong-Han Shuai, Ching-Chun Huang,
- Abstract要約: 本稿では,オンライン手書き文字生成手法について紹介する。本手法では,テスト中に生成した文字と書き手のスタイルが学習中に見つからない。
本稿では,適応型スタイルブランチと適応型コンテンツブランチからなるDual-Branch Network with Adaptation (DNA)を提案する。
我々のDNAモデルは、見えないOHG設定に適しており、最先端のパフォーマンスを実現しています。
- 参考スコア(独自算出の注目度): 28.985690380954765
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Online handwriting generation (OHG) enhances handwriting recognition models by synthesizing diverse, human-like samples. However, existing OHG methods struggle to generate unseen characters, particularly in glyph-based languages like Chinese, limiting their real-world applicability. In this paper, we introduce our method for OHG, where the writer's style and the characters generated during testing are unseen during training. To tackle this challenge, we propose a Dual-branch Network with Adaptation (DNA), which comprises an adaptive style branch and an adaptive content branch. The style branch learns stroke attributes such as writing direction, spacing, placement, and flow to generate realistic handwriting. Meanwhile, the content branch is designed to generalize effectively to unseen characters by decomposing character content into structural information and texture details, extracted via local and global encoders, respectively. Extensive experiments demonstrate that our DNA model is well-suited for the unseen OHG setting, achieving state-of-the-art performance.
- Abstract(参考訳): オンライン手書き生成(OHG)は、多種多様な人間に似たサンプルを合成することにより、手書き認識モデルを強化する。
しかし、既存のOHGメソッドは、特に中国語のようなグリフベースの言語では、実世界の適用性を制限して、目に見えない文字を生成するのに苦労している。
本稿では,著者のスタイルとテスト中に生成する文字が学習中に見つからないOHGの手法を紹介する。
この課題に対処するため、適応型スタイルブランチと適応型コンテンツブランチからなるDual-branch Network with Adaptation (DNA)を提案する。
スタイルブランチは、書き込み方向、間隔、配置、フローなどのストローク属性を学び、現実的な手書きを生成する。
一方、コンテンツブランチは、各ローカルエンコーダおよびグローバルエンコーダを介して抽出された、文字内容を構造情報とテクスチャ詳細に分解することで、見えない文字に効果的に一般化するように設計されている。
大規模な実験により、我々のDNAモデルは見えないOHG設定に適しており、最先端のパフォーマンスを実現していることが示された。
関連論文リスト
- DiffInk: Glyph- and Style-Aware Latent Diffusion Transformer for Text to Online Handwriting Generation [41.08176249345279]
DiffInkは、完全な手書き文字を生成するための最初の遅延拡散トランスフォーマーフレームワークである。
InkVAEは2つの相補的な潜在空間正規化損失で拡張された新しい逐次変分オートエンコーダである。
次に、ターゲットテキストと参照スタイルを統合し、コヒーレントペントラジェクトリを生成する新しい遅延拡散変換器InkDiTを紹介する。
論文 参考訳(メタデータ) (2025-09-28T03:58:15Z) - Dual Orthogonal Guidance for Robust Diffusion-based Handwritten Text Generation [55.35931633405974]
拡散に基づく手書きテキスト生成(HTG)アプローチは、トレーニング時間と通常のスタイルで観察される単語内単語の頻度が高く、印象的な結果が得られる。
トレーニングサンプルを記憶する傾向があり、しばしばスタイルの多様性と生成の明確さに苦しむ。
そこで本研究では,元のプロンプトに対して負に摂動したプロンプトを利用する新しいサンプリング誘導戦略であるDual Orthogonal Guidance(DOG)を提案する。
最新技術であるDiffusionPenとOne-DMの実験結果から、DOGは、語彙外単語や難解な書き方であっても、内容の明快さと可変性を両立させることを示した。
論文 参考訳(メタデータ) (2025-08-23T13:09:19Z) - Online Writer Retrieval with Chinese Handwritten Phrases: A Synergistic Temporal-Frequency Representation Learning Approach [53.189911918976655]
DOLPHINは,相乗的時間周波数解析による手書き表現の向上を目的とした新しい検索モデルである。
OLIWER(OLIWER)は,1,731人から670,000以上の中国語の字句を含む大規模オンライン作家検索データセットである。
本研究は,手書き表現の質向上における点サンプリング周波数と圧力特性の重要性を強調した。
論文 参考訳(メタデータ) (2024-12-16T11:19:22Z) - Decoupling Layout from Glyph in Online Chinese Handwriting Generation [6.566541829858544]
テキスト行レイアウト生成器とスタイル化フォント合成器を開発した。
レイアウトジェネレータは、テキスト内容と提供されたスタイル参照に基づいて、コンテキスト内学習を行い、各グリフに対する位置を自己回帰的に生成する。
文字埋め込み辞書、マルチスケールの書体スタイルエンコーダ、及び1DのU-Netベースの拡散デノイザからなるフォントシンセサイザは、所定のスタイル参照から抽出された書体スタイルを模倣しつつ、その位置に各フォントを生成する。
論文 参考訳(メタデータ) (2024-10-03T08:46:17Z) - DiffusionPen: Towards Controlling the Style of Handwritten Text Generation [7.398476020996681]
DiffusionPen (DiffPen) は遅延拡散モデルに基づく5ショットスタイルの手書きテキスト生成手法である。
提案手法は,文字と文体の特徴の両面を抽出し,現実的な手書きサンプルを生成する。
提案手法は,既存の手法を質的かつ定量的に上回り,その付加データにより手書き文字認識(HTR)システムの性能を向上させることができる。
論文 参考訳(メタデータ) (2024-09-09T20:58:25Z) - Boosting Modern and Historical Handwritten Text Recognition with
Deformable Convolutions [52.250269529057014]
自由進化ページにおける手書き文字認識(HTR)は難しい画像理解課題である。
本稿では,手入力に応じて変形し,テキストの幾何学的変化に適応できる変形可能な畳み込みを導入することを提案する。
論文 参考訳(メタデータ) (2022-08-17T06:55:54Z) - Letter-level Online Writer Identification [86.13203975836556]
我々は文字レベルのオンラインライタIDという新たな問題に焦点をあてる。
主な課題は、しばしば異なるスタイルで手紙を書くことである。
我々はこの問題をオンライン書記スタイルのばらつき(Var-O-Styles)と呼ぶ。
論文 参考訳(メタデータ) (2021-12-06T07:21:53Z) - Handwriting Transformers [98.3964093654716]
本稿では,スタイルコンテンツの絡み合いとグローバルおよびローカルライティングスタイルパターンの両方を学ぶことを目的とした,トランスフォーマティブベースの手書きテキスト画像生成手法であるhwtを提案する。
提案したHWTは, 自己認識機構を用いて, スタイルの例における長短距離関係をキャプチャする。
提案するHWTは,現実的な手書きテキスト画像を生成する。
論文 参考訳(メタデータ) (2021-04-08T17:59:43Z) - POINTER: Constrained Progressive Text Generation via Insertion-based
Generative Pre-training [93.79766670391618]
ハードコントラストテキスト生成のための新しい挿入ベースアプローチであるPOINTERを提案する。
提案手法は,既存のトークン間で段階的に新しいトークンを並列に挿入することによって動作する。
結果として生じる粗大な階層構造は、生成プロセスを直感的で解釈可能である。
論文 参考訳(メタデータ) (2020-05-01T18:11:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。