論文の概要: Handwritten image augmentation
- arxiv url: http://arxiv.org/abs/2308.13791v1
- Date: Sat, 26 Aug 2023 07:33:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-29 18:55:59.404847
- Title: Handwritten image augmentation
- Title(参考訳): 手書き画像強調
- Authors: Mahendran N
- Abstract要約: 手書き文字画像のための新しいデータ拡張である手書き文字強調を導入する。
手書き拡張はデータ駆動で実装が容易であり、CNNベースの光学文字認識モデルと統合することができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In this paper, we introduce Handwritten augmentation, a new data augmentation
for handwritten character images. This method focuses on augmenting handwritten
image data by altering the shape of input characters in training. The proposed
handwritten augmentation is similar to position augmentation, color
augmentation for images but a deeper focus on handwritten characters.
Handwritten augmentation is data-driven, easy to implement, and can be
integrated with CNN-based optical character recognition models. Handwritten
augmentation can be implemented along with commonly used data augmentation
techniques such as cropping, rotating, and yields better performance of models
for handwritten image datasets developed using optical character recognition
methods.
- Abstract(参考訳): 本稿では,手書き文字画像の新しいデータ拡張である手書き文字強調について紹介する。
本手法は,入力文字の形状を変えて手書き画像データを増やすことに焦点を当てる。
手書きの補字は、画像の位置増補、色増補と似ているが、手書き文字に焦点を絞っている。
手書き拡張はデータ駆動で実装が容易であり、CNNベースの光学文字認識モデルと統合することができる。
手書き拡張は、トリッピング、回転などの一般的なデータ拡張技術と共に実装することができ、光学的文字認識法を用いて開発された手書き画像データセットのモデルの性能向上をもたらす。
関連論文リスト
- Improving face generation quality and prompt following with synthetic captions [57.47448046728439]
画像から正確な外観記述を生成するために,トレーニング不要のパイプラインを導入する。
次に、これらの合成キャプションを使用して、テキストから画像への拡散モデルを微調整する。
提案手法は,高品質で現実的な人間の顔を生成するモデルの能力を大幅に向上させることを示す。
論文 参考訳(メタデータ) (2024-05-17T15:50:53Z) - Representing Online Handwriting for Recognition in Large Vision-Language
Models [8.344510330567495]
本稿では,テキストとして,画像として,時間順のストローク列を含む新しいデジタルインク(オンライン手書き)のトークン化表現を提案する。
この表現は、最先端のオンライン筆跡認識器に匹敵する結果が得られることを示す。
論文 参考訳(メタデータ) (2024-02-23T13:11:10Z) - Zero-shot spatial layout conditioning for text-to-image diffusion models [52.24744018240424]
大規模テキスト・画像拡散モデルでは、生成画像モデリングにおける技術の現状が大幅に改善されている。
画像キャンバスのセグメントに関連付けられたテキストからの画像生成を考察し、直感的な自然言語インタフェースと生成されたコンテンツの正確な空間制御を組み合わせた。
ZestGuideは,事前学習したテキスト・画像拡散モデルにプラグイン可能なゼロショットセグメンテーション誘導手法である。
論文 参考訳(メタデータ) (2023-06-23T19:24:48Z) - WordStylist: Styled Verbatim Handwritten Text Generation with Latent
Diffusion Models [8.334487584550185]
単語レベルに基づくテキスト・テキスト・コンテンツ・イメージ生成のための遅延拡散に基づく手法を提案する。
提案手法は,異なる書き手スタイルからリアルな単語画像のサンプルを生成することができる。
提案モデルでは,美的満足度の高いサンプルを作成し,テキスト認識性能の向上に寄与し,類似の文字検索スコアを実データとして得られることを示す。
論文 参考訳(メタデータ) (2023-03-29T10:19:26Z) - Character-Aware Models Improve Visual Text Rendering [57.19915686282047]
現在の画像生成モデルは、十分に整形されたビジュアルテキストを生成するのに苦労している。
文字認識モデルは、新しい綴りタスクに大きな利益をもたらす。
われわれのモデルでは、ビジュアルスペルの精度は比較的高く、稀な単語の競合よりも30以上の精度が向上した。
論文 参考訳(メタデータ) (2022-12-20T18:59:23Z) - Augraphy: A Data Augmentation Library for Document Images [59.457999432618614]
Augraphyはデータ拡張パイプラインを構築するためのPythonライブラリである。
標準的なオフィス操作によって変更されたように見えるクリーンなドキュメントイメージの拡張版を作成するための戦略を提供する。
論文 参考訳(メタデータ) (2022-08-30T22:36:19Z) - Boosting Modern and Historical Handwritten Text Recognition with
Deformable Convolutions [52.250269529057014]
自由進化ページにおける手書き文字認識(HTR)は難しい画像理解課題である。
本稿では,手入力に応じて変形し,テキストの幾何学的変化に適応できる変形可能な畳み込みを導入することを提案する。
論文 参考訳(メタデータ) (2022-08-17T06:55:54Z) - Content and Style Aware Generation of Text-line Images for Handwriting
Recognition [4.301658883577544]
視覚的外観とテキストコンテンツの両方を条件とした手書きテキストライン画像の生成法を提案する。
本手法では,多彩な手書きスタイルの長いテキストラインサンプルを作成できる。
論文 参考訳(メタデータ) (2022-04-12T05:52:03Z) - SmartPatch: Improving Handwritten Word Imitation with Patch
Discriminators [67.54204685189255]
本稿では,現在の最先端手法の性能を向上させる新手法であるSmartPatchを提案する。
我々は、よく知られたパッチ損失と、平行訓練された手書きテキスト認識システムから収集された情報を組み合わせる。
これにより、より強化された局所識別器が実現し、より現実的で高品質な手書き文字が生成される。
論文 参考訳(メタデータ) (2021-05-21T18:34:21Z) - Learn to Augment: Joint Data Augmentation and Network Optimization for
Text Recognition [44.773194285059645]
堅牢な認識モデルのトレーニングには、可能な限り多様性をカバーするために大量のデータが必要である。
本稿では,テキスト画像拡張のための新しい手法を提案する。
カスタム・フィデューシャル・ポイントのセットを使用することで、提案手法は柔軟で制御可能である。
論文 参考訳(メタデータ) (2020-03-14T11:18:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。