論文の概要: Object Detection Based Handwriting Localization
- arxiv url: http://arxiv.org/abs/2106.14989v1
- Date: Mon, 28 Jun 2021 21:25:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-30 15:29:05.949646
- Title: Object Detection Based Handwriting Localization
- Title(参考訳): 物体検出に基づく手書き位置推定
- Authors: Yuli Wu, Yucheng Hu, Suting Miao
- Abstract要約: 文書から手書き領域をローカライズするオブジェクト検出手法を提案する。
提案手法は手書き文字認識や署名検証などの他の作業を容易にすることも期待されている。
- 参考スコア(独自算出の注目度): 2.6641834518599308
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We present an object detection based approach to localize handwritten regions
from documents, which initially aims to enhance the anonymization during the
data transmission. The concatenated fusion of original and preprocessed images
containing both printed texts and handwritten notes or signatures are fed into
the convolutional neural network, where the bounding boxes are learned to
detect the handwriting. Afterwards, the handwritten regions can be processed
(e.g. replaced with redacted signatures) to conceal the personally identifiable
information (PII). This processing pipeline based on the deep learning network
Cascade R-CNN works at 10 fps on a GPU during the inference, which ensures the
enhanced anonymization with minimal computational overheads. Furthermore, the
impressive generalizability has been empirically showcased: the trained model
based on the English-dominant dataset works well on the fictitious unseen
invoices, even in Chinese. The proposed approach is also expected to facilitate
other tasks such as handwriting recognition and signature verification.
- Abstract(参考訳): 本稿では,文書から手書き領域をローカライズするためのオブジェクト検出手法を提案する。
結合ボックスを学習して手書きを検出する畳み込みニューラルネットワークに、印刷テキストと手書きメモまたは署名の両方を含む原画像と前処理画像の連結融合を送出する。
その後、手書き領域を処理できる(例えば、)。
個人識別可能な情報(PII)を隠すために、置換された署名(reacted signatures)。
この深層学習ネットワークCascade R-CNNに基づく処理パイプラインは、推論中にGPU上で10fpsで動作する。
さらに、印象的な一般化性は実証的に証明されている。英語支配のデータセットに基づくトレーニングされたモデルは、中国語でも、架空の目に見えない請求書でうまく機能する。
提案手法は,手書き認識やシグネチャ検証などのタスクも行うことが期待されている。
関連論文リスト
- Contextual Document Embeddings [77.22328616983417]
本稿では,コンテキスト化された文書埋め込みのための2つの補完手法を提案する。
第一に、文書近傍を明示的にバッチ内コンテキスト損失に組み込む別のコントラスト学習目標である。
第二に、隣接する文書情報をエンコードされた表現に明示的にエンコードする新しいコンテキストアーキテクチャ。
論文 参考訳(メタデータ) (2024-10-03T14:33:34Z) - Hypergraph based Understanding for Document Semantic Entity Recognition [65.84258776834524]
我々は,ハイパグラフアテンションを利用したハイパグラフアテンション文書セマンティックエンティティ認識フレームワークHGAを構築し,エンティティ境界とエンティティカテゴリを同時に重視する。
FUNSD, CORD, XFUNDIE で得られた結果は,本手法が意味的エンティティ認識タスクの性能を効果的に向上できることを示す。
論文 参考訳(メタデータ) (2024-07-09T14:35:49Z) - Attention based End to end network for Offline Writer Identification on Word level data [3.5829161769306244]
注意駆動型畳み込みニューラルネットワーク(CNN)に基づく著者識別システムを提案する。
このシステムは、単語画像から抽出された断片として知られる画像セグメントを利用して、ピラミッドベースの戦略を用いて訓練されている。
提案アルゴリズムの有効性を3つのベンチマークデータベースで評価した。
論文 参考訳(メタデータ) (2024-04-11T09:41:14Z) - Efficiently Leveraging Linguistic Priors for Scene Text Spotting [63.22351047545888]
本稿では,大規模テキストコーパスから言語知識を活用する手法を提案する。
シーンテキストデータセットとよく一致したテキスト分布を生成し、ドメイン内の微調整の必要性を取り除く。
実験結果から,本手法は認識精度を向上するだけでなく,単語のより正確な局所化を可能にすることが示された。
論文 参考訳(メタデータ) (2024-02-27T01:57:09Z) - Self-Supervised Representation Learning for Online Handwriting Text
Classification [0.8594140167290099]
本稿では,日本語と中国語の個人によるオンライン筆跡から情報表現を抽出するための事前学習の前提として,新しいストロークマスキング(POSM)を提案する。
抽出した表現の質を評価するために,本質的評価法と外生的評価法の両方を用いる。
事前訓練されたモデルは、作家の識別、性別分類、手書きの分類といったタスクにおいて、最先端の結果を達成するために微調整される。
論文 参考訳(メタデータ) (2023-10-10T14:07:49Z) - Uncovering the Handwritten Text in the Margins: End-to-end Handwritten
Text Detection and Recognition [0.840835093659811]
本研究は,手書きペラリアの自動検出と認識のためのエンドツーエンドフレームワークを提案する。
データ拡張と転送学習を使用して、トレーニングデータの不足を克服する。
このフレームワークの有効性はスウェーデンのウプサラ大学図書館で発見された初期の書籍コレクションのデータから実証的に評価されている。
論文 参考訳(メタデータ) (2023-03-10T14:00:53Z) - Siamese based Neural Network for Offline Writer Identification on word
level data [7.747239584541488]
入力語画像に基づいて文書の著者を特定する新しい手法を提案する。
本手法はテキスト独立であり,入力画像のサイズに制約を課さない。
論文 参考訳(メタデータ) (2022-11-17T10:01:46Z) - Boosting Modern and Historical Handwritten Text Recognition with
Deformable Convolutions [52.250269529057014]
自由進化ページにおける手書き文字認識(HTR)は難しい画像理解課題である。
本稿では,手入力に応じて変形し,テキストの幾何学的変化に適応できる変形可能な畳み込みを導入することを提案する。
論文 参考訳(メタデータ) (2022-08-17T06:55:54Z) - Lexically Aware Semi-Supervised Learning for OCR Post-Correction [90.54336622024299]
世界中の多くの言語における既存の言語データの多くは、非デジタル化された書籍や文書に閉じ込められている。
従来の研究は、あまり良くない言語を認識するためのニューラル・ポスト・コレクション法の有用性を実証してきた。
そこで本研究では,生画像を利用した半教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2021-11-04T04:39:02Z) - SmartPatch: Improving Handwritten Word Imitation with Patch
Discriminators [67.54204685189255]
本稿では,現在の最先端手法の性能を向上させる新手法であるSmartPatchを提案する。
我々は、よく知られたパッチ損失と、平行訓練された手書きテキスト認識システムから収集された情報を組み合わせる。
これにより、より強化された局所識別器が実現し、より現実的で高品質な手書き文字が生成される。
論文 参考訳(メタデータ) (2021-05-21T18:34:21Z) - Attention based Writer Independent Handwriting Verification [0.0]
我々は,2次元入力の特徴空間における有意点を捉えるために,クロスアテンション機構とソフトアテンション機構を実装し,統合する。
ネットワークの複数のレベルからアテンションマップを抽出することにより、提案した決定に対して意味のある説明を生成する。
論文 参考訳(メタデータ) (2020-09-07T16:28:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。