論文の概要: Text Extraction and Restoration of Old Handwritten Documents
- arxiv url: http://arxiv.org/abs/2001.08742v1
- Date: Thu, 23 Jan 2020 05:42:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-07 13:14:13.720772
- Title: Text Extraction and Restoration of Old Handwritten Documents
- Title(参考訳): 古文書のテキスト抽出と復元
- Authors: Mayank Wadhwani, Debapriya Kundu, Deepayan Chakraborty, Bhabatosh
Chanda
- Abstract要約: 本稿では,ニューラルネットワークを用いた古くなった手書き文書の復元手法について述べる。
26の遺産画像の小規模データセットを導入する。
実験により,本システムによる手書き文書画像の高精度な劣化が確認できた。
- 参考スコア(独自算出の注目度): 3.514869837986596
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image restoration is very crucial computer vision task. This paper describes
two novel methods for the restoration of old degraded handwritten documents
using deep neural network. In addition to that, a small-scale dataset of 26
heritage letters images is introduced. The ground truth data to train the
desired network is generated semi automatically involving a pragmatic
combination of color transformation, Gaussian mixture model based segmentation
and shape correction by using mathematical morphological operators. In the
first approach, a deep neural network has been used for text extraction from
the document image and later background reconstruction has been done using
Gaussian mixture modeling. But Gaussian mixture modelling requires to set
parameters manually, to alleviate this we propose a second approach where the
background reconstruction and foreground extraction (which which includes
extracting text with its original colour) both has been done using deep neural
network. Experiments demonstrate that the proposed systems perform well on
handwritten document images with severe degradations, even when trained with
small dataset. Hence, the proposed methods are ideally suited for digital
heritage preservation repositories. It is worth mentioning that, these methods
can be extended easily for printed degraded documents.
- Abstract(参考訳): 画像復元は非常に重要なコンピュータビジョンタスクである。
本稿では,ニューラルネットワークを用いた古くなった手書き文書の復元手法について述べる。
また、26の遺産画像の小規模なデータセットも導入されている。
所望のネットワークをトレーニングする基底真理データは、数学的形態演算子を用いて色変換、ガウス混合モデルに基づくセグメント化と形状補正の実用的な組み合わせを半自動生成する。
最初のアプローチでは、文書画像からのテキスト抽出にディープニューラルネットワークが用いられ、後の背景復元はガウス混合モデルを用いて行われている。
しかし、ガウス混合モデリングではパラメータを手動で設定する必要があるため、背景再構成と前景抽出(原色でテキストを抽出することを含む)の両方が深層ニューラルネットワークを用いて行われる2つ目のアプローチを提案する。
実験により,小さなデータセットでトレーニングした場合でも,手書きの文書画像の精度が著しく低下することがわかった。
したがって,提案手法はデジタル遺産保存レポジトリに最適である。
なお、これらの手法は、印刷された劣化文書に対して容易に拡張できる。
関連論文リスト
- Not All Image Regions Matter: Masked Vector Quantization for
Autoregressive Image Generation [78.13793505707952]
既存の自己回帰モデルは、まず画像再構成のための潜伏空間のコードブックを学習し、学習したコードブックに基づいて自己回帰的に画像生成を完了する2段階生成パラダイムに従っている。
そこで本研究では,Masked Quantization VAE (MQ-VAE) Stackモデルを用いた2段階フレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-23T02:15:53Z) - PromptMix: Text-to-image diffusion models enhance the performance of
lightweight networks [83.08625720856445]
ディープラーニングタスクは、人間のオペレーターに時間がかかりすぎるアノテーションを必要とする。
本稿では,既存のデータセットのサイズを人工的に向上するPromptMixを紹介する。
PromptMixは軽量ネットワークの性能を最大26%向上させることができることを示す。
論文 参考訳(メタデータ) (2023-01-30T14:15:47Z) - Pattern Spotting and Image Retrieval in Historical Documents using Deep
Hashing [60.67014034968582]
本稿では,歴史文書のデジタルコレクションにおける画像検索とパターンスポッティングのためのディープラーニング手法を提案する。
ディープラーニングモデルは、実数値またはバイナリコード表現を提供する2つの異なるバリエーションを考慮して、特徴抽出に使用される。
また,提案手法により検索時間を最大200倍に短縮し,関連する作業と比較してストレージコストを最大6,000倍に削減する。
論文 参考訳(メタデータ) (2022-08-04T01:39:37Z) - Reconstructing vehicles from orthographic drawings using deep neural
networks [0.0]
本稿では,画素アラインな暗黙関数(PIFu)に基づくシステムを提案し,符号付き距離サンプルを生成するための高度なサンプリング手法を開発した。
トレーニングされたニューラルネットワークは、現実世界の入力をうまく一般化し、可塑性で詳細な再構築を生成する。
論文 参考訳(メタデータ) (2022-06-14T12:32:32Z) - NeuralReshaper: Single-image Human-body Retouching with Deep Neural
Networks [50.40798258968408]
本稿では,深部生成ネットワークを用いた単一画像における人体の意味的再構成手法であるNeuralReshaperを提案する。
われわれのアプローチは、まずパラメトリックな3次元人間モデルと元の人間の画像とを適合させるフィッティング・セイン・リフォーム・パイプラインに従う。
ペアデータが存在しないデータ不足に対処するために,ネットワークをトレーニングするための新たな自己教師型戦略を導入する。
論文 参考訳(メタデータ) (2022-03-20T09:02:13Z) - Is Deep Image Prior in Need of a Good Education? [57.3399060347311]
画像再構成に有効な先行画像として, 奥行き画像が導入された。
その印象的な再建性にもかかわらず、学習技術や伝統的な再建技術と比べてアプローチは遅い。
計算課題に対処する2段階の学習パラダイムを開発する。
論文 参考訳(メタデータ) (2021-11-23T15:08:26Z) - RectiNet-v2: A stacked network architecture for document image dewarping [16.249023269158734]
本稿では,入力として使用する歪文書から歪みのない文書画像を生成することができるエンドツーエンドCNNアーキテクチャを提案する。
我々は、このモデルを、十分な自然データ不足を補うために、合成的にシミュレートされた歪んだ文書画像に基づいて訓練する。
我々は,この領域のベンチマークであるDocUNetデータセットを用いて本手法の評価を行い,最先端の手法に匹敵する結果を得た。
論文 参考訳(メタデータ) (2021-02-01T19:26:17Z) - Using Graph Neural Networks to Reconstruct Ancient Documents [2.4366811507669124]
グラフニューラルネットワークをベースとした一対のパッチ情報を用いてラベルをエッジに割り当てる手法を提案する。
このネットワークは、ソースとターゲットパッチの関係を、アップ、ダウン、左、右、ノーンの1つに分類する。
このモデルでは,エッジレベルでの正確な分類だけでなく,パッチの集合から部分的あるいは完全な再構成グラフを生成することが可能である。
論文 参考訳(メタデータ) (2020-11-13T18:36:36Z) - Two-stage generative adversarial networks for document image
binarization with color noise and background removal [7.639067237772286]
本稿では,2段階のカラー文書画像強調・バイナライゼーション手法を提案する。
第1段階では、4つの色非依存の敵ネットワークを訓練し、入力画像から色前景情報を抽出する。
第2段階では、大域的・局所的な特徴を持つ2つの独立した敵対的ネットワークが、可変サイズの文書の画像バイナライズのために訓練されている。
論文 参考訳(メタデータ) (2020-10-20T07:51:50Z) - Self-supervised Deep Reconstruction of Mixed Strip-shredded Text
Documents [63.41717168981103]
本研究は,従来の1ページ再構成の深層学習手法を,より現実的で複雑なシナリオに拡張する。
本手法では, 整合性評価を2クラス(無効または無効)パターン認識問題としてモデル化する。
提案手法は複雑なシナリオにおいて競合する手法よりも優れ、90%以上の精度で精度が向上する。
論文 参考訳(メタデータ) (2020-07-01T21:48:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。