論文の概要: Denoising and Segmentation of Epigraphical Scripts
- arxiv url: http://arxiv.org/abs/2107.11801v1
- Date: Sun, 25 Jul 2021 13:25:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-28 00:55:09.350207
- Title: Denoising and Segmentation of Epigraphical Scripts
- Title(参考訳): エピグラフィカルスクリプトのデノジングとセグメンテーション
- Authors: P Preethi and Hrishikesh Viswanath
- Abstract要約: 画像はカーネルに分割され、それぞれがGLCM(Gray Level Co-Occurrence Matrix)に変換される。
Haralickの値とそれに対応するノイズ/テキスト分類は辞書を形成し、カーネル比較によって画像をノイズ化する。
ニューラルネットワークの精度は最大89%まで向上した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: This paper is a presentation of a new method for denoising images using
Haralick features and further segmenting the characters using artificial neural
networks. The image is divided into kernels, each of which is converted to a
GLCM (Gray Level Co-Occurrence Matrix) on which a Haralick Feature generation
function is called, the result of which is an array with fourteen elements
corresponding to fourteen features The Haralick values and the corresponding
noise/text classification form a dictionary, which is then used to de-noise the
image through kernel comparison. Segmentation is the process of extracting
characters from a document and can be used when letters are separated by white
space, which is an explicit boundary marker. Segmentation is the first step in
many Natural Language Processing problems. This paper explores the process of
segmentation using Neural Networks. While there have been numerous methods to
segment characters of a document, this paper is only concerned with the
accuracy of doing so using neural networks. It is imperative that the
characters be segmented correctly, for failing to do so will lead to incorrect
recognition by Natural language processing tools. Artificial Neural Networks
was used to attain accuracy of upto 89%. This method is suitable for languages
where the characters are delimited by white space. However, this method will
fail to provide acceptable results when the language heavily uses connected
letters. An example would be the Devanagari script, which is predominantly used
in northern India.
- Abstract(参考訳): 本稿では,ハラリック特徴を用いた画像の切り出しと,さらに人工ニューラルネットワークを用いた文字分割手法を提案する。
画像はカーネルに分割され、それぞれがハラリック特徴生成関数が呼ばれるglcm(gray level co-occurrence matrix)に変換され、14の要素に対応する14の要素からなる配列がハラリック値と対応するノイズ/テキスト分類が辞書を形成し、カーネル比較により画像の非ノイズ化に使用される。
セグメンテーションはドキュメントから文字を抽出するプロセスであり、明示的な境界マーカーであるホワイトスペースによって文字が分離されたときに使用できる。
セグメンテーションは多くの自然言語処理問題の第一段階である。
本稿ではニューラルネットワークを用いたセグメンテーションのプロセスについて述べる。
文書の文字を分割する手法は数多く存在するが,本論文はニューラルネットワークを用いて文字を分割する精度にのみ関係している。
文字を正しく分割することは必須であり、それができないと自然言語処理ツールによる誤認識につながる。
ニューラルネットワークは、最大89%の精度を達成するために使用された。
この方法は文字が白文字で区切られた言語に適している。
しかし、この方法は、言語が接続された文字を多用する場合、受け入れられる結果を与えることができない。
例として、インド北部で主に使われているデヴァナガリ文字がある。
関連論文リスト
- EAVL: Explicitly Align Vision and Language for Referring Image Segmentation [27.351940191216343]
入力画像と文に基づいて動的畳み込みカーネルを用いてセグメンテーション段階で特徴を整列するビジョン・ランゲージ・アリグナーを提案する。
本手法は, セグメンテーション段階におけるマルチモーダルな特徴の可能性を生かし, 異なるエムフェーズの言語特徴を画像特徴と整合させて, 微細なテキスト・ピクセル相関を実現する。
論文 参考訳(メタデータ) (2023-08-18T18:59:27Z) - Language-driven Semantic Segmentation [88.21498323896475]
本稿では,言語駆動型セマンティックイメージセグメンテーションの新しいモデルLSegを提案する。
テキストエンコーダを用いて記述型入力ラベルの埋め込みを計算する。
エンコーダは、画素埋め込みを対応するセマンティッククラスのテキスト埋め込みに合わせるために、対照的な目的で訓練される。
論文 参考訳(メタデータ) (2022-01-10T18:59:10Z) - Deep ensembles in bioimage segmentation [74.01883650587321]
本研究では,畳み込みニューラルネットワーク(CNN)のアンサンブルを提案する。
アンサンブル法では、多くの異なるモデルが訓練され、分類に使用され、アンサンブルは単一分類器の出力を集約する。
提案するアンサンブルは,DeepLabV3+とHarDNet環境を用いて,異なるバックボーンネットワークを組み合わせることで実現されている。
論文 参考訳(メタデータ) (2021-12-24T05:54:21Z) - Lexically Aware Semi-Supervised Learning for OCR Post-Correction [90.54336622024299]
世界中の多くの言語における既存の言語データの多くは、非デジタル化された書籍や文書に閉じ込められている。
従来の研究は、あまり良くない言語を認識するためのニューラル・ポスト・コレクション法の有用性を実証してきた。
そこで本研究では,生画像を利用した半教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2021-11-04T04:39:02Z) - Benchmarking Scene Text Recognition in Devanagari, Telugu and Malayalam [34.83389169949119]
英語のシーンテキスト認識におけるDeep Learningベースのアプローチの成功に触発されて、3つのIndicスクリプトのシーンテキスト認識をポーズし、ベンチマークする。
Unicodeフォントから描画された合成語画像は、認識システムの訓練に使用される。
私たちは、単語画像を対応するテキストに転写するために、セグメンテーションフリーでハイブリッドでエンドツーエンドのトレーニング可能なCNN-RNNディープニューラルネットワークを使用します。
論文 参考訳(メタデータ) (2021-04-09T15:36:33Z) - Efficient Deep Image Denoising via Class Specific Convolution [24.103826414190216]
画素ワイズ分類に基づく画像復調のための効率的なディープニューラルネットワークを提案する。
提案手法は性能を犠牲にすることなく計算コストを削減できる。
論文 参考訳(メタデータ) (2021-03-02T10:28:15Z) - Select, Extract and Generate: Neural Keyphrase Generation with
Layer-wise Coverage Attention [75.44523978180317]
本稿では,2つの主要成分からなるニューラルキーフレーズ生成モデルであるemphSEG-Netを提案する。
科学的およびWeb文書から得られた7つのキーフレーズ生成ベンチマークの実験結果は、SEG-Netが最先端のニューラル生成手法よりも大きなマージンで優れていることを示している。
論文 参考訳(メタデータ) (2020-08-04T18:00:07Z) - DenoiSeg: Joint Denoising and Segmentation [75.91760529986958]
我々は,いくつかの注釈付き基底真理セグメンテーションでエンドツーエンドに学習できる新しい手法であるDenoySegを提案する。
我々は、ノイズの多い画像だけで訓練できる自己教師付き遮音方式であるNoss2Voidを拡張して、密度の高い3クラスセグメンテーションを予測する。
論文 参考訳(メタデータ) (2020-05-06T17:42:54Z) - TextScanner: Reading Characters in Order for Robust Scene Text
Recognition [60.04267660533966]
TextScannerはシーンテキスト認識の代替手法である。
文字クラス、位置、順序に対する画素単位のマルチチャネルセグメンテーションマップを生成する。
また、コンテキストモデリングにRNNを採用し、文字の位置とクラスを並列で予測する。
論文 参考訳(メタデータ) (2019-12-28T07:52:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。