論文の概要: Modified Segmentation Algorithm for Recognition of Older Geez Scripts
Written on Vellum
- arxiv url: http://arxiv.org/abs/2006.00465v1
- Date: Sun, 31 May 2020 08:16:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-26 12:59:19.910393
- Title: Modified Segmentation Algorithm for Recognition of Older Geez Scripts
Written on Vellum
- Title(参考訳): ベラムに書き込まれた古いゲエスクリプトの認識のための修正セグメンテーションアルゴリズム
- Authors: Girma Negashe, Adane Mamuye
- Abstract要約: 手書き文書の認識は、文書イメージを機械で理解できるフォーマットに変換することを目的としている。
手書き文書認識は、パターン認識の分野で最も難しい分野である。
そこで本研究では,古いGeezスクリプトを識別する修正セグメンテーション手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recognition of handwritten document aims at transforming document images into
a machine understandable format. Handwritten document recognition is the most
challenging area in the field of pattern recognition. It becomes more complex
when a document was written on vellum before hundreds of years, like older Geez
scripts. In this study, we introduced a modified segmentation approach to
recognize older Geez scripts. We used adaptive filtering for noise reduction,
Isodata iterative global thresholding for document image binarization, modified
bounding box projection to segment distinct strokes between Geez characters,
numbers, and punctuation marks. SVM multiclass classifier scored 79.32%
recognition accuracy with the modified segmentation algorithm.
- Abstract(参考訳): 手書き文書の認識は、文書画像を機械理解可能なフォーマットに変換することを目的としている。
手書きの文書認識は、パターン認識の分野で最も難しい分野である。
古いGeezスクリプトのように、何百年も前にvellumで書かれたドキュメントがより複雑になる。
そこで本研究では,古いGeezスクリプトを識別する修正セグメンテーション手法を提案する。
ノイズ低減のための適応フィルタリング,文書画像のバイナライゼーションのためのIsodataイテレーティブなグローバルしきい値設定,ゲエ文字,数字,句読点間の異なるストロークを分割するための境界ボックス投影を改良した。
SVMマルチクラス分類器は、修正セグメンテーションアルゴリズムで79.32%の精度で認識された。
関連論文リスト
- Learning Robust Named Entity Recognizers From Noisy Data With Retrieval Augmentation [67.89838237013078]
名前付きエンティティ認識(NER)モデルは、しばしばノイズの多い入力に悩まされる。
ノイズの多いテキストとそのNERラベルのみを利用できる、より現実的な設定を提案する。
我々は、推論中にテキストを取得することなく、堅牢なNERを改善するマルチビュートレーニングフレームワークを採用している。
論文 参考訳(メタデータ) (2024-07-26T07:30:41Z) - Leveraging Semantic Segmentation Masks with Embeddings for Fine-Grained Form Classification [0.0]
史料の効率的な分類は系譜学、法学、歴史学などの分野において重要である。
本稿では、ResNet、マスク付き画像変換器(Di)、埋め込みセグメンテーションなどのディープラーニングモデルを統合した表現型学習戦略を提案する。
論文 参考訳(メタデータ) (2024-05-23T04:28:50Z) - GatedLexiconNet: A Comprehensive End-to-End Handwritten Paragraph Text Recognition System [3.9527064697847005]
内部線分割と畳み込み層に基づくエンコーダを組み込んだエンドツーエンドの段落認識システムを提案する。
本研究は、IAMでは2.27%、RIMESでは0.9%、READ-16では2.13%、READ-2016データセットでは5.73%の文字誤り率を報告した。
論文 参考訳(メタデータ) (2024-04-22T10:19:16Z) - Efficiently Leveraging Linguistic Priors for Scene Text Spotting [63.22351047545888]
本稿では,大規模テキストコーパスから言語知識を活用する手法を提案する。
シーンテキストデータセットとよく一致したテキスト分布を生成し、ドメイン内の微調整の必要性を取り除く。
実験結果から,本手法は認識精度を向上するだけでなく,単語のより正確な局所化を可能にすることが示された。
論文 参考訳(メタデータ) (2024-02-27T01:57:09Z) - Character Queries: A Transformer-based Approach to On-Line Handwritten
Character Segmentation [4.128716153761773]
本稿では,文字分割が代入問題となる場合に,事前に書き起こしが知られているシナリオに焦点を当てる。
k$-meansクラスタリングアルゴリズムにヒントを得て、クラスタ割り当ての観点から見た上で、Transformerベースのアーキテクチャを提示する。
提案手法の質を評価するために,2つの有名なオンライン手書きデータセットに対して,文字分割基底真理を生成する。
論文 参考訳(メタデータ) (2023-09-06T15:19:04Z) - DocMAE: Document Image Rectification via Self-supervised Representation
Learning [144.44748607192147]
文書画像修正のための新しい自己教師型フレームワークDocMAEを提案する。
まず、背景を除いた文書画像のランダムなパッチをマスクし、欠落したピクセルを再構成する。
このような自己教師型学習手法により、ネットワークは変形文書の本質的な構造を学習することが奨励される。
論文 参考訳(メタデータ) (2023-04-20T14:27:15Z) - Unified Mask Embedding and Correspondence Learning for Self-Supervised
Video Segmentation [76.40565872257709]
我々は、局所的な識別的特徴学習のためのフレーム間密度対応を同時にモデル化する統合フレームワークを開発する。
ラベルなしビデオから直接マスク誘導シーケンシャルセグメンテーションを実行することができる。
我々のアルゴリズムは、2つの標準ベンチマーク(DAVIS17とYouTube-VOS)に最先端をセットする。
論文 参考訳(メタデータ) (2023-03-17T16:23:36Z) - Language-driven Semantic Segmentation [88.21498323896475]
本稿では,言語駆動型セマンティックイメージセグメンテーションの新しいモデルLSegを提案する。
テキストエンコーダを用いて記述型入力ラベルの埋め込みを計算する。
エンコーダは、画素埋め込みを対応するセマンティッククラスのテキスト埋め込みに合わせるために、対照的な目的で訓練される。
論文 参考訳(メタデータ) (2022-01-10T18:59:10Z) - End-to-End Approach for Recognition of Historical Digit Strings [2.0754848504005583]
ARDISデータセット(4桁長弦)に存在する古代の筆跡の難易度に対処するエンドツーエンドのセグメンテーションフリー深層学習手法を提案する。
VGG-16ディープモデルのわずかな変更により、フレームワークは93.2%の認識率を達成でき、メソッド、セグメンテーション、および融合方法のない実現可能なソリューションであることが示されています。
論文 参考訳(メタデータ) (2021-04-28T09:39:29Z) - Word Segmentation from Unconstrained Handwritten Bangla Document Images
using Distance Transform [34.89370782262938]
本稿では,制約のないBangla手書き文書画像から直接テキストを自動分割する手法について述べる。
単語画像の外部境界の位置を求めるために,一般的な距離アルゴリズムを適用した。
提案手法は,CMATERdbデータベースから取得した50個のランダム画像に対して実験を行った。
論文 参考訳(メタデータ) (2020-09-17T03:14:27Z) - TextScanner: Reading Characters in Order for Robust Scene Text
Recognition [60.04267660533966]
TextScannerはシーンテキスト認識の代替手法である。
文字クラス、位置、順序に対する画素単位のマルチチャネルセグメンテーションマップを生成する。
また、コンテキストモデリングにRNNを採用し、文字の位置とクラスを並列で予測する。
論文 参考訳(メタデータ) (2019-12-28T07:52:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。