論文の概要: Modified Segmentation Algorithm for Recognition of Older Geez Scripts
Written on Vellum
- arxiv url: http://arxiv.org/abs/2006.00465v1
- Date: Sun, 31 May 2020 08:16:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-26 12:59:19.910393
- Title: Modified Segmentation Algorithm for Recognition of Older Geez Scripts
Written on Vellum
- Title(参考訳): ベラムに書き込まれた古いゲエスクリプトの認識のための修正セグメンテーションアルゴリズム
- Authors: Girma Negashe, Adane Mamuye
- Abstract要約: 手書き文書の認識は、文書イメージを機械で理解できるフォーマットに変換することを目的としている。
手書き文書認識は、パターン認識の分野で最も難しい分野である。
そこで本研究では,古いGeezスクリプトを識別する修正セグメンテーション手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recognition of handwritten document aims at transforming document images into
a machine understandable format. Handwritten document recognition is the most
challenging area in the field of pattern recognition. It becomes more complex
when a document was written on vellum before hundreds of years, like older Geez
scripts. In this study, we introduced a modified segmentation approach to
recognize older Geez scripts. We used adaptive filtering for noise reduction,
Isodata iterative global thresholding for document image binarization, modified
bounding box projection to segment distinct strokes between Geez characters,
numbers, and punctuation marks. SVM multiclass classifier scored 79.32%
recognition accuracy with the modified segmentation algorithm.
- Abstract(参考訳): 手書き文書の認識は、文書画像を機械理解可能なフォーマットに変換することを目的としている。
手書きの文書認識は、パターン認識の分野で最も難しい分野である。
古いGeezスクリプトのように、何百年も前にvellumで書かれたドキュメントがより複雑になる。
そこで本研究では,古いGeezスクリプトを識別する修正セグメンテーション手法を提案する。
ノイズ低減のための適応フィルタリング,文書画像のバイナライゼーションのためのIsodataイテレーティブなグローバルしきい値設定,ゲエ文字,数字,句読点間の異なるストロークを分割するための境界ボックス投影を改良した。
SVMマルチクラス分類器は、修正セグメンテーションアルゴリズムで79.32%の精度で認識された。
関連論文リスト
- Efficiently Leveraging Linguistic Priors for Scene Text Spotting [63.22351047545888]
本稿では,大規模テキストコーパスから言語知識を活用する手法を提案する。
シーンテキストデータセットとよく一致したテキスト分布を生成し、ドメイン内の微調整の必要性を取り除く。
実験結果から,本手法は認識精度を向上するだけでなく,単語のより正確な局所化を可能にすることが示された。
論文 参考訳(メタデータ) (2024-02-27T01:57:09Z) - Character Queries: A Transformer-based Approach to On-Line Handwritten
Character Segmentation [4.128716153761773]
本稿では,文字分割が代入問題となる場合に,事前に書き起こしが知られているシナリオに焦点を当てる。
k$-meansクラスタリングアルゴリズムにヒントを得て、クラスタ割り当ての観点から見た上で、Transformerベースのアーキテクチャを提示する。
提案手法の質を評価するために,2つの有名なオンライン手書きデータセットに対して,文字分割基底真理を生成する。
論文 参考訳(メタデータ) (2023-09-06T15:19:04Z) - Handwritten and Printed Text Segmentation: A Signature Case Study [0.0]
我々は手書きテキストセグメンテーションの課題に対処するための新しいアプローチを開発する。
我々の目的は、クラス全体からテキストを復元することであり、特に重なり合う部分のセグメンテーション性能を向上させることである。
私たちの最高の設定は、以前の2つの異なるデータセットで17.9%、IoUスコアで7.3%のパフォーマンスを上回っています。
論文 参考訳(メタデータ) (2023-07-15T21:49:22Z) - DocMAE: Document Image Rectification via Self-supervised Representation
Learning [144.44748607192147]
文書画像修正のための新しい自己教師型フレームワークDocMAEを提案する。
まず、背景を除いた文書画像のランダムなパッチをマスクし、欠落したピクセルを再構成する。
このような自己教師型学習手法により、ネットワークは変形文書の本質的な構造を学習することが奨励される。
論文 参考訳(メタデータ) (2023-04-20T14:27:15Z) - Unified Mask Embedding and Correspondence Learning for Self-Supervised
Video Segmentation [76.40565872257709]
我々は、局所的な識別的特徴学習のためのフレーム間密度対応を同時にモデル化する統合フレームワークを開発する。
ラベルなしビデオから直接マスク誘導シーケンシャルセグメンテーションを実行することができる。
我々のアルゴリズムは、2つの標準ベンチマーク(DAVIS17とYouTube-VOS)に最先端をセットする。
論文 参考訳(メタデータ) (2023-03-17T16:23:36Z) - Augraphy: A Data Augmentation Library for Document Images [59.457999432618614]
Augraphyはデータ拡張パイプラインを構築するためのPythonライブラリである。
標準的なオフィス操作によって変更されたように見えるクリーンなドキュメントイメージの拡張版を作成するための戦略を提供する。
論文 参考訳(メタデータ) (2022-08-30T22:36:19Z) - Language-driven Semantic Segmentation [88.21498323896475]
本稿では,言語駆動型セマンティックイメージセグメンテーションの新しいモデルLSegを提案する。
テキストエンコーダを用いて記述型入力ラベルの埋め込みを計算する。
エンコーダは、画素埋め込みを対応するセマンティッククラスのテキスト埋め込みに合わせるために、対照的な目的で訓練される。
論文 参考訳(メタデータ) (2022-01-10T18:59:10Z) - End-to-End Approach for Recognition of Historical Digit Strings [2.0754848504005583]
ARDISデータセット(4桁長弦)に存在する古代の筆跡の難易度に対処するエンドツーエンドのセグメンテーションフリー深層学習手法を提案する。
VGG-16ディープモデルのわずかな変更により、フレームワークは93.2%の認識率を達成でき、メソッド、セグメンテーション、および融合方法のない実現可能なソリューションであることが示されています。
論文 参考訳(メタデータ) (2021-04-28T09:39:29Z) - Word Segmentation from Unconstrained Handwritten Bangla Document Images
using Distance Transform [34.89370782262938]
本稿では,制約のないBangla手書き文書画像から直接テキストを自動分割する手法について述べる。
単語画像の外部境界の位置を求めるために,一般的な距離アルゴリズムを適用した。
提案手法は,CMATERdbデータベースから取得した50個のランダム画像に対して実験を行った。
論文 参考訳(メタデータ) (2020-09-17T03:14:27Z) - A Hybrid Swarm and Gravitation based feature selection algorithm for
Handwritten Indic Script Classification problem [39.11055166524374]
我々はHybrid Swarm and Gravitation based FS (HSGFS)と呼ばれる新しいFSアルゴリズムを導入する。
このアルゴリズムは、DHT(Distance-Hough Transform)、HOG(Histogram of Oriented Gradients)、MLG(Modified log-Gabor)の3つの特徴ベクトル上で動作させる。
本手法の評価には,12のIndicスクリプトからなる手書きデータセットをブロック,テキスト行,単語レベルで作成した。
論文 参考訳(メタデータ) (2020-05-10T07:27:55Z) - TextScanner: Reading Characters in Order for Robust Scene Text
Recognition [60.04267660533966]
TextScannerはシーンテキスト認識の代替手法である。
文字クラス、位置、順序に対する画素単位のマルチチャネルセグメンテーションマップを生成する。
また、コンテキストモデリングにRNNを採用し、文字の位置とクラスを並列で予測する。
論文 参考訳(メタデータ) (2019-12-28T07:52:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。