論文の概要: BN-HTRd: A Benchmark Dataset for Document Level Offline Bangla
Handwritten Text Recognition (HTR) and Line Segmentation
- arxiv url: http://arxiv.org/abs/2206.08977v1
- Date: Sun, 29 May 2022 22:56:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-26 12:11:23.603644
- Title: BN-HTRd: A Benchmark Dataset for Document Level Offline Bangla
Handwritten Text Recognition (HTR) and Line Segmentation
- Title(参考訳): BN-HTRd: 文書レベルのオフラインバングラ手書き文字認識(HTR)と行分割のためのベンチマークデータセット
- Authors: Md. Ataur Rahman, Nazifa Tabassum, Mitu Paul, Riya Pal, Mohammad
Khairul Islam
- Abstract要約: 我々は,単語,行,文書レベルのアノテーションからなるBanglaスクリプトの画像から,オフライン手書き文字認識(HTR)のための新しいデータセットを提案する。
BN-HTRdデータセットはBBC Bangla News corpusに基づいている。
私たちのデータセットには、約150の異なる著者によって作成された手書きページの788のイメージが含まれています。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce a new dataset for offline Handwritten Text Recognition (HTR)
from images of Bangla scripts comprising words, lines, and document-level
annotations. The BN-HTRd dataset is based on the BBC Bangla News corpus, meant
to act as ground truth texts. These texts were subsequently used to generate
the annotations that were filled out by people with their handwriting. Our
dataset includes 788 images of handwritten pages produced by approximately 150
different writers. It can be adopted as a basis for various handwriting
classification tasks such as end-to-end document recognition, word-spotting,
word or line segmentation, and so on. We also propose a scheme to segment
Bangla handwritten document images into corresponding lines in an unsupervised
manner. Our line segmentation approach takes care of the variability involved
in different writing styles, accurately segmenting complex handwritten text
lines of curvilinear nature. Along with a bunch of pre-processing and
morphological operations, both Hough line and circle transforms were employed
to distinguish different linear components. In order to arrange those
components into their corresponding lines, we followed an unsupervised
clustering approach. The average success rate of our segmentation technique is
81.57% in terms of FM metrics (similar to F-measure) with a mean Average
Precision (mAP) of 0.547.
- Abstract(参考訳): 単語,行,文書レベルのアノテーションからなるBanglaスクリプトの画像から,オフライン手書き文字認識(HTR)のための新しいデータセットを提案する。
BN-HTRdデータセットはBBC Bangla News corpusに基づいている。
これらのテキストはその後、手書きの人々が記入した注釈を生成するのに使われた。
私たちのデータセットには、約150の異なる著者によって作成された手書きページの788のイメージが含まれています。
エンド・ツー・エンドの文書認識、単語スポッティング、単語や行のセグメンテーションなど、さまざまな手書き分類タスクの基盤として採用することができる。
また,Banglaの手書き文書画像を教師なしで対応する行に分割する手法を提案する。
ラインセグメンテーションのアプローチは,様々な書体スタイルの変動に対処し,複雑な手書きテキスト行のカービリニアな性質を正確にセグメンテーションする。
多くの前処理と形態演算とともに、ハフ線と円変換は異なる線形成分を区別するために用いられる。
これらのコンポーネントを対応するラインに配置するために、教師なしのクラスタリングアプローチに従いました。
我々のセグメンテーション手法の平均成功率は、平均平均精度(map)0.547のfmメトリクス(f-measureと類似)で81.57%である。
関連論文リスト
- Hierarchical Text Spotter for Joint Text Spotting and Layout Analysis [52.01356859448068]
HTSは画像中のテキストを認識し、文字、単語、行、段落の4段階の階層構造を識別することができる。
HTSは、複数の単語レベルのテキストスポッティングベンチマークデータセットと幾何学的レイアウト解析タスクの最先端結果を達成する。
論文 参考訳(メタデータ) (2023-10-25T22:23:54Z) - Copy Is All You Need [66.00852205068327]
既存のテキストコレクションからテキストセグメントを段階的にコピーするテキスト生成を定式化する。
提案手法は, 自動評価と人的評価の両方により, より優れた生成品質を実現する。
当社のアプローチでは,より大規模なテキストコレクションにスケールアップすることで,さらなるパフォーマンス向上を実現しています。
論文 参考訳(メタデータ) (2023-07-13T05:03:26Z) - BN-DRISHTI: Bangla Document Recognition through Instance-level
Segmentation of Handwritten Text Images [0.0]
本稿では,ハフ変換とアフィン変換を併用した深層学習に基づくオブジェクト検出フレームワーク(YOLO)を提案する。
BN-HTRdデータセットの拡張版として、786個の全ページ手書きBangla文書画像を示す。
Fスコアは行数99.97%,単語セグメンテーション98%であった。
論文 参考訳(メタデータ) (2023-05-31T04:08:57Z) - Letter-level Online Writer Identification [86.13203975836556]
我々は文字レベルのオンラインライタIDという新たな問題に焦点をあてる。
主な課題は、しばしば異なるスタイルで手紙を書くことである。
我々はこの問題をオンライン書記スタイルのばらつき(Var-O-Styles)と呼ぶ。
論文 参考訳(メタデータ) (2021-12-06T07:21:53Z) - Line Segmentation from Unconstrained Handwritten Text Images using
Adaptive Approach [10.436029791699777]
手書きテキスト画像からの行分割は、多様性と未知のバリエーションのために難しい課題である。
接続されたコンポーネント座標とテキスト高さのアライメントを結合した手書きテキスト画像からのラインセグメンテーションに適応的アプローチを用いる。
提案手法は,ベースラインを持つ文書ページとプレーンページの2種類のデータセットで検証される。
論文 参考訳(メタデータ) (2021-04-18T08:52:52Z) - SOLD2: Self-supervised Occlusion-aware Line Description and Detection [95.8719432775724]
単一深層ネットワークにおける回線セグメントの最初の共同検出と記述について紹介します。
我々の手法は注釈付き行ラベルを必要としないため、任意のデータセットに一般化することができる。
複数のマルチビューデータセットにおいて,従来の行検出と記述方法に対するアプローチを評価した。
論文 参考訳(メタデータ) (2021-04-07T19:27:17Z) - Text Line Segmentation for Challenging Handwritten Document Images Using
Fully Convolutional Network [0.0]
本稿では,歴史的写本画像に対するテキストラインセグメンテーション手法を提案する。
同じテキストライン上のコンポーネントを接続するラインマスクに依存しています。
FCNは、通常の手書き文書画像のテキスト行のセグメンテーションに成功している。
論文 参考訳(メタデータ) (2021-01-20T19:51:26Z) - VML-MOC: Segmenting a multiply oriented and curved handwritten text
lines dataset [0.8399688944263843]
我々は、任意の向きで歪んだり湾曲した手書きテキスト行を分割する多目的ガウス的手法を評価する。
その結果, 単方向ガウスに基づくテキスト線分割法の結果と比較した。
論文 参考訳(メタデータ) (2021-01-19T10:10:45Z) - Unsupervised deep learning for text line segmentation [0.0]
一般的な方法は、テキスト行をトレースするブロブラインの画像に文書イメージを埋め込むためのディープラーニングネットワークを訓練することである。
本稿では、アノテーションを必要とせずに、文書イメージパッチの教師なし埋め込みを提案する。
本研究では,アウトレーヤが収束を損なわないことを示すとともに,テキスト行間の空間からテキスト行を識別するネットワークを学習する。
論文 参考訳(メタデータ) (2020-03-19T08:57:53Z) - Learning to Select Bi-Aspect Information for Document-Scale Text Content
Manipulation [50.01708049531156]
我々は、テキストスタイルの転送とは逆の文書スケールのテキストコンテンツ操作という、新しい実践的なタスクに焦点を当てる。
詳細は、入力は構造化されたレコードと、別のレコードセットを記述するための参照テキストのセットである。
出力は、ソースレコードセットの部分的内容と参照の書き込みスタイルを正確に記述した要約である。
論文 参考訳(メタデータ) (2020-02-24T12:52:10Z) - TextScanner: Reading Characters in Order for Robust Scene Text
Recognition [60.04267660533966]
TextScannerはシーンテキスト認識の代替手法である。
文字クラス、位置、順序に対する画素単位のマルチチャネルセグメンテーションマップを生成する。
また、コンテキストモデリングにRNNを採用し、文字の位置とクラスを並列で予測する。
論文 参考訳(メタデータ) (2019-12-28T07:52:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。