論文の概要: Handwritten Script Identification from Text Lines
- arxiv url: http://arxiv.org/abs/2009.07433v1
- Date: Wed, 16 Sep 2020 02:43:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-17 23:18:08.719975
- Title: Handwritten Script Identification from Text Lines
- Title(参考訳): テキスト行からの手書きスクリプト識別
- Authors: Pawan Kumar Singh, Iman Chatterjee, Ram Sarkar, Mita Nasipuri
- Abstract要約: テキスト行レベルで手書き文書からスクリプトを識別する頑健な手法を提案する。
チェインコードヒストグラム(CCH)と離散フーリエ変換(DFT)を用いて抽出した特徴に基づく。
提案手法は、グジャラート、カンナダ、マラヤラム、オリヤ、タミル、テルグ、ウルドゥーの7文字で書かれた800行の手書きのテキストに対して、ローマ文字とともに実験されている。
- 参考スコア(独自算出の注目度): 38.1188690493442
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In a multilingual country like India where 12 different official scripts are
in use, automatic identification of handwritten script facilitates many
important applications such as automatic transcription of multilingual
documents, searching for documents on the web/digital archives containing a
particular script and for the selection of script specific Optical Character
Recognition (OCR) system in a multilingual environment. In this paper, we
propose a robust method towards identifying scripts from the handwritten
documents at text line-level. The recognition is based upon features extracted
using Chain Code Histogram (CCH) and Discrete Fourier Transform (DFT). The
proposed method is experimented on 800 handwritten text lines written in seven
Indic scripts namely, Gujarati, Kannada, Malayalam, Oriya, Tamil, Telugu, Urdu
along with Roman script and yielded an average identification rate of 95.14%
using Support Vector Machine (SVM) classifier.
- Abstract(参考訳): 12の異なる公式スクリプトが使用されているインドのような多言語国では、手書きスクリプトの自動識別は、多言語文書の自動書き起こし、特定のスクリプトを含むウェブ/デジタルアーカイブ上の文書検索、多言語環境におけるスクリプト固有の光学文字認識(OCR)システムの選択など、多くの重要な応用を促進する。
本稿では,テキスト行レベルで手書き文書からスクリプトを識別する堅牢な手法を提案する。
この認識はチェインコードヒストグラム(cch)と離散フーリエ変換(dft)を用いて抽出された特徴に基づいている。
提案手法は, グジャラート, カナダ, マラヤラム, オリヤ, タミル, テルグ, ウルドゥの7文字で書かれた800行の手書きテキストに対して, ローマ文字とともに実験を行い, サポートベクトルマシン(SVM)分類器を用いて平均識別率95.14%を得た。
関連論文リスト
- Visual Speech Recognition for Languages with Limited Labeled Data using
Automatic Labels from Whisper [96.43501666278316]
本稿では,複数の言語を対象とした強力な視覚音声認識(VSR)手法を提案する。
言語識別と音声認識の両方が可能なWhisperモデルを用いる。
自動ラベルで訓練されたVSRモデルと人称ラベルで訓練したVSRモデルの性能を比較することにより,人間対応ラベルと類似のVSR性能が得られることを示す。
論文 参考訳(メタデータ) (2023-09-15T16:53:01Z) - Chinese Text Recognition with A Pre-Trained CLIP-Like Model Through
Image-IDS Aligning [61.34060587461462]
中国語テキスト認識(CTR)のための2段階フレームワークを提案する。
印刷文字画像とIdeographic Description Sequences (IDS) の整列によるCLIP様モデルの事前学習を行う。
この事前学習段階は、漢字を認識する人間をシミュレートし、各文字の標準表現を得る。
学習された表現はCTRモデルを監督するために使用され、従来の単一文字認識はテキストライン認識に改善される。
論文 参考訳(メタデータ) (2023-09-03T05:33:16Z) - Optical Script Identification for multi-lingual Indic-script [0.0]
本論文の目的は,スクリプト前処理とテキスト認識技術の発展について論じることである。
インドには12の著名なIndicスクリプトがあり、英語とは異なり、これらのスクリプトには様々な特徴がある。
論文 参考訳(メタデータ) (2023-08-10T14:02:05Z) - Beyond Arabic: Software for Perso-Arabic Script Manipulation [67.31374614549237]
ペルソ・アラビア文字を使用する言語の書き起こしシステムを操作するための有限状態トランスデューサ(FST)コンポーネントとそれに対応するユーティリティのセットを提供する。
ライブラリはまた、単純なFSTベースのロマン化と文字変換も提供する。
論文 参考訳(メタデータ) (2023-01-26T20:37:03Z) - VScript: Controllable Script Generation with Audio-Visual Presentation [56.17400243061659]
VScriptは、対話やシーン記述を含む完全なスクリプトを生成するコントロール可能なパイプラインである。
我々は階層構造を採用し、プロットを生成し、次にスクリプトとその音声視覚提示を行う。
実験の結果,本手法は,自動評価と人的評価の両方において,ベースラインよりも優れていることがわかった。
論文 参考訳(メタデータ) (2022-03-01T09:43:02Z) - Letter-level Online Writer Identification [86.13203975836556]
我々は文字レベルのオンラインライタIDという新たな問題に焦点をあてる。
主な課題は、しばしば異なるスタイルで手紙を書くことである。
我々はこの問題をオンライン書記スタイルのばらつき(Var-O-Styles)と呼ぶ。
論文 参考訳(メタデータ) (2021-12-06T07:21:53Z) - KOHTD: Kazakh Offline Handwritten Text Dataset [0.0]
広範囲にわたるカザフスタンのオフライン手書きテキストデータセット(KOHTD)を提案する。
KOHTDには3000枚の手書き試験用紙と140335枚以上の分割画像があり、約922010のシンボルがある。
我々は,CTC法や注意法など,単語・行認識に人気の高いテキスト認識手法を多用した。
論文 参考訳(メタデータ) (2021-09-22T16:19:38Z) - Persian Handwritten Digit, Character and Word Recognition Using Deep
Learning [0.5188841610098436]
本稿では、深層ニューラルネットワークを様々なDensNetアーキテクチャやXceptionを通じて活用する。
我々はペルシャ語の特殊性と対応する筆跡を考慮に入れた光学的文字認識法を考案した。
HODAデータベースでは、数字と文字の認識率は99.72%と89.99%であり、数字、文字、単語の認識率は99.72%、98.32%、98.82%である。
論文 参考訳(メタデータ) (2020-10-24T11:42:28Z) - A New Approach for Texture based Script Identification At Block Level
using Quad Tree Decomposition [38.20489458130109]
マルチスクリプトシナリオが一般的であるインドのような国では、事前にスクリプトを特定することが義務付けられます。
公式手書き文字11文字に対する方向エネルギーとエントロピー分布の抽出におけるガボルウェーブレットフィルタの重要性を示す。
論文 参考訳(メタデータ) (2020-09-16T02:50:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。