論文の概要: Handwritten Script Identification from Text Lines
- arxiv url: http://arxiv.org/abs/2009.07433v1
- Date: Wed, 16 Sep 2020 02:43:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-17 23:18:08.719975
- Title: Handwritten Script Identification from Text Lines
- Title(参考訳): テキスト行からの手書きスクリプト識別
- Authors: Pawan Kumar Singh, Iman Chatterjee, Ram Sarkar, Mita Nasipuri
- Abstract要約: テキスト行レベルで手書き文書からスクリプトを識別する頑健な手法を提案する。
チェインコードヒストグラム(CCH)と離散フーリエ変換(DFT)を用いて抽出した特徴に基づく。
提案手法は、グジャラート、カンナダ、マラヤラム、オリヤ、タミル、テルグ、ウルドゥーの7文字で書かれた800行の手書きのテキストに対して、ローマ文字とともに実験されている。
- 参考スコア(独自算出の注目度): 38.1188690493442
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In a multilingual country like India where 12 different official scripts are
in use, automatic identification of handwritten script facilitates many
important applications such as automatic transcription of multilingual
documents, searching for documents on the web/digital archives containing a
particular script and for the selection of script specific Optical Character
Recognition (OCR) system in a multilingual environment. In this paper, we
propose a robust method towards identifying scripts from the handwritten
documents at text line-level. The recognition is based upon features extracted
using Chain Code Histogram (CCH) and Discrete Fourier Transform (DFT). The
proposed method is experimented on 800 handwritten text lines written in seven
Indic scripts namely, Gujarati, Kannada, Malayalam, Oriya, Tamil, Telugu, Urdu
along with Roman script and yielded an average identification rate of 95.14%
using Support Vector Machine (SVM) classifier.
- Abstract(参考訳): 12の異なる公式スクリプトが使用されているインドのような多言語国では、手書きスクリプトの自動識別は、多言語文書の自動書き起こし、特定のスクリプトを含むウェブ/デジタルアーカイブ上の文書検索、多言語環境におけるスクリプト固有の光学文字認識(OCR)システムの選択など、多くの重要な応用を促進する。
本稿では,テキスト行レベルで手書き文書からスクリプトを識別する堅牢な手法を提案する。
この認識はチェインコードヒストグラム(cch)と離散フーリエ変換(dft)を用いて抽出された特徴に基づいている。
提案手法は, グジャラート, カナダ, マラヤラム, オリヤ, タミル, テルグ, ウルドゥの7文字で書かれた800行の手書きテキストに対して, ローマ文字とともに実験を行い, サポートベクトルマシン(SVM)分類器を用いて平均識別率95.14%を得た。
関連論文リスト
- Multi-Modal Multi-Granularity Tokenizer for Chu Bamboo Slip Scripts [65.10991154918737]
本研究は、古代中国の春・秋・戦国時代(紀元前771-256年)に用いられた中竹の文字に焦点を当てたものである。
我々のトークンライザはまず文字検出を採用して文字境界の特定を行い、次に文字レベルとサブキャラクタレベルの両方で文字認識を行う。
学術コミュニティを支援するために,100K以上の注釈付き文字イメージスキャンを備えたCBSの最初の大規模データセットも収集した。
論文 参考訳(メタデータ) (2024-09-02T07:42:55Z) - Exploring the Role of Transliteration in In-Context Learning for Low-resource Languages Written in Non-Latin Scripts [50.40191599304911]
非ラテン文字で書かれた低リソース言語に対するLLMの性能向上にも効果があるか検討する。
本稿では,(1) の原文,(2) ラテン文字,(3) の両文を対象とする3つのプロンプトテンプレートを提案する。
本研究の結果から,翻訳の有効性はタスクタイプやモデルサイズによって異なることが明らかとなった。
論文 参考訳(メタデータ) (2024-07-02T14:51:20Z) - Script-Agnostic Language Identification [21.19710835737713]
コンカニ語、カシミリ語、パンジャービ語などの現代語は、複数の文字で同期的に書かれている。
いくつかの異なる実験手法を用いて,スクリプトに依存しない表現の学習を提案する。
単語レベルのスクリプトランダム化と複数のスクリプトで書かれた言語への露出は、下流のスクリプトに依存しない言語識別に非常に有用である。
論文 参考訳(メタデータ) (2024-06-25T19:23:42Z) - MDIW-13: a New Multi-Lingual and Multi-Script Database and Benchmark for Script Identification [19.021909090693505]
本稿では,スクリプト識別アルゴリズムのベンチマークのための新しいデータベースを提供する。
データセットは、地元の新聞や手書きの手紙からスキャンされた1,135件の文書と、異なるネイティブライターのメモで構成されている。
簡単なベンチマークは、手作りとディープラーニングの手法で提案されている。
論文 参考訳(メタデータ) (2024-05-29T09:29:09Z) - Visual Speech Recognition for Languages with Limited Labeled Data using
Automatic Labels from Whisper [96.43501666278316]
本稿では,複数の言語を対象とした強力な視覚音声認識(VSR)手法を提案する。
言語識別と音声認識の両方が可能なWhisperモデルを用いる。
自動ラベルで訓練されたVSRモデルと人称ラベルで訓練したVSRモデルの性能を比較することにより,人間対応ラベルと類似のVSR性能が得られることを示す。
論文 参考訳(メタデータ) (2023-09-15T16:53:01Z) - Optical Script Identification for multi-lingual Indic-script [0.0]
本論文の目的は,スクリプト前処理とテキスト認識技術の発展について論じることである。
インドには12の著名なIndicスクリプトがあり、英語とは異なり、これらのスクリプトには様々な特徴がある。
論文 参考訳(メタデータ) (2023-08-10T14:02:05Z) - DeepSolo++: Let Transformer Decoder with Explicit Points Solo for Multilingual Text Spotting [112.45423990924283]
DeepSolo++は単純なDETRライクなベースラインで、テキスト検出、認識、スクリプト識別を同時に行うために、明示的なポイントを持つ1つのデコーダを単独で使用することができる。
本手法は、英語のシーンだけでなく、複雑なフォント構造と中国語などの1000レベルの文字クラスで書き起こしを習得する。
論文 参考訳(メタデータ) (2023-05-31T15:44:00Z) - Beyond Arabic: Software for Perso-Arabic Script Manipulation [67.31374614549237]
ペルソ・アラビア文字を使用する言語の書き起こしシステムを操作するための有限状態トランスデューサ(FST)コンポーネントとそれに対応するユーティリティのセットを提供する。
ライブラリはまた、単純なFSTベースのロマン化と文字変換も提供する。
論文 参考訳(メタデータ) (2023-01-26T20:37:03Z) - A New Approach for Texture based Script Identification At Block Level
using Quad Tree Decomposition [38.20489458130109]
マルチスクリプトシナリオが一般的であるインドのような国では、事前にスクリプトを特定することが義務付けられます。
公式手書き文字11文字に対する方向エネルギーとエントロピー分布の抽出におけるガボルウェーブレットフィルタの重要性を示す。
論文 参考訳(メタデータ) (2020-09-16T02:50:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。