Fugu-MT 論文翻訳(概要): Handwritten Script Identification from Text Lines

論文の概要: Handwritten Script Identification from Text Lines

arxiv url: http://arxiv.org/abs/2009.07433v1
Date: Wed, 16 Sep 2020 02:43:24 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-17 23:18:08.719975
Title: Handwritten Script Identification from Text Lines
Title（参考訳）: テキスト行からの手書きスクリプト識別
Authors: Pawan Kumar Singh, Iman Chatterjee, Ram Sarkar, Mita Nasipuri
Abstract要約: テキスト行レベルで手書き文書からスクリプトを識別する頑健な手法を提案する。チェインコードヒストグラム(CCH)と離散フーリエ変換(DFT)を用いて抽出した特徴に基づく。提案手法は、グジャラート、カンナダ、マラヤラム、オリヤ、タミル、テルグ、ウルドゥーの7文字で書かれた800行の手書きのテキストに対して、ローマ文字とともに実験されている。
参考スコア（独自算出の注目度）: 38.1188690493442
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In a multilingual country like India where 12 different official scripts are in use, automatic identification of handwritten script facilitates many important applications such as automatic transcription of multilingual documents, searching for documents on the web/digital archives containing a particular script and for the selection of script specific Optical Character Recognition (OCR) system in a multilingual environment. In this paper, we propose a robust method towards identifying scripts from the handwritten documents at text line-level. The recognition is based upon features extracted using Chain Code Histogram (CCH) and Discrete Fourier Transform (DFT). The proposed method is experimented on 800 handwritten text lines written in seven Indic scripts namely, Gujarati, Kannada, Malayalam, Oriya, Tamil, Telugu, Urdu along with Roman script and yielded an average identification rate of 95.14% using Support Vector Machine (SVM) classifier.
Abstract（参考訳）: 12の異なる公式スクリプトが使用されているインドのような多言語国では、手書きスクリプトの自動識別は、多言語文書の自動書き起こし、特定のスクリプトを含むウェブ/デジタルアーカイブ上の文書検索、多言語環境におけるスクリプト固有の光学文字認識(OCR)システムの選択など、多くの重要な応用を促進する。本稿では,テキスト行レベルで手書き文書からスクリプトを識別する堅牢な手法を提案する。この認識はチェインコードヒストグラム(cch)と離散フーリエ変換(dft)を用いて抽出された特徴に基づいている。提案手法は, グジャラート, カナダ, マラヤラム, オリヤ, タミル, テルグ, ウルドゥの7文字で書かれた800行の手書きテキストに対して, ローマ文字とともに実験を行い, サポートベクトルマシン(SVM)分類器を用いて平均識別率95.14%を得た。

関連論文リスト

Linear Script Representations in Speech Foundation Models Enable Zero-Shot Transliteration [70.84108518476744]
我々は,スクリプトが多言語音声モデルのアクティベーション空間に線形に符号化されていることを示し,推論時にアクティベーションを変更することで,出力スクリプトを直接制御できることを示した。本稿では,Whisperの全モデルサイズにまたがる競合性能を観測し,音声認識出力のスクリプトに対するポストホック制御を実現する手法を提案する。
論文参考訳（メタデータ） (2026-01-06T10:45:04Z)
Improving Informally Romanized Language Identification [49.404145019682666]
ローマ化は、ヒンディー語やウルドゥー語など、文字の難易度に基づいて、通常容易に区別できる言語を表現している。我々は、トレーニングセットを合成する手法を改善することにより、ロマライズされたテキストの言語識別(LID)精度を向上させる。本研究では,Bhasha-Abhijnaanam 評価セットにおける20のIndic言語からのロマン化テキストに対して,最先端の LID 性能を示す。
論文参考訳（メタデータ） (2025-04-30T11:36:28Z)
NusaAksara: A Multimodal and Multilingual Benchmark for Preserving Indonesian Indigenous Scripts [13.202716916003956]
NusaAksaraはインドネシア語の公開ベンチマークで、オリジナルのスクリプトを含んでいる。本ベンチマークでは,画像分割,OCR,翻訳,翻訳,言語識別などの多様なタスクを網羅する。
論文参考訳（メタデータ） (2025-02-25T12:23:52Z)
Multi-Modal Multi-Granularity Tokenizer for Chu Bamboo Slip Scripts [65.10991154918737]
本研究は、古代中国の春・秋・戦国時代(紀元前771-256年)に用いられた中竹の文字に焦点を当てたものである。我々のトークンライザはまず文字検出を採用して文字境界の特定を行い、次に文字レベルとサブキャラクタレベルの両方で文字認識を行う。学術コミュニティを支援するために,100K以上の注釈付き文字イメージスキャンを備えたCBSの最初の大規模データセットも収集した。
論文参考訳（メタデータ） (2024-09-02T07:42:55Z)
Exploring the Role of Transliteration in In-Context Learning for Low-resource Languages Written in Non-Latin Scripts [50.40191599304911]
非ラテン文字で書かれた低リソース言語に対するLLMの性能向上にも効果があるか検討する。本稿では,(1) の原文,(2) ラテン文字,(3) の両文を対象とする3つのプロンプトテンプレートを提案する。本研究の結果から,翻訳の有効性はタスクタイプやモデルサイズによって異なることが明らかとなった。
論文参考訳（メタデータ） (2024-07-02T14:51:20Z)
Script-Agnostic Language Identification [21.19710835737713]
コンカニ語、カシミリ語、パンジャービ語などの現代語は、複数の文字で同期的に書かれている。いくつかの異なる実験手法を用いて,スクリプトに依存しない表現の学習を提案する。単語レベルのスクリプトランダム化と複数のスクリプトで書かれた言語への露出は、下流のスクリプトに依存しない言語識別に非常に有用である。
論文参考訳（メタデータ） (2024-06-25T19:23:42Z)
MDIW-13: a New Multi-Lingual and Multi-Script Database and Benchmark for Script Identification [19.021909090693505]
本稿では,スクリプト識別アルゴリズムのベンチマークのための新しいデータベースを提供する。データセットは、地元の新聞や手書きの手紙からスキャンされた1,135件の文書と、異なるネイティブライターのメモで構成されている。簡単なベンチマークは、手作りとディープラーニングの手法で提案されている。
論文参考訳（メタデータ） (2024-05-29T09:29:09Z)
Visual Speech Recognition for Languages with Limited Labeled Data using Automatic Labels from Whisper [96.43501666278316]
本稿では,複数の言語を対象とした強力な視覚音声認識(VSR)手法を提案する。言語識別と音声認識の両方が可能なWhisperモデルを用いる。自動ラベルで訓練されたVSRモデルと人称ラベルで訓練したVSRモデルの性能を比較することにより,人間対応ラベルと類似のVSR性能が得られることを示す。
論文参考訳（メタデータ） (2023-09-15T16:53:01Z)
Optical Script Identification for multi-lingual Indic-script [0.0]
本論文の目的は,スクリプト前処理とテキスト認識技術の発展について論じることである。インドには12の著名なIndicスクリプトがあり、英語とは異なり、これらのスクリプトには様々な特徴がある。
論文参考訳（メタデータ） (2023-08-10T14:02:05Z)
DeepSolo++: Let Transformer Decoder with Explicit Points Solo for Multilingual Text Spotting [112.45423990924283]
DeepSolo++は単純なDETRライクなベースラインで、テキスト検出、認識、スクリプト識別を同時に行うために、明示的なポイントを持つ1つのデコーダを単独で使用することができる。本手法は、英語のシーンだけでなく、複雑なフォント構造と中国語などの1000レベルの文字クラスで書き起こしを習得する。
論文参考訳（メタデータ） (2023-05-31T15:44:00Z)
Beyond Arabic: Software for Perso-Arabic Script Manipulation [67.31374614549237]
ペルソ・アラビア文字を使用する言語の書き起こしシステムを操作するための有限状態トランスデューサ(FST)コンポーネントとそれに対応するユーティリティのセットを提供する。ライブラリはまた、単純なFSTベースのロマン化と文字変換も提供する。
論文参考訳（メタデータ） (2023-01-26T20:37:03Z)
A New Approach for Texture based Script Identification At Block Level using Quad Tree Decomposition [38.20489458130109]
マルチスクリプトシナリオが一般的であるインドのような国では、事前にスクリプトを特定することが義務付けられます。公式手書き文字11文字に対する方向エネルギーとエントロピー分布の抽出におけるガボルウェーブレットフィルタの重要性を示す。
論文参考訳（メタデータ） (2020-09-16T02:50:03Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。