論文の概要: Evaluating the Impact of Khmer Font Types on Text Recognition
- arxiv url: http://arxiv.org/abs/2506.23963v1
- Date: Mon, 30 Jun 2025 15:35:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 21:27:54.12707
- Title: Evaluating the Impact of Khmer Font Types on Text Recognition
- Title(参考訳): Khmerフォントタイプがテキスト認識に与える影響の評価
- Authors: Vannkinh Nom, Souhail Bakkali, Muhammad Muzzamil Luqman, Mickael Coustaty, Jean-Marc Ogier,
- Abstract要約: Khmer, Odor MeanChey, Siemreap, Sithi Manuss, Battambangは高い精度で、iSeth First, Bayon, Dangrekは成績が悪い。
本研究は,Khmerテキスト認識の最適化においてフォント選択が重要であることを明らかにする。
- 参考スコア(独自算出の注目度): 0.7743559889795233
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Text recognition is significantly influenced by font types, especially for complex scripts like Khmer. The variety of Khmer fonts, each with its unique character structure, presents challenges for optical character recognition (OCR) systems. In this study, we evaluate the impact of 19 randomly selected Khmer font types on text recognition accuracy using Pytesseract. The fonts include Angkor, Battambang, Bayon, Bokor, Chenla, Dangrek, Freehand, Kh Kompong Chhnang, Kh SN Kampongsom, Khmer, Khmer CN Stueng Songke, Khmer Savuth Pen, Metal, Moul, Odor MeanChey, Preah Vihear, Siemreap, Sithi Manuss, and iSeth First. Our comparison of OCR performance across these fonts reveals that Khmer, Odor MeanChey, Siemreap, Sithi Manuss, and Battambang achieve high accuracy, while iSeth First, Bayon, and Dangrek perform poorly. This study underscores the critical importance of font selection in optimizing Khmer text recognition and provides valuable insights for developing more robust OCR systems.
- Abstract(参考訳): テキスト認識はフォントタイプ、特にKhmerのような複雑なスクリプトに大きく影響を受けている。
Khmerフォントは、それぞれ独自の文字構造を持ち、光学文字認識(OCR)システムの課題を示す。
本研究では,19種類のKhmerフォントがテキスト認識精度に与える影響をPytesseractを用いて評価した。
フォントには、Angkor, Battambang, Bayon, Bokor, Chenla, Dangrek, Freehand, Kh Kompong Chhnang, Kh SN Kampongsom, Khmer, Khmer CN Stueng Songke, Khmer Savuth Pen, Metal, Moul, Odor MeanChey, Preah Vihear, Siemreap, Sithi Manuss, iSeth Firstがある。
これらのフォント間でOCRのパフォーマンスを比較すると、Khmer, Odor MeanChey, Siemreap, Sithi Manuss, Battambangは高い精度で、iSeth First, Bayon, Dangrekは性能が劣っていることが分かる。
本研究は、Khmerテキスト認識の最適化におけるフォント選択の重要性を強調し、より堅牢なOCRシステムの開発に有用な洞察を提供する。
関連論文リスト
- Skeleton and Font Generation Network for Zero-shot Chinese Character Generation [53.08596064763731]
そこで我々は,より堅牢な漢字フォント生成を実現するために,新しいSkeleton and Font Generation Network (SFGN)を提案する。
ミススペル文字について実験を行い、その大部分は共通文字とわずかに異なる。
提案手法は、生成した画像の有効性を視覚的に実証し、現在最先端のフォント生成方法より優れていることを示す。
論文 参考訳(メタデータ) (2025-01-14T12:15:49Z) - A Survey on Importance of Homophones Spelling Correction Model for Khmer Authors [0.0]
ホモフォンは発音の類似性や意味や綴りが異なるため、あらゆる言語の著者にとって重要な課題である。
本研究は、Khmer著者がホモフォンを執筆に用いた際の困難に対処することを目的としている。
論文 参考訳(メタデータ) (2024-11-11T10:07:03Z) - KhmerST: A Low-Resource Khmer Scene Text Detection and Recognition Benchmark [1.5409800688911346]
我々は,1,544人の専門家による注釈付き画像を含む,最初のKhmerシーンテキストデータセットを紹介した。
この多様なデータセットには、平らなテキスト、起立したテキスト、照度の低いテキスト、遠くのポリゴン、部分的に不明瞭なテキストが含まれる。
論文 参考訳(メタデータ) (2024-10-23T21:04:24Z) - Design and Development of a Framework For Stroke-Based Handwritten Gujarati Font Generation [0.0]
本稿では,手書き文字のバリエーションを模倣して,手書きフォントをグジャラート文字で生成するための枠組みを設計することを目的とする。
学習段階では、Gujaratiスクリプトを解析し、各文字を設計するためのルールを定式化する。
生成フェーズでは、ユーザは文字の小さなサブセットを提供し、システムは残りの文字グリフを自動的に生成する。
論文 参考訳(メタデータ) (2024-04-04T08:04:00Z) - Chinese Text Recognition with A Pre-Trained CLIP-Like Model Through
Image-IDS Aligning [61.34060587461462]
中国語テキスト認識(CTR)のための2段階フレームワークを提案する。
印刷文字画像とIdeographic Description Sequences (IDS) の整列によるCLIP様モデルの事前学習を行う。
この事前学習段階は、漢字を認識する人間をシミュレートし、各文字の標準表現を得る。
学習された表現はCTRモデルを監督するために使用され、従来の単一文字認識はテキストライン認識に改善される。
論文 参考訳(メタデータ) (2023-09-03T05:33:16Z) - OCRBench: On the Hidden Mystery of OCR in Large Multimodal Models [122.27878464009181]
テキスト関連視覚タスクにおいて, GPT4V や Gemini などの大規模マルチモーダルモデルの包括的評価を行った。
OCRBenchには29のデータセットがあり、最も包括的なOCR評価ベンチマークが利用できる。
論文 参考訳(メタデータ) (2023-05-13T11:28:37Z) - User-Centric Evaluation of OCR Systems for Kwak'wala [92.73847703011353]
OCRを利用すると、文化的に価値ある文書の書き起こしに費やした時間を50%以上削減できることを示す。
この結果から,OCRツールが下流言語ドキュメントや再生作業において持つ潜在的なメリットが示された。
論文 参考訳(メタデータ) (2023-02-26T21:41:15Z) - Kurdish Handwritten Character Recognition using Deep Learning Techniques [26.23274417985375]
本稿では、深層学習技術を用いてクルド語アルファベットの文字を認識可能なモデルの設計と開発を試みる。
4000万枚以上の画像を含む、手書きのクルド文字のための包括的なデータセットが作成された。
結果,精度は96%,トレーニング精度は97%であった。
論文 参考訳(メタデータ) (2022-10-18T16:48:28Z) - Comprehensive Benchmark Datasets for Amharic Scene Text Detection and
Recognition [56.048783994698425]
Ethiopic/Amharicスクリプトはアフリカ最古の書記システムの一つで、東アフリカで少なくとも23の言語に対応している。
アムハラ語の表記体系である Abugida は282音節、15句の句読点、20の数字を持つ。
HUST-ART, HUST-AST, ABE, Tana という,自然界におけるアムハラ文字の検出と認識のための総合的な公開データセットを提示した。
論文 参考訳(メタデータ) (2022-03-23T03:19:35Z) - An Efficient Language-Independent Multi-Font OCR for Arabic Script [0.0]
本稿では,アラビア文字のスキャン画像を入力として取り出し,対応するデジタル文書を生成する完全アラビアOCRシステムを提案する。
また,現在最先端のセグメンテーションアルゴリズムよりも優れたフォント非依存文字アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-09-18T22:57:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。