論文の概要: Logios : An open source Greek Polytonic Optical Character Recognition system
- arxiv url: http://arxiv.org/abs/2506.21474v1
- Date: Thu, 26 Jun 2025 17:04:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-27 19:53:10.205336
- Title: Logios : An open source Greek Polytonic Optical Character Recognition system
- Title(参考訳): Logios : ギリシア語多調光文字認識システム
- Authors: Perifanos Konstantinos, Goutsos Dionisis,
- Abstract要約: 本稿では,ギリシア語多言語テキストの正確な認識とデジタル化を目的として,光学文字認識(OCR)システムを提案する。
特徴抽出のための畳み込み層とシーケンシャルラーニングのための繰り返し層を組み合わせることで、ギリシャのポリトニックスクリプトがもたらす固有の課題に対処する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we present an Optical Character Recognition (OCR) system specifically designed for the accurate recognition and digitization of Greek polytonic texts. By leveraging the combined strengths of convolutional layers for feature extraction and recurrent layers for sequence learning, our system addresses the unique challenges posed by Greek polytonic scripts. This approach aims to overcome the limitations of traditional OCR methods, offering significant improvements in accuracy and efficiency. We release the underlying model as an open-source library and make our OCR platform available for academic use.
- Abstract(参考訳): 本稿では,ギリシア語多言語テキストの正確な認識とデジタル化を目的とした光学文字認識(OCR)システムを提案する。
特徴抽出のための畳み込み層とシーケンシャルラーニングのための繰り返し層を組み合わせることで、ギリシャのポリトニックスクリプトがもたらす固有の課題に対処する。
このアプローチは、従来のOCRメソッドの制限を克服し、精度と効率を大幅に改善することを目的としている。
基盤となるモデルをオープンソースライブラリとしてリリースし、OCRプラットフォームを学術的に利用できるようにする。
関連論文リスト
- A Lightweight Multi-Module Fusion Approach for Korean Character Recognition [0.0]
SDA-Netは、堅牢な単一文字認識のための軽量で効率的なアーキテクチャである。
挑戦的なOCRベンチマークで最先端の精度を実現し、推論が大幅に高速になる。
論文 参考訳(メタデータ) (2025-04-08T07:50:19Z) - Boosting CNN-based Handwriting Recognition Systems with Learnable Relaxation Labeling [48.78361527873024]
本稿では,2つの異なる手法の強みを組み込んだ手書き文字認識手法を提案する。
本稿では,アルゴリズムの収束を加速し,システム全体の性能を向上させるスペーシフィケーション手法を提案する。
論文 参考訳(メタデータ) (2024-09-09T15:12:28Z) - Mixed Text Recognition with Efficient Parameter Fine-Tuning and Transformer [12.966765239586994]
本稿では,事前学習したOCR変換器に基づくパラメータ効率の高いハイブリッドテキストスポッティング手法であるDLoRA-TrOCRを提案する。
重み分解されたDoRAモジュールを画像エンコーダに、LoRAモジュールをテキストデコーダに埋め込むことで、様々な下流タスクを効率的に微調整することができる。
実験により,提案したDLoRA-TrOCRは,手書き,印刷,ストリートテキストを混合した複雑なシーン認識において,他のパラメータ効率の高い微調整手法よりも優れていた。
論文 参考訳(メタデータ) (2024-04-19T09:28:16Z) - Cascaded Asymmetric Local Pattern: A Novel Descriptor for Unconstrained
Facial Image Recognition and Retrieval [20.77994516381]
本稿では,顔画像の検索と認識のために,手作りの非対称局所パターン(CALP)を提案する。
提案手法は特徴長が最適であり,顔画像の環境および生理的変化下での精度が著しく向上したことを示す。
論文 参考訳(メタデータ) (2022-01-03T08:23:38Z) - Lexically Aware Semi-Supervised Learning for OCR Post-Correction [90.54336622024299]
世界中の多くの言語における既存の言語データの多くは、非デジタル化された書籍や文書に閉じ込められている。
従来の研究は、あまり良くない言語を認識するためのニューラル・ポスト・コレクション法の有用性を実証してきた。
そこで本研究では,生画像を利用した半教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2021-11-04T04:39:02Z) - Neural Model Reprogramming with Similarity Based Mapping for
Low-Resource Spoken Command Recognition [71.96870151495536]
低リソース音声コマンド認識(SCR)のための新しいAR手法を提案する。
ARプロシージャは、(対象領域から)音響信号を修正して、事前訓練されたSCRモデルを再利用することを目的としている。
提案したAR-SCRシステムについて,アラビア語,リトアニア語,マンダリン語を含む3つの低リソースSCRデータセットを用いて評価した。
論文 参考訳(メタデータ) (2021-10-08T05:07:35Z) - Supervised DKRC with Images for Offline System Identification [77.34726150561087]
現代の力学系はますます非線形で複雑なものになりつつある。
予測と制御のためのコンパクトで包括的な表現でこれらのシステムをモデル化するフレームワークが必要である。
本手法は,教師付き学習手法を用いてこれらの基礎関数を学習する。
論文 参考訳(メタデータ) (2021-09-06T04:39:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。