Fugu-MT 論文翻訳(概要): Logios : An open source Greek Polytonic Optical Character Recognition system

論文の概要: Logios : An open source Greek Polytonic Optical Character Recognition system

arxiv url: http://arxiv.org/abs/2506.21474v1
Date: Thu, 26 Jun 2025 17:04:27 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-27 19:53:10.205336
Title: Logios : An open source Greek Polytonic Optical Character Recognition system
Title（参考訳）: Logios : ギリシア語多調光文字認識システム
Authors: Perifanos Konstantinos, Goutsos Dionisis,
Abstract要約: 本稿では,ギリシア語多言語テキストの正確な認識とデジタル化を目的として,光学文字認識(OCR)システムを提案する。特徴抽出のための畳み込み層とシーケンシャルラーニングのための繰り返し層を組み合わせることで、ギリシャのポリトニックスクリプトがもたらす固有の課題に対処する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In this paper, we present an Optical Character Recognition (OCR) system specifically designed for the accurate recognition and digitization of Greek polytonic texts. By leveraging the combined strengths of convolutional layers for feature extraction and recurrent layers for sequence learning, our system addresses the unique challenges posed by Greek polytonic scripts. This approach aims to overcome the limitations of traditional OCR methods, offering significant improvements in accuracy and efficiency. We release the underlying model as an open-source library and make our OCR platform available for academic use.
Abstract（参考訳）: 本稿では,ギリシア語多言語テキストの正確な認識とデジタル化を目的とした光学文字認識(OCR)システムを提案する。特徴抽出のための畳み込み層とシーケンシャルラーニングのための繰り返し層を組み合わせることで、ギリシャのポリトニックスクリプトがもたらす固有の課題に対処する。このアプローチは、従来のOCRメソッドの制限を克服し、精度と効率を大幅に改善することを目的としている。基盤となるモデルをオープンソースライブラリとしてリリースし、OCRプラットフォームを学術的に利用できるようにする。

関連論文リスト

Resonant-Tunnelling Diode Reservoir Computing System for Image Recognition [0.0]
我々は、物理貯水池コンピューティング(RC)に理想的な非線形特性を示す共鳴トンネルダイオード(RTD)に基づくニューロモルフィックコンピューティングアーキテクチャを提示し、検証する。この回路レベルのアーキテクチャは,次世代RCの原理に固執しながら,有望な性能を提供することを示す。
論文参考訳（メタデータ） (2025-07-20T23:50:32Z)
A Lightweight Multi-Module Fusion Approach for Korean Character Recognition [0.0]
SDA-Netは、堅牢な単一文字認識のための軽量で効率的なアーキテクチャである。挑戦的なOCRベンチマークで最先端の精度を実現し、推論が大幅に高速になる。
論文参考訳（メタデータ） (2025-04-08T07:50:19Z)
Boosting CNN-based Handwriting Recognition Systems with Learnable Relaxation Labeling [48.78361527873024]
本稿では,2つの異なる手法の強みを組み込んだ手書き文字認識手法を提案する。本稿では,アルゴリズムの収束を加速し,システム全体の性能を向上させるスペーシフィケーション手法を提案する。
論文参考訳（メタデータ） (2024-09-09T15:12:28Z)
Mixed Text Recognition with Efficient Parameter Fine-Tuning and Transformer [12.966765239586994]
本稿では,事前学習したOCR変換器に基づくパラメータ効率の高いハイブリッドテキストスポッティング手法であるDLoRA-TrOCRを提案する。重み分解されたDoRAモジュールを画像エンコーダに、LoRAモジュールをテキストデコーダに埋め込むことで、様々な下流タスクを効率的に微調整することができる。実験により,提案したDLoRA-TrOCRは,手書き,印刷,ストリートテキストを混合した複雑なシーン認識において,他のパラメータ効率の高い微調整手法よりも優れていた。
論文参考訳（メタデータ） (2024-04-19T09:28:16Z)
Symmetrical Linguistic Feature Distillation with CLIP for Scene Text Recognition [77.93678598476149]
CLIP-OCR(Symmetrical Linguistic Feature Distillation framework)を新たに構築する。 CLIP画像エンコーダを逆CLIPテキストエンコーダでカスケードすることにより、画像からテキストまでの特徴フローで対称構造を構築する。大規模な実験では、CLIP-OCRが6つのSTRベンチマークで平均精度93.8%で有効であることが示されている。
論文参考訳（メタデータ） (2023-10-08T04:00:20Z)
Cascaded Asymmetric Local Pattern: A Novel Descriptor for Unconstrained Facial Image Recognition and Retrieval [20.77994516381]
本稿では,顔画像の検索と認識のために,手作りの非対称局所パターン(CALP)を提案する。提案手法は特徴長が最適であり,顔画像の環境および生理的変化下での精度が著しく向上したことを示す。
論文参考訳（メタデータ） (2022-01-03T08:23:38Z)
Lexically Aware Semi-Supervised Learning for OCR Post-Correction [90.54336622024299]
世界中の多くの言語における既存の言語データの多くは、非デジタル化された書籍や文書に閉じ込められている。従来の研究は、あまり良くない言語を認識するためのニューラル・ポスト・コレクション法の有用性を実証してきた。そこで本研究では,生画像を利用した半教師付き学習手法を提案する。
論文参考訳（メタデータ） (2021-11-04T04:39:02Z)
Neural Model Reprogramming with Similarity Based Mapping for Low-Resource Spoken Command Recognition [71.96870151495536]
低リソース音声コマンド認識(SCR)のための新しいAR手法を提案する。 ARプロシージャは、(対象領域から)音響信号を修正して、事前訓練されたSCRモデルを再利用することを目的としている。提案したAR-SCRシステムについて,アラビア語,リトアニア語,マンダリン語を含む3つの低リソースSCRデータセットを用いて評価した。
論文参考訳（メタデータ） (2021-10-08T05:07:35Z)
Supervised DKRC with Images for Offline System Identification [77.34726150561087]
現代の力学系はますます非線形で複雑なものになりつつある。予測と制御のためのコンパクトで包括的な表現でこれらのシステムをモデル化するフレームワークが必要である。本手法は,教師付き学習手法を用いてこれらの基礎関数を学習する。
論文参考訳（メタデータ） (2021-09-06T04:39:06Z)
A parameter refinement method for Ptychography based on Deep Learning concepts [55.41644538483948]
伝播距離、位置誤差、部分的コヒーレンスにおける粗いパラメトリゼーションは、しばしば実験の生存性を脅かす。最新のDeep Learningフレームワークは、セットアップの不整合を自律的に補正するために使用され、ポチコグラフィーの再構築の質が向上する。我々は,elettra シンクロトロン施設のツインミックビームラインで取得した合成データセットと実データの両方でシステムをテストした。
論文参考訳（メタデータ） (2021-05-18T10:15:17Z)
Sparse Concept Coded Tetrolet Transform for Unconstrained Odia Character Recognition [0.0]
スパースの概念を符号化したテトロレットを用いて,制約なしの英数字に対する新しい画像表現手法を提案する。提案するOCRシステムは,PCA,SparsePCA,Slantletなどのスパースベース技術よりも優れた性能を示す。
論文参考訳（メタデータ） (2020-04-03T13:20:12Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。