論文の概要: Application of deep learning approaches for medieval historical documents transcription
- arxiv url: http://arxiv.org/abs/2512.18865v1
- Date: Sun, 21 Dec 2025 19:43:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-23 18:54:32.535882
- Title: Application of deep learning approaches for medieval historical documents transcription
- Title(参考訳): 中世史料の書写における深層学習手法の応用
- Authors: Maksym Voloshchuk, Bohdana Zarembovska, Mykola Kozlenko,
- Abstract要約: 本稿では,9世紀から11世紀の手書きラテン文字文書からテキスト情報を抽出する深層学習手法を提案する。
このアプローチは中世の文書に固有の性質を考慮に入れている。
実装はGitHubリポジトリで公開されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Handwritten text recognition and optical character recognition solutions show excellent results with processing data of modern era, but efficiency drops with Latin documents of medieval times. This paper presents a deep learning method to extract text information from handwritten Latin-language documents of the 9th to 11th centuries. The approach takes into account the properties inherent in medieval documents. The paper provides a brief introduction to the field of historical document transcription, a first-sight analysis of the raw data, and the related works and studies. The paper presents the steps of dataset development for further training of the models. The explanatory data analysis of the processed data is provided as well. The paper explains the pipeline of deep learning models to extract text information from the document images, from detecting objects to word recognition using classification models and embedding word images. The paper reports the following results: recall, precision, F1 score, intersection over union, confusion matrix, and mean string distance. The plots of the metrics are also included. The implementation is published on the GitHub repository.
- Abstract(参考訳): 手書き文字認識と光学文字認識ソリューションは、現代の処理データでは優れた結果を示すが、中世のラテン文書では効率が低下する。
本稿では,9世紀から11世紀の手書きラテン文字文書からテキスト情報を抽出する深層学習手法を提案する。
このアプローチは中世の文書に固有の性質を考慮に入れている。
本稿では,歴史文書の書き起こしの分野,原資料の初歩的分析,関連研究について概説する。
本稿では、モデルをさらに訓練するためのデータセット開発手順について述べる。
また、処理されたデータの説明データ解析も提供する。
本稿では,文書画像からテキスト情報を抽出する深層学習モデルのパイプラインについて解説する。
本報告では, 記憶, 精度, F1スコア, 結合上の交叉, 混乱行列, 平均弦距離について報告する。
メトリクスのプロットも含んでいる。
実装はGitHubリポジトリで公開されている。
関連論文リスト
- Contextual Document Embeddings [77.22328616983417]
本稿では,コンテキスト化された文書埋め込みのための2つの補完手法を提案する。
第一に、文書近傍を明示的にバッチ内コンテキスト損失に組み込む別のコントラスト学習目標である。
第二に、隣接する文書情報をエンコードされた表現に明示的にエンコードする新しいコンテキストアーキテクチャ。
論文 参考訳(メタデータ) (2024-10-03T14:33:34Z) - A Novel Dataset for Non-Destructive Inspection of Handwritten Documents [0.0]
法医学的手書き検査は、原稿の著者を適切に定義または仮説化するために手書きの文書を調べることを目的としている。
2つのサブセットからなる新しい挑戦的データセットを提案する。第1は古典的なペンと紙で書かれた21の文書で、後者は後にデジタル化され、タブレットなどの一般的なデバイスで直接取得される。
提案したデータセットの予備的な結果は、第1サブセットで90%の分類精度が得られることを示している。
論文 参考訳(メタデータ) (2024-01-09T09:25:58Z) - Prompt me a Dataset: An investigation of text-image prompting for
historical image dataset creation using foundation models [0.9065034043031668]
基礎モデルを用いた歴史資料からの画像抽出のためのパイプラインを提案する。
我々は,テキスト画像のプロンプトと,それらが複雑度の異なる人文科学データセットに与える影響を評価する。
論文 参考訳(メタデータ) (2023-09-04T15:37:03Z) - DocLangID: Improving Few-Shot Training to Identify the Language of
Historical Documents [7.535751594024775]
言語識別とは、文書中の文章の言語を認識するタスクを指す。
本稿では,未ラベルの歴史的文書の言語を識別するための移動学習手法であるDocLangIDを提案する。
論文 参考訳(メタデータ) (2023-05-03T15:45:30Z) - Digital Peter: Dataset, Competition and Handwriting Recognition Methods [0.685068326729525]
本稿では,ピーター・ザ・グレートの原稿の新しいデータセットについて述べる。
994の画像と歴史的文書の行に対応するテキストファイルで構成されています。
論文 参考訳(メタデータ) (2021-03-16T22:37:22Z) - Handwriting Classification for the Analysis of Art-Historical Documents [6.918282834668529]
We focus on the analysis of handwriting in scanned document from the art-historic Archive of the WPI。
視覚構造に基づいて抽出されたテキストの断片をラベル付けする手書き分類モデルを提案する。
論文 参考訳(メタデータ) (2020-11-04T13:06:46Z) - Neural Deepfake Detection with Factual Structure of Text [78.30080218908849]
テキストのディープフェイク検出のためのグラフベースモデルを提案する。
我々のアプローチは、ある文書の事実構造をエンティティグラフとして表現する。
本モデルでは,機械生成テキストと人文テキストの事実構造の違いを識別することができる。
論文 参考訳(メタデータ) (2020-10-15T02:35:31Z) - Learning to Select Bi-Aspect Information for Document-Scale Text Content
Manipulation [50.01708049531156]
我々は、テキストスタイルの転送とは逆の文書スケールのテキストコンテンツ操作という、新しい実践的なタスクに焦点を当てる。
詳細は、入力は構造化されたレコードと、別のレコードセットを記述するための参照テキストのセットである。
出力は、ソースレコードセットの部分的内容と参照の書き込みスタイルを正確に記述した要約である。
論文 参考訳(メタデータ) (2020-02-24T12:52:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。