論文の概要: Open Set Classification of Untranscribed Handwritten Documents
- arxiv url: http://arxiv.org/abs/2206.13342v1
- Date: Mon, 20 Jun 2022 20:43:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-04 02:22:00.052281
- Title: Open Set Classification of Untranscribed Handwritten Documents
- Title(参考訳): 未転写手書き文書のオープンセット分類
- Authors: Jos\'e Ram\'on Prieto, Juan Jos\'e Flores, Enrique Vidal, Alejandro H.
Toselli, David Garrido, Carlos Alonso
- Abstract要約: 重要な写本の膨大な量のデジタルページイメージが世界中のアーカイブに保存されている。
ドキュメントのクラスや型付け'はおそらくメタデータに含まれる最も重要なタグです。
技術的問題は文書の自動分類の1つであり、それぞれが書き起こされていない手書きのテキスト画像からなる。
- 参考スコア(独自算出の注目度): 56.0167902098419
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Huge amounts of digital page images of important manuscripts are preserved in
archives worldwide. The amounts are so large that it is generally unfeasible
for archivists to adequately tag most of the documents with the required
metadata so as to low proper organization of the archives and effective
exploration by scholars and the general public. The class or ``typology'' of a
document is perhaps the most important tag to be included in the metadata. The
technical problem is one of automatic classification of documents, each
consisting of a set of untranscribed handwritten text images, by the textual
contents of the images. The approach considered is based on ``probabilistic
indexing'', a relatively novel technology which allows to effectively represent
the intrinsic word-level uncertainty exhibited by handwritten text images. We
assess the performance of this approach on a large collection of complex
notarial manuscripts from the Spanish Archivo Host\'orico Provincial de
C\'adiz, with promising results.
- Abstract(参考訳): 重要な写本の大量のデジタルページイメージが世界中のアーカイブに保存されている。
その量は非常に大きいので、アーキビストが文書のほとんどを必要なメタデータで適切にタグ付けすることは、一般的に不可能であり、アーカイブの適切な組織化や、学者や一般大衆による効果的な探索が容易である。
ドキュメントのクラスまたは ``typology'' はおそらくメタデータに含まれる最も重要なタグである。
技術的問題は、文書の自動分類の1つであり、各文書は、画像のテキスト内容によって、転写されていない手書きのテキスト画像からなる。
この手法は,手書きテキスト画像が示す本質的な単語レベルの不確かさを効果的に表現できる比較的新しい技術である `probabilistic indexing' に基づいている。
本稿は,スペインのArchivo Host\'orico Provincial de C'adizの複雑な記譜集に対するこのアプローチの性能評価を行い,有望な結果を得たものである。
関連論文リスト
- Contextual Document Embeddings [77.22328616983417]
本稿では,コンテキスト化された文書埋め込みのための2つの補完手法を提案する。
第一に、文書近傍を明示的にバッチ内コンテキスト損失に組み込む別のコントラスト学習目標である。
第二に、隣接する文書情報をエンコードされた表現に明示的にエンコードする新しいコンテキストアーキテクチャ。
論文 参考訳(メタデータ) (2024-10-03T14:33:34Z) - μgat: Improving Single-Page Document Parsing by Providing Multi-Page Context [26.820913216377903]
この作品は、教皇登録書の大規模なコレクションであるRegesta Pontificum Romanumに焦点を当てている。
レゲスタは、他の文書の要約のカタログであり、場合によっては、そのような全文文書の内容に関する唯一の情報源である。
論文 参考訳(メタデータ) (2024-08-28T09:01:18Z) - Unifying Multimodal Retrieval via Document Screenshot Embedding [92.03571344075607]
Document Screenshot Embedding (DSE)は、文書のスクリーンショットを統一的な入力フォーマットとして扱う新しい検索パラダイムである。
まず、Wiki-SSというウィキペディアのウェブページのスクリーンショットをコーパスとして作成し、Natural Questionsデータセットからの質問に答える。
このようなテキスト集約的な文書検索設定では、DSEは構文解析に依存する他のテキスト検索方法と比較して、競合効果を示す。
論文 参考訳(メタデータ) (2024-06-17T06:27:35Z) - Automatic Recognition of Learning Resource Category in a Digital Library [6.865460045260549]
本稿では,文書画像分類のためのヘテロジニアス学習資源(HLR)データセットを提案する。
このアプローチでは、個々の学習リソースを構成文書イメージ(シート)に分解する。
これらの画像はOCRツールを通じて処理され、テキスト表現を抽出する。
論文 参考訳(メタデータ) (2023-11-28T07:48:18Z) - Innovative Methods for Non-Destructive Inspection of Handwritten
Documents [0.0]
本稿では,画像処理と深層学習技術を用いて,本文の本質的な尺度を抽出・解析できるフレームワークを提案する。
比較対象文書の特徴ベクトル間のユークリッド距離を定量化することにより、著者を特定することができる。
実験により,異なる執筆媒体の著者を客観的に決定できる手法が得られた。
論文 参考訳(メタデータ) (2023-10-17T12:45:04Z) - DocAligner: Annotating Real-world Photographic Document Images by Simply
Taking Pictures [24.76258692552673]
そこで本稿では,手作業によるアノテーション処理を簡易に表現するDocAlignerを提案する。
写真用文書画像とその清潔な画像との密接な対応を確立することで、これを実現する。
ドキュメントイメージの特徴を考えると、DocAlignerはいくつかの革新的な特徴を取り入れている。
論文 参考訳(メタデータ) (2023-06-09T08:29:15Z) - DocMAE: Document Image Rectification via Self-supervised Representation
Learning [144.44748607192147]
文書画像修正のための新しい自己教師型フレームワークDocMAEを提案する。
まず、背景を除いた文書画像のランダムなパッチをマスクし、欠落したピクセルを再構成する。
このような自己教師型学習手法により、ネットワークは変形文書の本質的な構造を学習することが奨励される。
論文 参考訳(メタデータ) (2023-04-20T14:27:15Z) - Deep Unrestricted Document Image Rectification [110.61517455253308]
文書画像修正のための新しい統合フレームワークDocTr++を提案する。
我々は,階層型エンコーダデコーダ構造を多スケール表現抽出・解析に適用することにより,元のアーキテクチャをアップグレードする。
実際のテストセットとメトリクスをコントリビュートして、修正品質を評価します。
論文 参考訳(メタデータ) (2023-04-18T08:00:54Z) - DocScanner: Robust Document Image Rectification with Progressive
Learning [162.03694280524084]
この研究はDocScannerという、文書画像の修正のための新しいディープネットワークアーキテクチャを提示する。
DocScannerは、修正されたイメージの1つの見積を維持し、再帰的なアーキテクチャで徐々に修正される。
反復的な改善によりDocScannerは堅牢で優れたパフォーマンスに収束し、軽量なリカレントアーキテクチャにより実行効率が保証される。
論文 参考訳(メタデータ) (2021-10-28T09:15:02Z) - Handwriting Classification for the Analysis of Art-Historical Documents [6.918282834668529]
We focus on the analysis of handwriting in scanned document from the art-historic Archive of the WPI。
視覚構造に基づいて抽出されたテキストの断片をラベル付けする手書き分類モデルを提案する。
論文 参考訳(メタデータ) (2020-11-04T13:06:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。