論文の概要: The LAM Dataset: A Novel Benchmark for Line-Level Handwritten Text
Recognition
- arxiv url: http://arxiv.org/abs/2208.07682v1
- Date: Tue, 16 Aug 2022 11:44:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-17 12:55:15.030566
- Title: The LAM Dataset: A Novel Benchmark for Line-Level Handwritten Text
Recognition
- Title(参考訳): LAMデータセット:ラインレベル手書き文字認識のための新しいベンチマーク
- Authors: Silvia Cascianelli, Vittorio Pippi, Martin Maarand, Marcella Cornia,
Lorenzo Baraldi, Christopher Kermorvant, Rita Cucchiara
- Abstract要約: 手書き文字認識(HTR)は、コンピュータビジョンと自然言語処理の交差点におけるオープンな問題である。
イタリア古写本のラインレベルの大規模なHTRデータセットであるLudocio Antonio Muratoriデータセットを60年以上にわたって1人の著者が編集した。
- 参考スコア(独自算出の注目度): 40.20527158935902
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Handwritten Text Recognition (HTR) is an open problem at the intersection of
Computer Vision and Natural Language Processing. The main challenges, when
dealing with historical manuscripts, are due to the preservation of the paper
support, the variability of the handwriting -- even of the same author over a
wide time-span -- and the scarcity of data from ancient, poorly represented
languages. With the aim of fostering the research on this topic, in this paper
we present the Ludovico Antonio Muratori (LAM) dataset, a large line-level HTR
dataset of Italian ancient manuscripts edited by a single author over 60 years.
The dataset comes in two configurations: a basic splitting and a date-based
splitting which takes into account the age of the author. The first setting is
intended to study HTR on ancient documents in Italian, while the second focuses
on the ability of HTR systems to recognize text written by the same writer in
time periods for which training data are not available. For both
configurations, we analyze quantitative and qualitative characteristics, also
with respect to other line-level HTR benchmarks, and present the recognition
performance of state-of-the-art HTR architectures. The dataset is available for
download at \url{https://aimagelab.ing.unimore.it/go/lam}.
- Abstract(参考訳): 手書き文字認識(HTR)は、コンピュータビジョンと自然言語処理の交差点におけるオープンな問題である。
歴史的写本を扱う際の主な課題は、紙の支持の保存、筆跡の多様性、また、同じ著者の幅広い期間にわたる変動、そして古代の表現が不十分な言語からのデータ不足などである。
本稿では,本研究の推進を目的として,60年以上にわたって1人の著者によって編集されたイタリア古写本の行単位のhtrデータセットである ludovico antonio muratori (lam) データセットを提案する。
データセットには2つの設定がある: 基本的な分割と、著者の年齢を考慮した日付ベースの分割。
第1設定は、イタリアの古代文書でHTRを研究することを目的としており、第2設定は、トレーニングデータが入手できない期間に同じ著者によって書かれたテキストを認識することに焦点を当てている。
両構成ともに,他のラインレベルのHTRベンチマークに対しても定量的および定性的な特性を解析し,最先端のHTRアーキテクチャの認識性能を示す。
データセットは \url{https://aimagelab.ing.unimore.it/go/lam} でダウンロードできる。
関連論文リスト
- Boosting Punctuation Restoration with Data Generation and Reinforcement
Learning [70.26450819702728]
触覚回復は自動音声認識(ASR)における重要な課題である
テキストの句読点とASRテキストとの相違は、ASRテキストの句読点復元システムのトレーニングにおいて、テキストのユーザビリティを制限している。
本稿では,このギャップを埋めるために,話題内テキストを活用した強化学習手法と大規模事前学習型生成言語モデルの最近の進歩を提案する。
論文 参考訳(メタデータ) (2023-07-24T17:22:04Z) - How to Choose Pretrained Handwriting Recognition Models for Single
Writer Fine-Tuning [23.274139396706264]
近年のDeep Learning-based Handwriting Text Recognition (HTR) の進歩は、現代の写本や歴史文書に顕著な性能を持つモデルを生み出している。
これらのモデルは、言語、紙の支持、インク、著者の筆跡など、独特の特徴を持つ写本に適用した場合、同じパフォーマンスを得るのに苦労している。
本稿では,手書きテキスト生成モデルを用いて得られた,大規模で実際のベンチマークデータセットと合成データセットについて考察する。
我々は,5行の実際の微調整行数で,原稿を効果的に書き起こし可能なHTRモデルを得るための,そのようなデータの最も関連性の高い特徴を定量的に示す。
論文 参考訳(メタデータ) (2023-05-04T07:00:28Z) - CiteBench: A benchmark for Scientific Citation Text Generation [69.37571393032026]
CiteBenchは引用テキスト生成のベンチマークである。
CiteBenchのコードはhttps://github.com/UKPLab/citebench.comで公開しています。
論文 参考訳(メタデータ) (2022-12-19T16:10:56Z) - PART: Pre-trained Authorship Representation Transformer [64.78260098263489]
文書を書く著者は、語彙、レジストリ、句読点、ミススペル、絵文字の使用など、テキスト内での識別情報をインプリントする。
以前の作品では、手作りのフィーチャや分類タスクを使用して著者モデルをトレーニングし、ドメイン外の著者に対するパフォーマンスの低下につながった。
セマンティクスの代わりにtextbfauthorship の埋め込みを学習するために、対照的に訓練されたモデルを提案する。
論文 参考訳(メタデータ) (2022-09-30T11:08:39Z) - Boosting Modern and Historical Handwritten Text Recognition with
Deformable Convolutions [52.250269529057014]
自由進化ページにおける手書き文字認識(HTR)は難しい画像理解課題である。
本稿では,手入力に応じて変形し,テキストの幾何学的変化に適応できる変形可能な畳み込みを導入することを提案する。
論文 参考訳(メタデータ) (2022-08-17T06:55:54Z) - Continuous Offline Handwriting Recognition using Deep Learning Models [0.0]
手書き文字認識は、自動文書画像解析の分野に大きな関心を持つオープンな問題である。
我々は,畳み込みニューラルネットワーク(CNN)とシーケンス・ツー・シーケンス(seq2seq)という,2種類のディープラーニングアーキテクチャの統合に基づく新しい認識モデルを提案する。
提案した新たなモデルでは,他の確立された方法論と競合する結果が得られる。
論文 参考訳(メタデータ) (2021-12-26T07:31:03Z) - StackMix and Blot Augmentations for Handwritten Text Recognition [0.0]
本稿では,ニューラルネットワークのアーキテクチャと,列車データ量を増やすための2つの方法について述べる。
StackMixは、印刷されたテキストに基づいて手書きテキストを編集するスタンドアロンタスクにも適用できる。
論文 参考訳(メタデータ) (2021-08-26T09:28:22Z) - One-shot Compositional Data Generation for Low Resource Handwritten Text
Recognition [10.473427493876422]
低リソース手書きテキスト認識は、わずかな注釈付きデータと非常に限られた言語情報のために難しい問題です。
本稿では,ベイズプログラム学習に基づくデータ生成手法を用いてこの問題に対処する。
大量の注釈付き画像を必要とする従来型の手法とは対照的に,各記号のサンプルを1つだけ,所望のアルファベットから生成することが可能である。
論文 参考訳(メタデータ) (2021-05-11T18:53:01Z) - Handwriting Classification for the Analysis of Art-Historical Documents [6.918282834668529]
We focus on the analysis of handwriting in scanned document from the art-historic Archive of the WPI。
視覚構造に基づいて抽出されたテキストの断片をラベル付けする手書き分類モデルを提案する。
論文 参考訳(メタデータ) (2020-11-04T13:06:46Z) - Learning to Select Bi-Aspect Information for Document-Scale Text Content
Manipulation [50.01708049531156]
我々は、テキストスタイルの転送とは逆の文書スケールのテキストコンテンツ操作という、新しい実践的なタスクに焦点を当てる。
詳細は、入力は構造化されたレコードと、別のレコードセットを記述するための参照テキストのセットである。
出力は、ソースレコードセットの部分的内容と参照の書き込みスタイルを正確に記述した要約である。
論文 参考訳(メタデータ) (2020-02-24T12:52:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。