論文の概要: HANA: A HAndwritten NAme Database for Offline Handwritten Text
Recognition
- arxiv url: http://arxiv.org/abs/2101.10862v1
- Date: Fri, 22 Jan 2021 16:23:01 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-20 17:17:01.221720
- Title: HANA: A HAndwritten NAme Database for Offline Handwritten Text
Recognition
- Title(参考訳): HANA: オフライン手書き文字認識のためのHand written NAme Database
- Authors: Christian M. Dahl, Torben Johansen, Emil N. S{\o}rensen, Simon
Wittrock
- Abstract要約: 本稿では,手書き語群の1100万枚以上の画像からなる大規模データベースを新たに構築した。
さらに,スキャンされた文書から個人名を自動的に書き起こせるディープラーニングモデルのベンチマーク結果も提示する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Methods for linking individuals across historical data sets, typically in
combination with AI based transcription models, are developing rapidly.
Probably the single most important identifier for linking is personal names.
However, personal names are prone to enumeration and transcription errors and
although modern linking methods are designed to handle such challenges these
sources of errors are critical and should be minimized. For this purpose,
improved transcription methods and large-scale databases are crucial
components. This paper describes and provides documentation for HANA, a newly
constructed large-scale database which consists of more than 1.1 million images
of handwritten word-groups. The database is a collection of personal names,
containing more than 105 thousand unique names with a total of more than 3.3
million examples. In addition, we present benchmark results for deep learning
models that automatically can transcribe the personal names from the scanned
documents. Focusing mainly on personal names, due to its vital role in linking,
we hope to foster more sophisticated, accurate, and robust models for
handwritten text recognition through making more challenging large-scale
databases publicly available. This paper describes the data source, the
collection process, and the image-processing procedures and methods that are
involved in extracting the handwritten personal names and handwritten text in
general from the forms.
- Abstract(参考訳): 個人を歴史的データセットにリンクする方法は、典型的にはAIベースの転写モデルと組み合わせて、急速に発展している。
おそらくリンクする上で最も重要な識別子は、個人名である。
しかし、個人名は列挙や書き起こしの誤りが多いため、現代のリンク手法はそのような問題に対処するために設計されているが、これらのエラー源は重要であり、最小化されるべきである。
この目的のために、改良された転写法と大規模データベースが重要なコンポーネントである。
本論文は,手書きの単語群の111万以上の画像からなる,新たに構築された大規模データベースhanaについて記述し,その資料を提供する。
データベースは1万5千以上の個人名と合計330万以上のサンプルを含む個人名を集めたデータベースである。
さらに,スキャンされた文書から個人名を自動的に書き起こせるディープラーニングモデルのベンチマーク結果も提示する。
主に個人名に焦点をあてることで、より高度で正確で堅牢な手書き文字認識モデルを育成し、より挑戦的な大規模データベースを公開したいと思っています。
本稿では,手書きの個人名や手書きのテキストを形式から抽出するためのデータソース,収集プロセス,画像処理手順および手法について述べる。
関連論文リスト
- Nuremberg Letterbooks: A Multi-Transcriptional Dataset of Early 15th Century Manuscripts for Document Analysis [4.660229623034816]
ニュルンベルク・レターブックス・データセットは15世紀初頭の史料である。
データセットには、1711のラベル付きページを含む4冊の書籍が含まれている。
論文 参考訳(メタデータ) (2024-11-11T17:08:40Z) - Multicultural Name Recognition For Previously Unseen Names [65.268245109828]
本論文は、人名の認識を改善することを目的としており、それは、誰かが生まれたり、名前を変えたりする際にも、成長できる多様なカテゴリーである。
私は103か国の名前を見て、モデルが異なる文化の名前でどれだけうまく機能するかを比較します。
文字入力と単語入力を組み合わせたモデルの方が単語のみのモデルより優れており,従来のNERモデルと比較して精度が向上する可能性がある。
論文 参考訳(メタデータ) (2024-01-23T17:58:38Z) - Summarization-Based Document IDs for Generative Retrieval with Language Models [65.11811787587403]
要約に基づく文書IDを導入し、各文書のIDは抽出的要約または抽象的キーフレーズから構成される。
以上の結果から,ACIDの使用はトップ10とトップ20のリコールをそれぞれ15.6%,14.4%(相対)改善することがわかった。
また, 抽出IDは, MSMARCOのスニペットではなく, ウィキペディア記事の抽象IDよりも優れていた。
論文 参考訳(メタデータ) (2023-11-14T23:28:36Z) - NameGuess: Column Name Expansion for Tabular Data [28.557115822407294]
我々は列名を自然言語生成問題として拡張するための新しいタスクであるNameGuessを紹介した。
384K短縮カラムペアのトレーニングデータセットを作成します。
表の内容や列のヘッダー名を条件にすることで、自動回帰言語モデルを強化する。
論文 参考訳(メタデータ) (2023-10-19T23:11:37Z) - Key-value information extraction from full handwritten pages [0.2062593640149624]
デジタル化された手書き文書から情報を取り出すためのトランスフォーマーに基づく手法を提案する。
我々のアプローチは、1つのモデルにおいて、機能抽出、手書き認識、名前付きエンティティ認識という2つのモデルによってこれまで実行された異なるステップを組み合わせています。
我々は,3つの公開データベース(IAM,ESPOSALLES,POPP)上での最先端の手法と比較し,過去の3つのデータセットのパフォーマンスを上回った。
論文 参考訳(メタデータ) (2023-04-26T13:06:55Z) - Disambiguation of Company names via Deep Recurrent Networks [101.90357454833845]
企業名文字列の埋め込みである教師付き学習を通じて,Siamese LSTM Network を抽出する手法を提案する。
私たちは、ラベル付けされるサンプルを優先するActive Learningアプローチが、より効率的な全体的な学習パイプラインをもたらす方法を分析します。
論文 参考訳(メタデータ) (2023-03-07T15:07:57Z) - Diff-Font: Diffusion Model for Robust One-Shot Font Generation [110.45944936952309]
Diff-Fontという拡散モデルに基づく新しいワンショットフォント生成手法を提案する。
提案するモデルは,フォントライブラリ全体を生成することを目的として,参照として1つのサンプルのみを与える。
十分に訓練されたDiff-Fontは、フォントギャップやフォントのバリエーションに対して堅牢であるだけでなく、難しい文字生成において有望なパフォーマンスを実現している。
論文 参考訳(メタデータ) (2022-12-12T13:51:50Z) - The Fellowship of the Authors: Disambiguating Names from Social Network
Context [2.3605348648054454]
各エンティティに関する広範なテキスト記述を持つオーソリティリストは、欠落しており、曖昧な名前のエンティティである。
BERTをベースとした参照表現と,さまざまなグラフ誘導戦略を組み合わせて,教師付きクラスタ推論手法と教師なしクラスタ推論手法を実験する。
ドメイン内言語モデルの事前学習は,特により大きなコーパスに対して,参照表現を大幅に改善できることがわかった。
論文 参考訳(メタデータ) (2022-08-31T21:51:55Z) - LDKP: A Dataset for Identifying Keyphrases from Long Scientific
Documents [48.84086818702328]
テキスト文書からキーフレーズ(KP)を識別することは、自然言語処理と情報検索の基本的な課題である。
このタスクのベンチマークデータセットの大部分は、ドキュメントのタイトルと抽象情報のみを含む科学領域からのものだ。
人間が書いた要約はほとんどの文書では利用できないし、文書はほとんど常に長く、KPの比率はタイトルと抽象の限られた文脈を超えて直接見つかる。
論文 参考訳(メタデータ) (2022-03-29T08:44:57Z) - Letter-level Online Writer Identification [86.13203975836556]
我々は文字レベルのオンラインライタIDという新たな問題に焦点をあてる。
主な課題は、しばしば異なるスタイルで手紙を書くことである。
我々はこの問題をオンライン書記スタイルのばらつき(Var-O-Styles)と呼ぶ。
論文 参考訳(メタデータ) (2021-12-06T07:21:53Z) - NameRec*: Highly Accurate and Fine-grained Person Name Recognition [11.43547342030705]
NameRec*タスクは、高精度できめ細やかな人名認識を目指します。
CogNNは、文内のコンテキストと名前形式の豊富なトレーニング信号を完全に探索します。
IsBERTは、重なり合う入力プロセッサと、双方向に重なり合うコンテキスト埋め込み学習を備えた文間エンコーダを備える。
論文 参考訳(メタデータ) (2021-03-21T10:35:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。