論文の概要: Transformer-Based Approach for Joint Handwriting and Named Entity
Recognition in Historical documents
- arxiv url: http://arxiv.org/abs/2112.04189v1
- Date: Wed, 8 Dec 2021 09:26:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-09 13:48:00.456626
- Title: Transformer-Based Approach for Joint Handwriting and Named Entity
Recognition in Historical documents
- Title(参考訳): 歴史的文書における共同手書きと名前付きエンティティ認識のためのトランスフォーマーに基づくアプローチ
- Authors: Ahmed Cheikh Rouhoua, Marwa Dhiaf, Yousri Kessentini, Sinda Ben Salem
- Abstract要約: 本研究は,手書き文書における名前付きエンティティ認識にトランスフォーマネットワークを採用した最初のアプローチを示す。
我々は,Esposalles データベースを用いた ICDAR 2017 Information extract コンペティションにおいて,新しい最先端性能を実現する。
- 参考スコア(独自算出の注目度): 1.7491858164568674
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The extraction of relevant information carried out by named entities in
handwriting documents is still a challenging task. Unlike traditional
information extraction approaches that usually face text transcription and
named entity recognition as separate subsequent tasks, we propose in this paper
an end-to-end transformer-based approach to jointly perform these two tasks.
The proposed approach operates at the paragraph level, which brings two main
benefits. First, it allows the model to avoid unrecoverable early errors due to
line segmentation. Second, it allows the model to exploit larger bi-dimensional
context information to identify the semantic categories, reaching a higher
final prediction accuracy. We also explore different training scenarios to show
their effect on the performance and we demonstrate that a two-stage learning
strategy can make the model reach a higher final prediction accuracy. As far as
we know, this work presents the first approach that adopts the transformer
networks for named entity recognition in handwritten documents. We achieve the
new state-of-the-art performance in the ICDAR 2017 Information Extraction
competition using the Esposalles database, for the complete task, even though
the proposed technique does not use any dictionaries, language modeling, or
post-processing.
- Abstract(参考訳): 手書き文書における名前付きエンティティによる関連情報の抽出は依然として困難な課題である。
従来のテキスト転写やエンティティ認識を別個のタスクとして扱う従来の情報抽出手法とは異なり,本稿ではこれら2つのタスクを共同で実行するためのエンドツーエンドトランスフォーマー方式を提案する。
提案手法は段落レベルで動作しており、主な利点は2つある。
第一に、ラインセグメンテーションによる回復不可能な早期エラーを避けることができる。
第二に、モデルがより大きな2次元のコンテキスト情報を活用して意味カテゴリーを識別し、最終的な予測精度が向上する。
また、2段階の学習戦略によってモデルの最終的な予測精度を高めることができることを示す。
私たちが知る限り、この研究は手書き文書における名前付きエンティティ認識にトランスフォーマーネットワークを採用する最初のアプローチを示す。
提案手法では辞書や言語モデリング,ポストプロセッシングを一切使用していないにもかかわらず,esposallesデータベースを用いたicdar 2017情報抽出コンペティションにおいて,新たな最先端性能を実現する。
関連論文リスト
- Contextual Document Embeddings [77.22328616983417]
本稿では,コンテキスト化された文書埋め込みのための2つの補完手法を提案する。
第一に、文書近傍を明示的にバッチ内コンテキスト損失に組み込む別のコントラスト学習目標である。
第二に、隣接する文書情報をエンコードされた表現に明示的にエンコードする新しいコンテキストアーキテクチャ。
論文 参考訳(メタデータ) (2024-10-03T14:33:34Z) - Information Extraction in Domain and Generic Documents: Findings from
Heuristic-based and Data-driven Approaches [0.0]
自然言語処理において,情報抽出が重要な役割を担っている。
IEタスクに対するドキュメントのジャンルと長さの影響。
両方のタスクで圧倒的なパフォーマンスを示す方法はひとつもなかった。
論文 参考訳(メタデータ) (2023-06-30T20:43:27Z) - Key-value information extraction from full handwritten pages [0.2062593640149624]
デジタル化された手書き文書から情報を取り出すためのトランスフォーマーに基づく手法を提案する。
我々のアプローチは、1つのモデルにおいて、機能抽出、手書き認識、名前付きエンティティ認識という2つのモデルによってこれまで実行された異なるステップを組み合わせています。
我々は,3つの公開データベース(IAM,ESPOSALLES,POPP)上での最先端の手法と比較し,過去の3つのデータセットのパフォーマンスを上回った。
論文 参考訳(メタデータ) (2023-04-26T13:06:55Z) - Towards End-to-end Handwritten Document Recognition [0.0]
手書き文字認識は、その多くの応用のために過去数十年にわたって広く研究されてきた。
本稿では,文書全体の手書きテキスト認識をエンドツーエンドで行うことで,これらの課題に対処することを提案する。
RIMES 2011, IAM, READ 2016 データセットの段落レベルでの最先端結果に到達し, これらのデータセットのラインレベル状態よりも優れていた。
論文 参考訳(メタデータ) (2022-09-30T10:31:22Z) - Incorporating Task-specific Concept Knowledge into Script Learning [68.95195207989605]
私たちは、Goal-Oriented Script Completionの新しいタスクであるTetrisを紹介します。
より現実的で一般的な設定で、入力にはゴールだけでなく、追加のユーザコンテキストも含まれる。
性能向上に2つの手法を用いる新しい手法を提案する。
論文 参考訳(メタデータ) (2022-08-31T18:55:22Z) - A Span Extraction Approach for Information Extraction on Visually-Rich
Documents [2.3131309703965135]
視覚豊かな文書(VRD)を事前学習する言語モデルの能力向上のための新しいアプローチを提案する。
まず、クエリベースの新しいIEモデルを導入し、一般的に使用されるシーケンスラベリングアプローチの代わりにスパン抽出の定式化を採用する。
また、文書内の意味的エンティティ間の関係をモデル化することに焦点を当てた新しいトレーニングタスクを提案する。
論文 参考訳(メタデータ) (2021-06-02T06:50:04Z) - Focused Attention Improves Document-Grounded Generation [111.42360617630669]
文書基盤生成は、文書に提供される情報を用いてテキスト生成を改善するタスクである。
本研究はwikipedia更新生成タスクと対話応答生成という2つの異なる文書基底生成タスクに焦点を当てている。
論文 参考訳(メタデータ) (2021-04-26T16:56:29Z) - Incomplete Utterance Rewriting as Semantic Segmentation [57.13577518412252]
本稿では, セマンティックセグメンテーションタスクとして定式化する, 斬新で広範囲なアプローチを提案する。
スクラッチから生成する代わりに、このような定式化は編集操作を導入し、単語レベルの編集行列の予測として問題を形作る。
私たちのアプローチは、推論における標準的なアプローチの4倍高速です。
論文 参考訳(メタデータ) (2020-09-28T09:29:49Z) - Detecting Ongoing Events Using Contextual Word and Sentence Embeddings [110.83289076967895]
本稿では,OED(Ongoing Event Detection)タスクを紹介する。
目的は、歴史、未来、仮説、あるいは新しいものでも現在のものでもない他の形式や出来事に対してのみ、進行中のイベントの言及を検出することである。
構造化されていないテキストから進行中のイベントに関する構造化情報を抽出する必要があるアプリケーションは、OEDシステムを利用することができる。
論文 参考訳(メタデータ) (2020-07-02T20:44:05Z) - Learning to Select Bi-Aspect Information for Document-Scale Text Content
Manipulation [50.01708049531156]
我々は、テキストスタイルの転送とは逆の文書スケールのテキストコンテンツ操作という、新しい実践的なタスクに焦点を当てる。
詳細は、入力は構造化されたレコードと、別のレコードセットを記述するための参照テキストのセットである。
出力は、ソースレコードセットの部分的内容と参照の書き込みスタイルを正確に記述した要約である。
論文 参考訳(メタデータ) (2020-02-24T12:52:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。