論文の概要: Text Classification Models for Form Entity Linking
- arxiv url: http://arxiv.org/abs/2112.07443v1
- Date: Tue, 14 Dec 2021 14:59:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-15 21:05:42.025306
- Title: Text Classification Models for Form Entity Linking
- Title(参考訳): フォームエンティティリンクのためのテキスト分類モデル
- Authors: Mar\'ia Villota, C\'esar Dom\'inguez, J\'onathan Heras, Eloy Mata, and
Vico Pascual
- Abstract要約: 本研究では,画像処理技術とBERTアーキテクチャに基づくテキスト分類モデルを組み合わせることで,エンティティリンクの問題に対処した。
このアプローチは、FUNSDデータセット上でF1スコアの0.80で最先端の結果を達成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Forms are a widespread type of template-based document used in a great
variety of fields including, among others, administration, medicine, finance,
or insurance. The automatic extraction of the information included in these
documents is greatly demanded due to the increasing volume of forms that are
generated in a daily basis. However, this is not a straightforward task when
working with scanned forms because of the great diversity of templates with
different location of form entities, and the quality of the scanned documents.
In this context, there is a feature that is shared by all forms: they contain a
collection of interlinked entities built as key-value (or label-value) pairs,
together with other entities such as headers or images. In this work, we have
tacked the problem of entity linking in forms by combining image processing
techniques and a text classification model based on the BERT architecture. This
approach achieves state-of-the-art results with a F1-score of 0.80 on the FUNSD
dataset, a 5% improvement regarding the best previous method. The code of this
project is available at https://github.com/mavillot/FUNSD-Entity-Linking.
- Abstract(参考訳): フォームは、管理、医療、金融、保険など、さまざまな分野で使用されるテンプレートベースのドキュメントの広範なタイプである。
これらの文書に含まれる情報の自動抽出は、日常的に発生するフォームの量の増加により、大幅に要求される。
しかし、フォームエンティティの異なるテンプレートの多様性とスキャンされたドキュメントの品質のため、スキャンされたフォームを扱う場合、これは簡単な作業ではない。
このコンテキストでは、すべての形式で共有される機能がある: ヘッダやイメージなどの他のエンティティとともに、キー-値(またはラベル-値)ペアとして構築されたリンクされたエンティティのコレクションを含む。
本研究では,画像処理技術とbertアーキテクチャに基づくテキスト分類モデルを組み合わせて,フォーム上のエンティティリンクの問題に取り組んでいる。
このアプローチは、FUNSDデータセット上でF1スコアの0.80で最先端の結果を達成する。
このプロジェクトのコードはhttps://github.com/mavillot/funsd-entity-linkingで入手できる。
関連論文リスト
- Seed-Guided Fine-Grained Entity Typing in Science and Engineering
Domains [51.02035914828596]
科学・工学分野において,シード誘導型細粒度エンティティタイピングの課題について検討する。
まず、ラベルのないコーパスから各タイプのエンティティを抽出し、弱い監視力を高めるSETypeを提案する。
そして、リッチなエンティティをラベルなしのテキストにマッチさせ、擬似ラベル付きサンプルを取得し、見知らぬ型と見えない型の両方に推論できるテキストエンテリメントモデルを訓練する。
論文 参考訳(メタデータ) (2024-01-23T22:36:03Z) - EIGEN: Expert-Informed Joint Learning Aggregation for High-Fidelity
Information Extraction from Document Images [27.36816896426097]
レイアウトフォーマットの多様性が高いため,文書画像からの情報抽出は困難である。
本稿では,ルールベースの手法とデータプログラミングを用いたディープラーニングモデルを組み合わせた新しい手法であるEIGENを提案する。
我々のEIGENフレームワークは、ラベル付きデータインスタンスがほとんどない状態で、最先端のディープモデルの性能を大幅に向上させることができることを実証的に示しています。
論文 参考訳(メタデータ) (2023-11-23T13:20:42Z) - PDFTriage: Question Answering over Long, Structured Documents [60.96667912964659]
構造化文書をプレーンテキストとして表現することは、これらの文書をリッチな構造でユーザ精神モデルと矛盾する。
本稿では,構造や内容に基づいて,モデルがコンテキストを検索できるPDFTriageを提案する。
ベンチマークデータセットは,80以上の構造化文書に900以上の人間が生成した質問からなる。
論文 参考訳(メタデータ) (2023-09-16T04:29:05Z) - Modeling Entities as Semantic Points for Visual Information Extraction
in the Wild [55.91783742370978]
文書画像から鍵情報を正確かつ堅牢に抽出する手法を提案する。
我々は、エンティティを意味的ポイントとして明示的にモデル化する。つまり、エンティティの中心点は、異なるエンティティの属性と関係を記述する意味情報によって豊かになる。
提案手法は,従来の最先端モデルと比較して,エンティティラベルとリンクの性能を著しく向上させることができる。
論文 参考訳(メタデータ) (2023-03-23T08:21:16Z) - Unifying Vision, Text, and Layout for Universal Document Processing [105.36490575974028]
本稿では,テキスト,画像,レイアウトのモダリティを文書理解と生成を含むさまざまなタスク形式とともに統合するドキュメントAIモデルを提案する。
我々の手法は、財務報告、学術論文、ウェブサイトなど、さまざまなデータ領域にまたがって、文書理解やQAといった9つのドキュメントAIタスクの最先端を定めている。
論文 参考訳(メタデータ) (2022-12-05T22:14:49Z) - QueryForm: A Simple Zero-shot Form Entity Query Framework [35.255931326696114]
本稿では,0ショット方式でフォームライクなドキュメントからエンティティ値を抽出する新しいクエリベースのフレームワークQueryFormを提案する。
本稿では,HTML アノテーションの弱いフォーム型 Web ページから生成された大規模クエリ-エンタリティペアを利用して,QueryForm を事前学習する手法を提案する。
論文 参考訳(メタデータ) (2022-11-14T20:02:02Z) - ReFinED: An Efficient Zero-shot-capable Approach to End-to-End Entity
Linking [5.382800665115746]
ReFinEDは効率的なエンドツーエンドのエンティティリンクモデルである。
単一のフォワードパスで、ドキュメント内のすべての参照に対して、参照検出、きめ細かいエンティティタイピング、エンティティの曖昧さを実行する。
標準エンティティリンクデータセットの最先端パフォーマンスを平均3.7 F1で上回る。
論文 参考訳(メタデータ) (2022-07-08T19:20:42Z) - DocStruct: A Multimodal Method to Extract Hierarchy Structure in
Document for General Form Understanding [15.814603044233085]
我々は、最も基本的なコンポーネント、キーと値のペアに焦点を合わせ、特徴抽出にマルチモーダル手法を採用する。
我々は、最先端モデルとターゲット抽出モジュールを用いて、マルチモーダルな特徴を抽出する。
結合と特徴シフトのハイブリッド融合法は、異種特徴を融合させ、情報的関節表現を提供するように設計されている。
論文 参考訳(メタデータ) (2020-10-15T08:54:17Z) - Spatial Dependency Parsing for Semi-Structured Document Information
Extraction [29.231908055394808]
本研究では,文書内の複雑な関係と任意の数の情報層をエンドツーエンドにモデル化するSPADE(SPA Dependency)を提案する。
我々はレシート、名刺、フォーム、請求書など、さまざまな種類の文書で評価する。
論文 参考訳(メタデータ) (2020-05-01T22:59:56Z) - SciREX: A Challenge Dataset for Document-Level Information Extraction [56.83748634747753]
ドキュメントレベルで大規模な情報抽出データセットを作成するのは難しい。
複数のIEタスクを含む文書レベルのIEデータセットであるSciREXを紹介する。
我々は、従来の最先端のIEモデルをドキュメントレベルのIEに拡張する強力なベースラインとして、ニューラルモデルを開発する。
論文 参考訳(メタデータ) (2020-05-01T17:30:10Z) - Interpretable Entity Representations through Large-Scale Typing [61.4277527871572]
本稿では,人間の読みやすいエンティティ表現を作成し,箱から高パフォーマンスを実現する手法を提案する。
我々の表現は、微粒な実体型に対する後続確率に対応するベクトルである。
特定のドメインに対して,学習に基づく方法で,型セットのサイズを縮小できることを示す。
論文 参考訳(メタデータ) (2020-04-30T23:58:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。