論文の概要: Text Classification Models for Form Entity Linking
- arxiv url: http://arxiv.org/abs/2112.07443v1
- Date: Tue, 14 Dec 2021 14:59:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-15 21:05:42.025306
- Title: Text Classification Models for Form Entity Linking
- Title(参考訳): フォームエンティティリンクのためのテキスト分類モデル
- Authors: Mar\'ia Villota, C\'esar Dom\'inguez, J\'onathan Heras, Eloy Mata, and
Vico Pascual
- Abstract要約: 本研究では,画像処理技術とBERTアーキテクチャに基づくテキスト分類モデルを組み合わせることで,エンティティリンクの問題に対処した。
このアプローチは、FUNSDデータセット上でF1スコアの0.80で最先端の結果を達成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Forms are a widespread type of template-based document used in a great
variety of fields including, among others, administration, medicine, finance,
or insurance. The automatic extraction of the information included in these
documents is greatly demanded due to the increasing volume of forms that are
generated in a daily basis. However, this is not a straightforward task when
working with scanned forms because of the great diversity of templates with
different location of form entities, and the quality of the scanned documents.
In this context, there is a feature that is shared by all forms: they contain a
collection of interlinked entities built as key-value (or label-value) pairs,
together with other entities such as headers or images. In this work, we have
tacked the problem of entity linking in forms by combining image processing
techniques and a text classification model based on the BERT architecture. This
approach achieves state-of-the-art results with a F1-score of 0.80 on the FUNSD
dataset, a 5% improvement regarding the best previous method. The code of this
project is available at https://github.com/mavillot/FUNSD-Entity-Linking.
- Abstract(参考訳): フォームは、管理、医療、金融、保険など、さまざまな分野で使用されるテンプレートベースのドキュメントの広範なタイプである。
これらの文書に含まれる情報の自動抽出は、日常的に発生するフォームの量の増加により、大幅に要求される。
しかし、フォームエンティティの異なるテンプレートの多様性とスキャンされたドキュメントの品質のため、スキャンされたフォームを扱う場合、これは簡単な作業ではない。
このコンテキストでは、すべての形式で共有される機能がある: ヘッダやイメージなどの他のエンティティとともに、キー-値(またはラベル-値)ペアとして構築されたリンクされたエンティティのコレクションを含む。
本研究では,画像処理技術とbertアーキテクチャに基づくテキスト分類モデルを組み合わせて,フォーム上のエンティティリンクの問題に取り組んでいる。
このアプローチは、FUNSDデータセット上でF1スコアの0.80で最先端の結果を達成する。
このプロジェクトのコードはhttps://github.com/mavillot/funsd-entity-linkingで入手できる。
関連論文リスト
- Hypergraph based Understanding for Document Semantic Entity Recognition [65.84258776834524]
我々は,ハイパグラフアテンションを利用したハイパグラフアテンション文書セマンティックエンティティ認識フレームワークHGAを構築し,エンティティ境界とエンティティカテゴリを同時に重視する。
FUNSD, CORD, XFUNDIE で得られた結果は,本手法が意味的エンティティ認識タスクの性能を効果的に向上できることを示す。
論文 参考訳(メタデータ) (2024-07-09T14:35:49Z) - CustAny: Customizing Anything from A Single Example [73.90939022698399]
10kカテゴリにわたる315kのテキストイメージサンプルを特徴とする,汎用オブジェクトの大規模なデータセットを構築するための新しいパイプラインを提案する。
MC-IDCの助けを借りて、汎用オブジェクトの柔軟なテキスト編集をサポートするゼロショットフレームワークであるCustomizing Anything (CustAny)を紹介した。
当社のコントリビューションには、大規模なデータセット、CustAnyフレームワーク、新しいID処理などが含まれています。
論文 参考訳(メタデータ) (2024-06-17T15:26:22Z) - Lightweight Spatial Modeling for Combinatorial Information Extraction From Documents [31.434507306952458]
文書エンティティのK-nearest-neighbor(KNN)グラフに基づいて,注目度計算の新たなバイアスを取り入れたKNNフォーマを提案する。
また、多くの文書に存在する1対1のマッピング特性に対処するために、マッチング空間を用いる。
本手法はトレーニング可能なパラメータの数の観点から既存の手法と比較して非常に効率的である。
論文 参考訳(メタデータ) (2024-05-08T10:10:38Z) - EIGEN: Expert-Informed Joint Learning Aggregation for High-Fidelity
Information Extraction from Document Images [27.36816896426097]
レイアウトフォーマットの多様性が高いため,文書画像からの情報抽出は困難である。
本稿では,ルールベースの手法とデータプログラミングを用いたディープラーニングモデルを組み合わせた新しい手法であるEIGENを提案する。
我々のEIGENフレームワークは、ラベル付きデータインスタンスがほとんどない状態で、最先端のディープモデルの性能を大幅に向上させることができることを実証的に示しています。
論文 参考訳(メタデータ) (2023-11-23T13:20:42Z) - PDFTriage: Question Answering over Long, Structured Documents [60.96667912964659]
構造化文書をプレーンテキストとして表現することは、これらの文書をリッチな構造でユーザ精神モデルと矛盾する。
本稿では,構造や内容に基づいて,モデルがコンテキストを検索できるPDFTriageを提案する。
ベンチマークデータセットは,80以上の構造化文書に900以上の人間が生成した質問からなる。
論文 参考訳(メタデータ) (2023-09-16T04:29:05Z) - Modeling Entities as Semantic Points for Visual Information Extraction
in the Wild [55.91783742370978]
文書画像から鍵情報を正確かつ堅牢に抽出する手法を提案する。
我々は、エンティティを意味的ポイントとして明示的にモデル化する。つまり、エンティティの中心点は、異なるエンティティの属性と関係を記述する意味情報によって豊かになる。
提案手法は,従来の最先端モデルと比較して,エンティティラベルとリンクの性能を著しく向上させることができる。
論文 参考訳(メタデータ) (2023-03-23T08:21:16Z) - Cross-Modal Entity Matching for Visually Rich Documents [4.8119678510491815]
視覚的にリッチなドキュメントは、視覚的な手がかりを使ってセマンティクスを強化します。
これらのドキュメントの構造化クエリを可能にする既存の作業は、これを考慮に入れない。
この制限に対処するクロスモーダルなエンティティマッチングフレームワークであるJunoを提案する。
論文 参考訳(メタデータ) (2023-03-01T18:26:14Z) - Unifying Vision, Text, and Layout for Universal Document Processing [105.36490575974028]
本稿では,テキスト,画像,レイアウトのモダリティを文書理解と生成を含むさまざまなタスク形式とともに統合するドキュメントAIモデルを提案する。
我々の手法は、財務報告、学術論文、ウェブサイトなど、さまざまなデータ領域にまたがって、文書理解やQAといった9つのドキュメントAIタスクの最先端を定めている。
論文 参考訳(メタデータ) (2022-12-05T22:14:49Z) - QueryForm: A Simple Zero-shot Form Entity Query Framework [35.255931326696114]
本稿では,0ショット方式でフォームライクなドキュメントからエンティティ値を抽出する新しいクエリベースのフレームワークQueryFormを提案する。
本稿では,HTML アノテーションの弱いフォーム型 Web ページから生成された大規模クエリ-エンタリティペアを利用して,QueryForm を事前学習する手法を提案する。
論文 参考訳(メタデータ) (2022-11-14T20:02:02Z) - DocStruct: A Multimodal Method to Extract Hierarchy Structure in
Document for General Form Understanding [15.814603044233085]
我々は、最も基本的なコンポーネント、キーと値のペアに焦点を合わせ、特徴抽出にマルチモーダル手法を採用する。
我々は、最先端モデルとターゲット抽出モジュールを用いて、マルチモーダルな特徴を抽出する。
結合と特徴シフトのハイブリッド融合法は、異種特徴を融合させ、情報的関節表現を提供するように設計されている。
論文 参考訳(メタデータ) (2020-10-15T08:54:17Z) - Interpretable Entity Representations through Large-Scale Typing [61.4277527871572]
本稿では,人間の読みやすいエンティティ表現を作成し,箱から高パフォーマンスを実現する手法を提案する。
我々の表現は、微粒な実体型に対する後続確率に対応するベクトルである。
特定のドメインに対して,学習に基づく方法で,型セットのサイズを縮小できることを示す。
論文 参考訳(メタデータ) (2020-04-30T23:58:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。