論文の概要: Zero-shot Task Transfer for Invoice Extraction via Class-aware QA
Ensemble
- arxiv url: http://arxiv.org/abs/2108.06069v1
- Date: Fri, 13 Aug 2021 05:36:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-16 13:16:48.680691
- Title: Zero-shot Task Transfer for Invoice Extraction via Class-aware QA
Ensemble
- Title(参考訳): クラス認識型QAアンサンブルによる請求書抽出のためのゼロショットタスク転送
- Authors: Prithiviraj Damodaran, Prabhkaran Singh, Josemon Achankuju
- Abstract要約: 本稿では、レイアウト、ローカライズ、ドメイン文書抽出のための、意図的にシンプルながら斬新なゼロショットシステムであるVESPAを提案する。
本稿では,情報抽出(IE)タスクを自然言語質問応答(QA)タスクに,工学的なタスク固有のアーキテクチャを使わずに簡単に移行することで,この問題に対処できることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We present VESPA, an intentionally simple yet novel zero-shot system for
layout, locale, and domain agnostic document extraction. In spite of the
availability of large corpora of documents, the lack of labeled and validated
datasets makes it a challenge to discriminatively train document extraction
models for enterprises. We show that this problem can be addressed by simply
transferring the information extraction (IE) task to a natural language
Question-Answering (QA) task without engineering task-specific architectures.
We demonstrate the effectiveness of our system by evaluating on a closed corpus
of real-world retail and tax invoices with multiple complex layouts, domains,
and geographies. The empirical evaluation shows that our system outperforms 4
prominent commercial invoice solutions that use discriminatively trained models
with architectures specifically crafted for invoice extraction. We extracted 6
fields with zero upfront human annotation or training with an Avg. F1 of 87.50.
- Abstract(参考訳): 本稿では,レイアウト,ロケール,ドメインに依存しない文書抽出のためのゼロショットシステムvespaを提案する。
大量の文書が利用可能であるにもかかわらず、ラベル付きおよび検証済みデータセットの欠如は、企業のために文書抽出モデルを識別的に訓練することの課題となっている。
情報抽出(ie)タスクを自然言語質問応答(qa)タスクに、エンジニアリングタスク固有のアーキテクチャを使わずに移すことで、この問題に対処できることを示す。
本システムの有効性は,複数の複雑なレイアウト,ドメイン,地理を持つ実世界の小売・納税請求書を閉じたコーパスで評価することで実証する。
経験的評価の結果,請求書抽出に特化したアーキテクチャを用いた識別訓練モデルを用いた商用請求書ソリューションが4つに上回っていることがわかった。
Avgを用いた事前アノテーションやトレーニングをゼロとした6つのフィールドを抽出した。
f1 87.50。
関連論文リスト
- Learning to Extract Structured Entities Using Language Models [52.281701191329]
機械学習の最近の進歩は、情報抽出の分野に大きな影響を与えている。
タスクをエンティティ中心にすることで、さまざまなメトリクスの使用を可能にします。
我々は、Structured Entity extractを導入し、Adroximate Entity Set OverlaPメトリックを提案し、この分野にコントリビュートします。
論文 参考訳(メタデータ) (2024-02-06T22:15:09Z) - On Task-personalized Multimodal Few-shot Learning for Visually-rich
Document Entity Retrieval [59.25292920967197]
VDER(Few-shot document entity search)は、NLPアプリケーションにおいて重要なトピックである。
FewVEXは、エンティティレベルの少数ショットVDERの分野における将来の研究を促進するための、新しいデータセットである。
本稿では,タスクパーソナライズを効果的に実現することを中心に,タスク認識型メタラーニングベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-11-01T17:51:43Z) - Mastering the Task of Open Information Extraction with Large Language
Models and Consistent Reasoning Environment [52.592199835286394]
オープン情報抽出(OIE)は、自然文から客観的な構造化された知識を抽出することを目的としている。
大規模言語モデル(LLM)は、テキスト内学習能力に優れています。
論文 参考訳(メタデータ) (2023-10-16T17:11:42Z) - Fine-tuning and aligning question answering models for complex
information extraction tasks [0.8392546351624164]
質問応答(QA)や通過検索モデルのような抽出言語モデルは、クエリ結果が適切なコンテキスト文書の境界内で見つかることを保証します。
既存のドイツ語のQAモデルを微調整することで,複雑な言語的特徴の抽出タスクをカスタマイズする性能が向上することを示す。
評価基準を再現するために,Levenshtein 距離,F1-Score,Exact Match,ROUGE-L の組合せを推定した。
論文 参考訳(メタデータ) (2023-09-26T10:02:21Z) - AMuRD: Annotated Arabic-English Receipt Dataset for Key Information Extraction and Classification [14.386767741945256]
AMuRDは、レシートから情報を取り出すために特別に設計された、新しい多言語人間アノテーション付きデータセットである。
各サンプルには、アイテム名や価格、ブランドなどの属性のアノテーションが含まれている。
この詳細なアノテーションはレシート上の各項目の包括的な理解を促進する。
論文 参考訳(メタデータ) (2023-09-18T14:18:19Z) - Schema-Driven Information Extraction from Heterogeneous Tables [37.50854811537401]
本稿では、機械学習論文、化学文献、材料科学雑誌、ウェブページの4つの分野のテーブルからなるベンチマークを示す。
我々の実験は、タスク固有のパイプラインやラベルを必要とせずに、驚くほど競争力のあるパフォーマンスが達成できることを示した。
論文 参考訳(メタデータ) (2023-05-23T17:58:10Z) - Automated Few-shot Classification with Instruction-Finetuned Language
Models [76.69064714392165]
我々は、AuT-Fewが最先端の数ショット学習方法より優れていることを示す。
AuT-Few は RAFT few-shot ベンチマークにおいて,データセット間で最高のランク付け手法であることを示す。
論文 参考訳(メタデータ) (2023-05-21T21:50:27Z) - Layout-Aware Information Extraction for Document-Grounded Dialogue:
Dataset, Method and Demonstration [75.47708732473586]
視覚的にリッチな文書から構造的知識と意味的知識の両方を抽出するためのレイアウト対応文書レベル情報抽出データセット(LIE)を提案する。
LIEには製品および公式文書の4,061ページから3つの抽出タスクの62kアノテーションが含まれている。
実験の結果、レイアウトはVRDベースの抽出に不可欠であることが示され、システムデモでは、抽出された知識が、ユーザが関心を持っている答えを見つけるのに役立つことも確認されている。
論文 参考訳(メタデータ) (2022-07-14T07:59:45Z) - Zero-Shot Information Extraction as a Unified Text-to-Triple Translation [56.01830747416606]
我々は、テキストから3つの翻訳フレームワークに一連の情報抽出タスクを投入した。
タスク固有の入力テキストと出力トリプルの変換としてタスクを形式化する。
本稿では,オープン情報抽出におけるゼロショット性能について検討する。
論文 参考訳(メタデータ) (2021-09-23T06:54:19Z) - Transfer Learning for Information Extraction with Limited Data [2.201264358342234]
本稿では,詳細な情報抽出への実践的アプローチを提案する。
まずBERTを利用して、実際のシナリオにおけるトレーニングデータの制限に対処します。
次に、BERTを畳み込みニューラルネットワークで積み重ねて、分類のための隠れ表現を学習する。
論文 参考訳(メタデータ) (2020-03-06T08:08:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。