論文の概要: TreeForm: End-to-end Annotation and Evaluation for Form Document Parsing
- arxiv url: http://arxiv.org/abs/2402.05282v1
- Date: Wed, 7 Feb 2024 21:54:53 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-09 17:06:31.776496
- Title: TreeForm: End-to-end Annotation and Evaluation for Form Document Parsing
- Title(参考訳): TreeForm: フォーム文書解析のためのエンドツーエンドアノテーションと評価
- Authors: Ran Zmigrod, Zhiqiang Ma, Armineh Nourbakhsh, Sameena Shah
- Abstract要約: Visually Rich Form Understanding (VRFU) は、ドキュメントの高度に構造化された性質と、高度に可変なスタイルと内容のために複雑な研究課題を提起する。
現在のアノテーションスキームは、形式理解と鍵階層構造を分解し、エンドツーエンドモデルの開発と評価を困難にしている。
そこで本研究では,VRFU用の新しいコンテンツに依存しない木に基づくアノテーションスキームであるTreeFormについて,フォーム予測の評価を行う新しいF1メトリクスを提案する。
- 参考スコア(独自算出の注目度): 19.193846548017834
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Visually Rich Form Understanding (VRFU) poses a complex research problem due
to the documents' highly structured nature and yet highly variable style and
content. Current annotation schemes decompose form understanding and omit key
hierarchical structure, making development and evaluation of end-to-end models
difficult. In this paper, we propose a novel F1 metric to evaluate form parsers
and describe a new content-agnostic, tree-based annotation scheme for VRFU:
TreeForm. We provide methods to convert previous annotation schemes into
TreeForm structures and evaluate TreeForm predictions using a modified version
of the normalized tree-edit distance. We present initial baselines for our
end-to-end performance metric and the TreeForm edit distance, averaged over the
FUNSD and XFUND datasets, of 61.5 and 26.4 respectively. We hope that TreeForm
encourages deeper research in annotating, modeling, and evaluating the
complexities of form-like documents.
- Abstract(参考訳): Visually Rich Form Understanding (VRFU) は、ドキュメントの高度に構造化された性質と、高度に可変なスタイルと内容のために複雑な研究課題を提起する。
現在のアノテーションスキームは、形式理解と鍵階層構造を分解し、エンドツーエンドモデルの開発と評価を困難にする。
本稿では、フォームパーサを評価するための新しいf1メトリックを提案し、vrfu用の新しいコンテンツに依存しないツリーベースのアノテーションスキームであるtreeformについて述べる。
従来のアノテーションスキームをツリーフォーム構造に変換し、正規化木編集距離の修正版を用いてツリーフォーム予測を評価する。
我々は、funsd と xfund のデータセットの平均値である 61.5 と 26.4 に対して、エンド・ツー・エンドのパフォーマンス指標とツリーフォーム編集距離の初期ベースラインを提示した。
treeformは、フォームライクなドキュメントの複雑さを注釈、モデリング、評価する深い研究を促進することを願っている。
関連論文リスト
- UniVIE: A Unified Label Space Approach to Visual Information Extraction
from Form-like Documents [11.761942458294136]
我々は,VIEを関係予測問題とみなし,異なるタスクのラベルを単一のラベル空間に統合する新たな視点を提案する。
この統一されたアプローチは、様々な関係型の定義を可能にし、フォームライクなドキュメントにおける階層的関係に効果的に取り組む。
我々は、VIE問題に包括的に対処する統一モデルUniVIEを提案する。
論文 参考訳(メタデータ) (2024-01-17T14:02:36Z) - A Scalable Framework for Table of Contents Extraction from Complex ESG
Annual Reports [19.669390380593843]
2001年から2022年までの563社から1093社のESG年次レポートをまとめた新しいデータセットESGDocを提案する。
これらの報告は、その多様な構造と幅広い長さのために重大な課題を提起している。
3つのステップからなる新しいToc抽出フレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-27T11:40:32Z) - Tree Prompting: Efficient Task Adaptation without Fine-Tuning [112.71020326388029]
Tree Promptingはプロンプトの決定ツリーを構築し、複数のLMコールをリンクしてタスクを解決する。
分類データセットの実験により、Tree Promptingは競合するメソッドよりも精度が向上し、微調整と競合することが示された。
論文 参考訳(メタデータ) (2023-10-21T15:18:22Z) - Opinion Tree Parsing for Aspect-based Sentiment Analysis [24.29073390167775]
本稿では、より高速で、より包括的で完全なアスペクトレベルの感情構造を明らかにすることができる、意見木からすべての感情要素を解析することを目的とした意見木解析モデルを提案する。
特に、まず、文脈自由な意見文法を導入して、意見木構造を正規化する。次に、感情要素間の相関関係を網羅的に検討し、それらを意見木構造に解析する神経チャートベースの意見木を用いる。
論文 参考訳(メタデータ) (2023-06-15T07:53:14Z) - QueryForm: A Simple Zero-shot Form Entity Query Framework [35.255931326696114]
本稿では,0ショット方式でフォームライクなドキュメントからエンティティ値を抽出する新しいクエリベースのフレームワークQueryFormを提案する。
本稿では,HTML アノテーションの弱いフォーム型 Web ページから生成された大規模クエリ-エンタリティペアを利用して,QueryForm を事前学習する手法を提案する。
論文 参考訳(メタデータ) (2022-11-14T20:02:02Z) - RLET: A Reinforcement Learning Based Approach for Explainable QA with
Entailment Trees [47.745218107037786]
本稿では,強化学習に基づくEntailment Tree生成フレームワークであるRLETを提案する。
RLETは文の選択と推論生成モジュールによる単一ステップ推論を反復的に行う。
EntailmentBankデータセットの3つの設定の実験では、RLフレームワークを使用することの強みが示されている。
論文 参考訳(メタデータ) (2022-10-31T06:45:05Z) - Structure-Unified M-Tree Coding Solver for MathWord Problem [57.825176412485504]
従来,数式表現の2次木構造を考慮に入れたモデルでは,性能が向上した。
本稿では、出力構造を統一するために、任意のM枝(M-tree)を持つ木を適用した構造統一M-Tree符号化(S-UMCr)を提案する。
広く使われているMAWPSとMath23Kデータセットの実験結果は、SUMC-rが複数の最先端モデルを上回るだけでなく、低リソース条件下でもはるかに優れた性能を発揮することを示した。
論文 参考訳(メタデータ) (2022-10-22T12:20:36Z) - PatchRD: Detail-Preserving Shape Completion by Learning Patch Retrieval
and Deformation [59.70430570779819]
本稿では,3次元形状の欠落領域の幾何学的詳細化に焦点を当てたデータ駆動型形状補完手法を提案する。
私たちの重要な洞察は、部分的な入力から完全な欠落したリージョンへのパッチのコピーとデフォームです。
部分的な入力からパッチを抽出することで繰り返しパターンを活用し、ニューラルネットワークを用いてグローバルな構造的先行点を学習し、検索と変形の手順を導出する。
論文 参考訳(メタデータ) (2022-07-24T18:59:09Z) - Entailment Tree Explanations via Iterative Retrieval-Generation Reasoner [56.08919422452905]
我々はIRGR(Iterative Retrieval-Generation Reasoner)と呼ばれるアーキテクチャを提案する。
本モデルでは,テキストの前提からステップバイステップの説明を体系的に生成することにより,与えられた仮説を説明することができる。
前提条件の検索と細分化木の生成に関する既存のベンチマークを上回り、全体の正しさはおよそ300%向上した。
論文 参考訳(メタデータ) (2022-05-18T21:52:11Z) - Value Retrieval with Arbitrary Queries for Form-like Documents [50.5532781148902]
フォーム状文書に対する任意のクエリを用いた値検索を提案する。
本手法は,フォームのレイアウトやセマンティクスの理解に基づいて,任意のクエリのターゲット値を予測する。
本稿では,大規模モデル事前学習における文書理解を改善するためのシンプルな文書言語モデリング (simpleDLM) 戦略を提案する。
論文 参考訳(メタデータ) (2021-12-15T01:12:02Z) - DocStruct: A Multimodal Method to Extract Hierarchy Structure in
Document for General Form Understanding [15.814603044233085]
我々は、最も基本的なコンポーネント、キーと値のペアに焦点を合わせ、特徴抽出にマルチモーダル手法を採用する。
我々は、最先端モデルとターゲット抽出モジュールを用いて、マルチモーダルな特徴を抽出する。
結合と特徴シフトのハイブリッド融合法は、異種特徴を融合させ、情報的関節表現を提供するように設計されている。
論文 参考訳(メタデータ) (2020-10-15T08:54:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。