論文の概要: TreeForm: End-to-end Annotation and Evaluation for Form Document Parsing
- arxiv url: http://arxiv.org/abs/2402.05282v1
- Date: Wed, 7 Feb 2024 21:54:53 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-09 17:06:31.776496
- Title: TreeForm: End-to-end Annotation and Evaluation for Form Document Parsing
- Title(参考訳): TreeForm: フォーム文書解析のためのエンドツーエンドアノテーションと評価
- Authors: Ran Zmigrod, Zhiqiang Ma, Armineh Nourbakhsh, Sameena Shah
- Abstract要約: Visually Rich Form Understanding (VRFU) は、ドキュメントの高度に構造化された性質と、高度に可変なスタイルと内容のために複雑な研究課題を提起する。
現在のアノテーションスキームは、形式理解と鍵階層構造を分解し、エンドツーエンドモデルの開発と評価を困難にしている。
そこで本研究では,VRFU用の新しいコンテンツに依存しない木に基づくアノテーションスキームであるTreeFormについて,フォーム予測の評価を行う新しいF1メトリクスを提案する。
- 参考スコア(独自算出の注目度): 19.193846548017834
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Visually Rich Form Understanding (VRFU) poses a complex research problem due
to the documents' highly structured nature and yet highly variable style and
content. Current annotation schemes decompose form understanding and omit key
hierarchical structure, making development and evaluation of end-to-end models
difficult. In this paper, we propose a novel F1 metric to evaluate form parsers
and describe a new content-agnostic, tree-based annotation scheme for VRFU:
TreeForm. We provide methods to convert previous annotation schemes into
TreeForm structures and evaluate TreeForm predictions using a modified version
of the normalized tree-edit distance. We present initial baselines for our
end-to-end performance metric and the TreeForm edit distance, averaged over the
FUNSD and XFUND datasets, of 61.5 and 26.4 respectively. We hope that TreeForm
encourages deeper research in annotating, modeling, and evaluating the
complexities of form-like documents.
- Abstract(参考訳): Visually Rich Form Understanding (VRFU) は、ドキュメントの高度に構造化された性質と、高度に可変なスタイルと内容のために複雑な研究課題を提起する。
現在のアノテーションスキームは、形式理解と鍵階層構造を分解し、エンドツーエンドモデルの開発と評価を困難にする。
本稿では、フォームパーサを評価するための新しいf1メトリックを提案し、vrfu用の新しいコンテンツに依存しないツリーベースのアノテーションスキームであるtreeformについて述べる。
従来のアノテーションスキームをツリーフォーム構造に変換し、正規化木編集距離の修正版を用いてツリーフォーム予測を評価する。
我々は、funsd と xfund のデータセットの平均値である 61.5 と 26.4 に対して、エンド・ツー・エンドのパフォーマンス指標とツリーフォーム編集距離の初期ベースラインを提示した。
treeformは、フォームライクなドキュメントの複雑さを注釈、モデリング、評価する深い研究を促進することを願っている。
関連論文リスト
- ReTreever: Tree-based Coarse-to-Fine Representations for Retrieval [64.44265315244579]
そこで本研究では,様々なレベルで参照文書を整理し,表現するためのツリーベース手法を提案する。
我々の手法はReTreeverと呼ばれ、クエリと参照ドキュメントが同様のツリーブランチに割り当てられるように、バイナリツリーの内部ノード毎のルーティング関数を共同で学習する。
我々の評価では、ReTreeverは一般的に完全な表現精度を保っている。
論文 参考訳(メタデータ) (2025-02-11T21:35:13Z) - Think&Cite: Improving Attributed Text Generation with Self-Guided Tree Search and Progress Reward Modeling [63.98194996746229]
大型言語モデル(LLM)は幻覚を起こし、事実的に誤った情報を生み出す傾向にある。
我々はThink&Citeと呼ばれる新しいフレームワークを提案し、検索と統合された多段階推論問題として属性付きテキスト生成を定式化する。
論文 参考訳(メタデータ) (2024-12-19T13:55:48Z) - UniVIE: A Unified Label Space Approach to Visual Information Extraction
from Form-like Documents [11.761942458294136]
我々は,VIEを関係予測問題とみなし,異なるタスクのラベルを単一のラベル空間に統合する新たな視点を提案する。
この統一されたアプローチは、様々な関係型の定義を可能にし、フォームライクなドキュメントにおける階層的関係に効果的に取り組む。
我々は、VIE問題に包括的に対処する統一モデルUniVIEを提案する。
論文 参考訳(メタデータ) (2024-01-17T14:02:36Z) - A Scalable Framework for Table of Contents Extraction from Complex ESG
Annual Reports [19.669390380593843]
2001年から2022年までの563社から1093社のESG年次レポートをまとめた新しいデータセットESGDocを提案する。
これらの報告は、その多様な構造と幅広い長さのために重大な課題を提起している。
3つのステップからなる新しいToc抽出フレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-27T11:40:32Z) - QueryForm: A Simple Zero-shot Form Entity Query Framework [35.255931326696114]
本稿では,0ショット方式でフォームライクなドキュメントからエンティティ値を抽出する新しいクエリベースのフレームワークQueryFormを提案する。
本稿では,HTML アノテーションの弱いフォーム型 Web ページから生成された大規模クエリ-エンタリティペアを利用して,QueryForm を事前学習する手法を提案する。
論文 参考訳(メタデータ) (2022-11-14T20:02:02Z) - RLET: A Reinforcement Learning Based Approach for Explainable QA with
Entailment Trees [47.745218107037786]
本稿では,強化学習に基づくEntailment Tree生成フレームワークであるRLETを提案する。
RLETは文の選択と推論生成モジュールによる単一ステップ推論を反復的に行う。
EntailmentBankデータセットの3つの設定の実験では、RLフレームワークを使用することの強みが示されている。
論文 参考訳(メタデータ) (2022-10-31T06:45:05Z) - Structure-Unified M-Tree Coding Solver for MathWord Problem [57.825176412485504]
従来,数式表現の2次木構造を考慮に入れたモデルでは,性能が向上した。
本稿では、出力構造を統一するために、任意のM枝(M-tree)を持つ木を適用した構造統一M-Tree符号化(S-UMCr)を提案する。
広く使われているMAWPSとMath23Kデータセットの実験結果は、SUMC-rが複数の最先端モデルを上回るだけでなく、低リソース条件下でもはるかに優れた性能を発揮することを示した。
論文 参考訳(メタデータ) (2022-10-22T12:20:36Z) - PatchRD: Detail-Preserving Shape Completion by Learning Patch Retrieval
and Deformation [59.70430570779819]
本稿では,3次元形状の欠落領域の幾何学的詳細化に焦点を当てたデータ駆動型形状補完手法を提案する。
私たちの重要な洞察は、部分的な入力から完全な欠落したリージョンへのパッチのコピーとデフォームです。
部分的な入力からパッチを抽出することで繰り返しパターンを活用し、ニューラルネットワークを用いてグローバルな構造的先行点を学習し、検索と変形の手順を導出する。
論文 参考訳(メタデータ) (2022-07-24T18:59:09Z) - Value Retrieval with Arbitrary Queries for Form-like Documents [50.5532781148902]
フォーム状文書に対する任意のクエリを用いた値検索を提案する。
本手法は,フォームのレイアウトやセマンティクスの理解に基づいて,任意のクエリのターゲット値を予測する。
本稿では,大規模モデル事前学習における文書理解を改善するためのシンプルな文書言語モデリング (simpleDLM) 戦略を提案する。
論文 参考訳(メタデータ) (2021-12-15T01:12:02Z) - DocStruct: A Multimodal Method to Extract Hierarchy Structure in
Document for General Form Understanding [15.814603044233085]
我々は、最も基本的なコンポーネント、キーと値のペアに焦点を合わせ、特徴抽出にマルチモーダル手法を採用する。
我々は、最先端モデルとターゲット抽出モジュールを用いて、マルチモーダルな特徴を抽出する。
結合と特徴シフトのハイブリッド融合法は、異種特徴を融合させ、情報的関節表現を提供するように設計されている。
論文 参考訳(メタデータ) (2020-10-15T08:54:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。