論文の概要: Revising FUNSD dataset for key-value detection in document images
- arxiv url: http://arxiv.org/abs/2010.05322v1
- Date: Sun, 11 Oct 2020 19:06:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-08 13:52:17.961195
- Title: Revising FUNSD dataset for key-value detection in document images
- Title(参考訳): 文書画像におけるキー値検出のためのFUNSDデータセットの改訂
- Authors: Hieu M. Vu, Diep Thi-Ngoc Nguyen
- Abstract要約: FUNSDは、ドキュメントのイモージョンから情報を取り出すための、限られた公開データセットの1つである。
FUNSDをみると、ラベル付けの不整合がいくつか見られ、キー値抽出問題への適用性が阻害された。
- 参考スコア(独自算出の注目度): 0.38073142980732994
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: FUNSD is one of the limited publicly available datasets for information
extraction from document im-ages. The information in the FUNSD dataset is
defined by text areas of four categories ("key", "value", "header", "other",
and "background") and connectivity between areas as key-value relations.
In-specting FUNSD, we found several inconsistency in labeling, which impeded
its applicability to thekey-value extraction problem. In this report, we
described some labeling issues in FUNSD and therevision we made to the dataset.
We also reported our implementation of for key-value detection onFUNSD using a
UNet model as baseline results and an improved UNet model with
Channel-InvariantDeformable Convolution.
- Abstract(参考訳): FUNSDは、ドキュメントのイモージョンから情報を取り出すための、限られた公開データセットの1つである。
FUNSDデータセットの情報は、4つのカテゴリ(key, "value", "header", "other", "background")のテキスト領域と、キーと値の関係として領域間の接続によって定義される。
in-specting funsd ではラベリングの不整合がいくつか見出され,キー値抽出問題への適用性が示唆された。
このレポートでは、funsdとtherevisionでデータセットにラベリングの問題をいくつか記述した。
また,UNetモデルとChannel-InvariantDeformable Convolutionを用いた改良UNetモデルを用いて,FUNSDにおけるキー値検出の実装についても報告した。
関連論文リスト
- Add-SD: Rational Generation without Manual Reference [83.01349699374524]
命令ベースのオブジェクト付加パイプラインであるAdd-SDを導入し、オブジェクトを合理的なサイズと位置でリアルなシーンに自動的に挿入する。
我々の研究は、多数の指示されたイメージペアを含むデータセットの提案、合理的な生成のための拡散モデルの微調整、下流タスクを増強するための合成データの生成の3つの側面に寄与する。
論文 参考訳(メタデータ) (2024-07-30T17:58:13Z) - Rethinking the Evaluation of Pre-trained Text-and-Layout Models from an
Entity-Centric Perspective [15.222536348615087]
EC-FUNSDは、視覚的にリッチなドキュメント上での意味的エンティティ認識とエンティティリンクを評価するために設計されたエンティティ中心のベックマークである。
このデータセットには、ドキュメントレイアウトのさまざまなフォーマットと、セマンティック駆動エンティティとその関連性のアノテーションが含まれている。
実験結果から,最新のPTLMは,データセットバイアスを除去すると性能が急激に低下するため,ベンチマークに過度に適合する傾向を示した。
論文 参考訳(メタデータ) (2024-02-04T07:33:45Z) - JPAVE: A Generation and Classification-based Model for Joint Product
Attribute Prediction and Value Extraction [59.94977231327573]
JPAVEと呼ばれる値生成/分類と属性予測を備えたマルチタスク学習モデルを提案する。
我々のモデルの2つの変種は、オープンワールドとクローズドワールドのシナリオのために設計されている。
公開データセットにおける実験結果は,強いベースラインと比較して,我々のモデルが優れていることを示す。
論文 参考訳(メタデータ) (2023-11-07T18:36:16Z) - Revisiting Sparse Retrieval for Few-shot Entity Linking [33.15662306409253]
本稿では,ELECTRAに基づくキーワード抽出手法を提案する。
抽出器のトレーニングには,参照コンテキストとエンティティ記述との間に重複するトークンをベースとしたトレーニングデータを自動的に生成する遠隔監視手法を提案する。
ZESHELデータセットによる実験結果から,提案手法はすべてのテスト領域において,最先端モデルよりも優れた性能を示した。
論文 参考訳(メタデータ) (2023-10-19T03:51:10Z) - Open-Vocabulary Animal Keypoint Detection with Semantic-feature Matching [74.75284453828017]
Open-Vocabulary Keypoint Detection (OVKD)タスクは、任意の種類のキーポイントを特定するためにテキストプロンプトを使用するように設計されている。
セマンティック・フェールマッチング(KDSM)を用いた開語彙キーポイント検出(Open-Vocabulary Keypoint Detection)という新しいフレームワークを開発した。
このフレームワークは視覚と言語モデルを組み合わせて、言語機能とローカルキーポイント視覚機能との相互作用を作成する。
論文 参考訳(メタデータ) (2023-10-08T07:42:41Z) - ASDOT: Any-Shot Data-to-Text Generation with Pretrained Language Models [82.63962107729994]
Any-Shot Data-to-Text (ASDOT)は、多様な設定に柔軟に適用可能な新しいアプローチである。
データ曖昧化と文の融合という2つのステップから構成される。
実験の結果, ASDOT はベースラインよりも顕著な改善が得られた。
論文 参考訳(メタデータ) (2022-10-09T19:17:43Z) - Test-Time Adaptation for Visual Document Understanding [34.79168501080629]
DocTTAは文書に対する新しいテスト時間適応手法である。
未ラベルのターゲット文書データを使用して、ソースフリーのドメイン適応を行う。
各種のVDUタスクに対して,既存の公開データセットを用いた新しいベンチマークを導入する。
論文 参考訳(メタデータ) (2022-06-15T01:57:12Z) - Document-Level Relation Extraction with Sentences Importance Estimation
and Focusing [52.069206266557266]
文書レベルの関係抽出(DocRE)は、複数の文の文書から2つのエンティティ間の関係を決定することを目的としている。
我々はDocREのための文重要度スコアと文集中損失を設計するSIEF(Sentence Estimation and Focusing)フレームワークを提案する。
2つのドメインの実験結果から、SIEFは全体的なパフォーマンスを改善するだけでなく、DocREモデルをより堅牢にします。
論文 参考訳(メタデータ) (2022-04-27T03:20:07Z) - Entity Relation Extraction as Dependency Parsing in Visually Rich
Documents [18.67730663266417]
一般的な依存性解析モデルであるbiaffineを,このエンティティ関係抽出タスクに適用する。
単語間の依存関係関係を認識する依存性解析モデルとは異なることから,単語群間の関係をレイアウト情報で識別する。
実世界のアプリケーションについては、本モデルが社内の税関データに適用され、プロダクション環境で信頼性の高い性能を実現している。
論文 参考訳(メタデータ) (2021-10-19T12:26:40Z) - MatchVIE: Exploiting Match Relevancy between Entities for Visual
Information Extraction [48.55908127994688]
我々は、VIE(MatchVIE)のためのグラフニューラルネットワークに基づく新しいキー値マッチングモデルを提案する。
関連性評価に基づくキー値マッチングにより、提案したMatchVIEは、認識を様々な意味論にバイパスすることができる。
我々は、エンコードされた値の不安定性に対処するために、単純だが効果的な操作であるNum2Vecを導入する。
論文 参考訳(メタデータ) (2021-06-24T12:06:29Z) - Spatial Dual-Modality Graph Reasoning for Key Information Extraction [31.04597531115209]
本研究では,非構造化文書画像から鍵情報を抽出するSDMG-R法を提案する。
我々はWildReceiptという新しいデータセットを公開し、野生の目に見えないテンプレートの文書画像からキー情報を抽出し、注釈を付ける。
論文 参考訳(メタデータ) (2021-03-26T13:46:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。