論文の概要: ICDAR2019 Competition on Scanned Receipt OCR and Information Extraction
- arxiv url: http://arxiv.org/abs/2103.10213v1
- Date: Thu, 18 Mar 2021 12:33:41 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-19 22:05:41.151435
- Title: ICDAR2019 Competition on Scanned Receipt OCR and Information Extraction
- Title(参考訳): ICDAR2019 Conference on Scanned Receipt OCR and Information extract
- Authors: Zheng Huang, Kai Chen, Jianhua He, Xiang Bai, Dimosthenis Karatzas,
Shjian Lu, and C.V. Jawahar
- Abstract要約: SROIEの技術的課題、重要性、および巨大な商業的可能性を認識し、私たちはSROIEでICDAR 2019コンペティションを開催しました。
競争のために1000全体のスキャンされたレシート画像とアノテーションを備えた新しいデータセットが作成されます。
本報告では,モチベーション,競合データセット,タスク定義,評価プロトコル,提出統計,提案手法の性能,結果分析について述べる。
- 参考スコア(独自算出の注目度): 70.71240097723745
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scanned receipts OCR and key information extraction (SROIE) represent the
processeses of recognizing text from scanned receipts and extracting key texts
from them and save the extracted tests to structured documents. SROIE plays
critical roles for many document analysis applications and holds great
commercial potentials, but very little research works and advances have been
published in this area. In recognition of the technical challenges, importance
and huge commercial potentials of SROIE, we organized the ICDAR 2019
competition on SROIE. In this competition, we set up three tasks, namely,
Scanned Receipt Text Localisation (Task 1), Scanned Receipt OCR (Task 2) and
Key Information Extraction from Scanned Receipts (Task 3). A new dataset with
1000 whole scanned receipt images and annotations is created for the
competition. In this report we will presents the motivation, competition
datasets, task definition, evaluation protocol, submission statistics,
performance of submitted methods and results analysis.
- Abstract(参考訳): スキャンされたレシートOCRおよびキー情報抽出(SROIE)は、スキャンされたレシートからテキストを認識し、それらからキーテキストを抽出し、抽出したテストを構造化文書に保存する過程を表す。
SROIEは多くの文書分析アプリケーションにおいて重要な役割を担い、大きな商業的可能性を持っているが、この分野での研究成果や進歩はほとんど発表されていない。
SROIEの技術的課題、重要性、巨大な商業的可能性を認識して、私たちはSROIEに関するICDAR 2019コンペティションを開催しました。
本大会では,Scanned Receipt Text Localisation(Task1),Scanned Receipt OCR(Task2),Key Information extract from Scanned Receipts(Task3)という3つのタスクを設定した。
コンペティションのために、1000個のレシートイメージとアノテーションをスキャンした新しいデータセットが作成されている。
本報告では,モチベーション,競合データセット,タスク定義,評価プロトコル,提出統計,提案手法の性能,結果分析について述べる。
関連論文リスト
- ResearchArena: Benchmarking LLMs' Ability to Collect and Organize Information as Research Agents [21.17856299966841]
大規模言語モデル (LLM) は自然言語処理において様々なタスクで顕著な性能を示した。
我々はLLMエージェントが学術調査を行う能力を測定するベンチマーク「ResearchArena」を開発した。
論文 参考訳(メタデータ) (2024-06-13T03:26:30Z) - CORU: Comprehensive Post-OCR Parsing and Receipt Understanding Dataset [12.828786692835369]
本稿では,CORU(Comprehensive Post-OCR Parsing and Receipt Understanding dataset)を紹介する。
CORUはスーパーマーケットや衣料品店など、さまざまな小売店からの2万以上の注釈付きレシートで構成されている。
従来の手法の有効性を評価するため,CORU上でのモデル範囲のベースライン性能を確立した。
論文 参考訳(メタデータ) (2024-06-06T20:38:15Z) - RealKIE: Five Novel Datasets for Enterprise Key Information Extraction [0.0]
RealKIEは、キー情報抽出手法の進歩を目的とした、5つの挑戦的なデータセットのベンチマークである。
データセットには、SEC S1 Filings、US Non-disclosure Agreements、UK Charity Reports、FCC Invoices、Resource Contractsなど、さまざまなドキュメントが含まれている。
論文 参考訳(メタデータ) (2024-03-29T10:31:32Z) - Advancements and Challenges in Arabic Optical Character Recognition: A
Comprehensive Survey [0.6629765271909505]
本稿では,アラビア語光文字認識(OCR)に関する現代的応用,方法論,課題の徹底的なレビューを提案する。
OCRプロセス全体で広く利用されている技術について、徹底的な分析を行い、改善された成果を示す最も効果的なアプローチを識別する努力を払っている。
本稿では,最先端技術と手法の提示に加えて,アラビアOCRの領域における研究ギャップを批判的に識別する。
論文 参考訳(メタデータ) (2023-12-19T03:01:31Z) - ICDAR 2023 Competition on Structured Text Extraction from Visually-Rich
Document Images [198.35937007558078]
大会は2022年12月30日に開かれ、2023年3月24日に閉幕した。
トラック1には35人の参加者と91人の有効な応募があり、トラック2には15人の参加者と26人の応募がある。
提案手法の性能によると, 複雑なシナリオやゼロショットシナリオにおいて, 期待される情報抽出性能にはまだ大きなギャップがあると考えられる。
論文 参考訳(メタデータ) (2023-06-05T22:20:52Z) - Layout-Aware Information Extraction for Document-Grounded Dialogue:
Dataset, Method and Demonstration [75.47708732473586]
視覚的にリッチな文書から構造的知識と意味的知識の両方を抽出するためのレイアウト対応文書レベル情報抽出データセット(LIE)を提案する。
LIEには製品および公式文書の4,061ページから3つの抽出タスクの62kアノテーションが含まれている。
実験の結果、レイアウトはVRDベースの抽出に不可欠であることが示され、システムデモでは、抽出された知識が、ユーザが関心を持っている答えを見つけるのに役立つことも確認されている。
論文 参考訳(メタデータ) (2022-07-14T07:59:45Z) - One-shot Key Information Extraction from Document with Deep Partial
Graph Matching [60.48651298832829]
ドキュメントからキー情報抽出(KIE)は、多くの産業シナリオにおいて効率、生産性、セキュリティを改善する。
KIEタスクのための既存の教師付き学習手法は、多数のラベル付きサンプルを供給し、異なる種類の文書の別々のモデルを学ぶ必要がある。
部分グラフマッチングを用いたワンショットKIEのためのディープエンド・ツー・エンド・トレーニング可能なネットワークを提案する。
論文 参考訳(メタデータ) (2021-09-26T07:45:53Z) - Zero-Shot Information Extraction as a Unified Text-to-Triple Translation [56.01830747416606]
我々は、テキストから3つの翻訳フレームワークに一連の情報抽出タスクを投入した。
タスク固有の入力テキストと出力トリプルの変換としてタスクを形式化する。
本稿では,オープン情報抽出におけるゼロショット性能について検討する。
論文 参考訳(メタデータ) (2021-09-23T06:54:19Z) - ICDAR 2021 Competition on Components Segmentation Task of Document
Photos [63.289361617237944]
3つの課題タスクが提案され、提供されたデータセット上で異なるセグメンテーションの割り当てが実行される。
収集されたデータはブラジルのいくつかのID文書のもので、その個人情報は便利に交換された。
さまざまなディープラーニングモデルが、各タスクで最高の結果を得るために、さまざまな戦略を持つ参加者によって適用されました。
論文 参考訳(メタデータ) (2021-06-16T00:49:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。