論文の概要: Current Status and Performance Analysis of Table Recognition in Document
Images with Deep Neural Networks
- arxiv url: http://arxiv.org/abs/2104.14272v1
- Date: Thu, 29 Apr 2021 11:43:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-30 20:30:45.924820
- Title: Current Status and Performance Analysis of Table Recognition in Document
Images with Deep Neural Networks
- Title(参考訳): ディープニューラルネットワークを用いた文書画像におけるテーブル認識の現状と性能解析
- Authors: Khurram Azeem Hashmi, Marcus Liwicki, Didier Stricker, Muhammad Adnan
Afzal, Muhammad Ahtsham Afzal and Muhammad Zeshan Afzal
- Abstract要約: テーブルの検出と構造認識は、テーブル理解の領域における重要な問題です。
グラフィカル処理ユニットの計算能力の最近の進歩により、ディープニューラルネットワークは従来の機械学習手法より優れている。
本論文では,深層ニューラルネットワークを用いた最新の手法を徹底的に分析する。
- 参考スコア(独自算出の注目度): 12.161050209491496
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The first phase of table recognition is to detect the tabular area in a
document. Subsequently, the tabular structures are recognized in the second
phase in order to extract information from the respective cells. Table
detection and structural recognition are pivotal problems in the domain of
table understanding. However, table analysis is a perplexing task due to the
colossal amount of diversity and asymmetry in tables. Therefore, it is an
active area of research in document image analysis. Recent advances in the
computing capabilities of graphical processing units have enabled deep neural
networks to outperform traditional state-of-the-art machine learning methods.
Table understanding has substantially benefited from the recent breakthroughs
in deep neural networks. However, there has not been a consolidated description
of the deep learning methods for table detection and table structure
recognition. This review paper provides a thorough analysis of the modern
methodologies that utilize deep neural networks. This work provided a thorough
understanding of the current state-of-the-art and related challenges of table
understanding in document images. Furthermore, the leading datasets and their
intricacies have been elaborated along with the quantitative results. Moreover,
a brief overview is given regarding the promising directions that can serve as
a guide to further improve table analysis in document images.
- Abstract(参考訳): テーブル認識の第1フェーズは、文書内の表領域を検出することである。
その後、各セルから情報を抽出するために第2フェーズで表構造を認識する。
テーブル検出と構造認識は、テーブル理解の領域において重要な問題である。
しかし、テーブル分析は、テーブルの多様性と非対称性の余剰量のために、複雑なタスクである。
したがって、文書画像解析における研究の活発な領域である。
グラフィカル処理ユニットの計算能力の最近の進歩により、ディープニューラルネットワークは従来の最先端の機械学習手法より優れている。
テーブル理解は、ディープニューラルネットワークの最近のブレークスルーから大きな恩恵を受けている。
しかし,テーブル検出とテーブル構造認識のための深層学習手法の統一的な説明は行われていない。
本稿では,ディープニューラルネットワークを利用した現代手法の詳細な分析を行う。
この研究は、文書画像のテーブル理解の現在の状況と関連する課題を徹底的に理解した。
さらに、先行するデータセットとその複雑さを定量的な結果とともに詳述した。
さらに,ドキュメント画像のテーブル解析をさらに改善するためのガイドとして機能する有望な方向性について,概要を述べる。
関連論文リスト
- Knowledge-Aware Reasoning over Multimodal Semi-structured Tables [85.24395216111462]
本研究では、現在のAIモデルがマルチモーダルな構造化データに基づいて知識を考慮した推論を行うことができるかどうかを検討する。
この目的のために設計された新しいデータセットであるMMTabQAを紹介する。
我々の実験は、複数のテキストと画像の入力を効果的に統合し解釈する上で、現在のAIモデルに対する重大な課題を浮き彫りにしている。
論文 参考訳(メタデータ) (2024-08-25T15:17:43Z) - From Pixels to Insights: A Survey on Automatic Chart Understanding in the Era of Large Foundation Models [98.41645229835493]
グラフ形式のデータの可視化は、データ分析において重要な役割を担い、重要な洞察を提供し、情報的な意思決定を支援する。
大規模言語モデルのような大規模な基盤モデルは、様々な自然言語処理タスクに革命をもたらした。
本研究は,自然言語処理,コンピュータビジョン,データ解析の分野における研究者や実践者の包括的資源として機能する。
論文 参考訳(メタデータ) (2024-03-18T17:57:09Z) - Graph Neural Networks and Representation Embedding for Table Extraction
in PDF Documents [1.1859913430860336]
この研究の主な貢献は、グラフニューラルネットワークを利用したテーブル抽出の問題に取り組むことである。
PubLayNetおよびPubTables-1Mデータセットに提供される情報をマージして得られた新しいデータセットに対する提案手法を実験的に評価した。
論文 参考訳(メタデータ) (2022-08-23T21:36:01Z) - Temporal Graph Network Embedding with Causal Anonymous Walks
Representations [54.05212871508062]
本稿では,時間グラフネットワークに基づく動的ネットワーク表現学習のための新しいアプローチを提案する。
評価のために、時間的ネットワーク埋め込みの評価のためのベンチマークパイプラインを提供する。
欧州の大手銀行が提供した実世界のダウンストリームグラフ機械学習タスクにおいて、我々のモデルの適用性と優れた性能を示す。
論文 参考訳(メタデータ) (2021-08-19T15:39:52Z) - TGRNet: A Table Graph Reconstruction Network for Table Structure
Recognition [76.06530816349763]
本稿では,表構造認識のためのエンドツーエンドのトレーニング可能な表グラフ再構成ネットワーク(TGRNet)を提案する。
具体的には,異なる細胞の空間的位置と論理的位置を共同で予測するために,細胞検出枝と細胞論理的位置分岐の2つの主枝を有する。
論文 参考訳(メタデータ) (2021-06-20T01:57:05Z) - TabularNet: A Neural Network Architecture for Understanding Semantic
Structures of Tabular Data [30.479822289380255]
本稿では,テーブルから空間情報と関係情報を同時に抽出する新しいニューラルネットワークアーキテクチャであるTabularNetを提案する。
リレーショナル情報のために,WordNet木に基づく新しいグラフ構築法を設計し,GCNベースのエンコーダを採用する。
私たちのニューラルネットワークアーキテクチャは、さまざまな理解タスクのための統一されたニューラルネットワークバックボーンであり、マルチタスクシナリオで利用できます。
論文 参考訳(メタデータ) (2021-06-06T11:48:09Z) - Multi-Type-TD-TSR -- Extracting Tables from Document Images using a
Multi-stage Pipeline for Table Detection and Table Structure Recognition:
from OCR to Structured Table Representations [63.98463053292982]
テーブルの認識は、テーブル検出とテーブル構造認識という2つの主要なタスクから構成される。
最近の研究は、テーブル構造認識のタスクにトランスファーラーニングを併用したディープラーニングアプローチへの明確な傾向を示している。
本稿では,テーブル認識問題に対するエンドツーエンドのソリューションを提供するMulti-Type-TD-TSRというマルチステージパイプラインを提案する。
論文 参考訳(メタデータ) (2021-05-23T21:17:18Z) - Towards Deeper Graph Neural Networks [63.46470695525957]
グラフ畳み込みは近傍の集約を行い、最も重要なグラフ操作の1つである。
いくつかの最近の研究で、この性能劣化は過度に滑らかな問題に起因している。
本研究では,大きな受容領域からの情報を適応的に組み込むディープ適応グラフニューラルネットワーク(DAGNN)を提案する。
論文 参考訳(メタデータ) (2020-07-18T01:11:14Z) - Table Structure Extraction with Bi-directional Gated Recurrent Unit
Networks [5.350788087718877]
本稿では,検出されたテーブルから行や列を高精度に抽出する,堅牢な深層学習手法を提案する。
我々は、現在利用可能なUNLVとICDAR 2013データセットのベンチマークを行い、最先端のテーブル構造抽出システムよりも大幅に性能を向上した。
論文 参考訳(メタデータ) (2020-01-08T13:17:44Z) - TableNet: Deep Learning model for end-to-end Table detection and Tabular
data extraction from Scanned Document Images [18.016832803961165]
本稿では,テーブル検出と構造認識のための新しいエンドツーエンドディープラーニングモデルを提案する。
TableNetは、テーブル検出のツインタスクとテーブル構造認識の相互依存性を利用する。
提案手法は, ICDAR 2013 と Marmot Table のデータセットを用いて評価した。
論文 参考訳(メタデータ) (2020-01-06T10:25:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。