論文の概要: Parsing Table Structures in the Wild
- arxiv url: http://arxiv.org/abs/2109.02199v1
- Date: Mon, 6 Sep 2021 01:05:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-08 03:07:48.857559
- Title: Parsing Table Structures in the Wild
- Title(参考訳): 野生におけるテーブル構造解析
- Authors: Rujiao Long and Wen Wang and Nan Xue and Feiyu Gao and Zhibo Yang and
Yongpan Wang and Gui-Song Xia
- Abstract要約: 本稿では,野生の画像からテーブル構造解析(TSP)の問題に取り組む。
本稿では,CenterNet上にCycle-CenterNetという新しいサイクルペアリングモジュールを持つアプローチを提案する。
実験では,我々のCycle-CenterNetが新しいWTWデータセット上でのテーブル構造解析の精度を一貫して達成していることを示す。
- 参考スコア(独自算出の注目度): 31.72347768545413
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper tackles the problem of table structure parsing (TSP) from images
in the wild. In contrast to existing studies that mainly focus on parsing
well-aligned tabular images with simple layouts from scanned PDF documents, we
aim to establish a practical table structure parsing system for real-world
scenarios where tabular input images are taken or scanned with severe
deformation, bending or occlusions. For designing such a system, we propose an
approach named Cycle-CenterNet on the top of CenterNet with a novel
cycle-pairing module to simultaneously detect and group tabular cells into
structured tables. In the cycle-pairing module, a new pairing loss function is
proposed for the network training. Alongside with our Cycle-CenterNet, we also
present a large-scale dataset, named Wired Table in the Wild (WTW), which
includes well-annotated structure parsing of multiple style tables in several
scenes like the photo, scanning files, web pages, \emph{etc.}. In experiments,
we demonstrate that our Cycle-CenterNet consistently achieves the best accuracy
of table structure parsing on the new WTW dataset by 24.6\% absolute
improvement evaluated by the TEDS metric. A more comprehensive experimental
analysis also validates the advantages of our proposed methods for the TSP
task.
- Abstract(参考訳): 本稿では,野生の画像からテーブル構造解析(TSP)の問題に取り組む。
スキャンしたPDF文書から簡単なレイアウトで整列した表像を解析する従来の研究とは対照的に,本研究では,表像を重度な変形,曲げ,閉塞で撮影・スキャンする実世界のシナリオを対象としたテーブル構造解析システムの構築を目的とする。
このようなシステムを設計するために, 表型セルを同時検出・グループ化する新しいサイクルペアリングモジュールを centernet の上部に設けた cycle-centernet という手法を提案する。
サイクルペアリングモジュールでは,ネットワークトレーニングのための新たなペアリング損失関数が提案されている。
当社のcycle-centernetに加えて,wired table in the wild(wtw)という,写真やスキャニングファイル,webページ,\emph{etc.}など,複数のスタイルテーブルを十分に注釈付きで解析する大規模なデータセットも提示しています。
実験では,我々のCycle-CenterNetが新しいWTWデータセット上でのテーブル構造解析の精度を,TEDS測定値による絶対改善率24.6%で一貫して達成することを示した。
より包括的な実験分析により,提案手法のtspタスクに対する利点を検証した。
関連論文リスト
- UniTabNet: Bridging Vision and Language Models for Enhanced Table Structure Recognition [55.153629718464565]
我々は、画像からテキストへのモデルに基づくテーブル構造解析のための新しいフレームワークUniTabNetを紹介する。
UniTabNetは、画像とテキストのモデルを使ってテーブルセルを分離し、物理デコーダと論理デコーダを統合して完全なテーブル構造を再構築する。
論文 参考訳(メタデータ) (2024-09-20T01:26:32Z) - TRACE: Table Reconstruction Aligned to Corner and Edges [7.536220920052911]
そこで我々は,テーブルがセルで構成され,各セルがエッジからなる境界で構成されているテーブルの自然特性を解析した。
ボトムアップ方式でテーブルを再構築する新しい手法を提案する。
シンプルな設計はモデルを訓練しやすくし、以前の2段階の手法よりも少ない計算を必要とする。
論文 参考訳(メタデータ) (2023-05-01T02:26:15Z) - SEMv2: Table Separation Line Detection Based on Instance Segmentation [96.36188168694781]
SEMv2(SEM: Split, Embed, Merge)と呼ばれるテーブル構造認識器を提案する。
本稿では,テーブル分離ラインのインスタンスレベルの識別問題に対処し,条件付き畳み込みに基づくテーブル分離ライン検出戦略を提案する。
SEMv2を包括的に評価するために、iFLYTABと呼ばれるテーブル構造認識のためのより困難なデータセットも提示する。
論文 参考訳(メタデータ) (2023-03-08T05:15:01Z) - TRUST: An Accurate and End-to-End Table structure Recognizer Using
Splitting-based Transformers [56.56591337457137]
本稿では,TRUSTと呼ばれるテーブル構造認識手法を提案する。
変換器は、大域的な計算、完全メモリ、並列計算のためにテーブル構造認識に適している。
我々はPubTabNetやSynthTableなど,いくつかの人気のあるベンチマークで実験を行い,新しい最先端の結果を得た。
論文 参考訳(メタデータ) (2022-08-31T08:33:36Z) - Multi-Type-TD-TSR -- Extracting Tables from Document Images using a
Multi-stage Pipeline for Table Detection and Table Structure Recognition:
from OCR to Structured Table Representations [63.98463053292982]
テーブルの認識は、テーブル検出とテーブル構造認識という2つの主要なタスクから構成される。
最近の研究は、テーブル構造認識のタスクにトランスファーラーニングを併用したディープラーニングアプローチへの明確な傾向を示している。
本稿では,テーブル認識問題に対するエンドツーエンドのソリューションを提供するMulti-Type-TD-TSRというマルチステージパイプラインを提案する。
論文 参考訳(メタデータ) (2021-05-23T21:17:18Z) - A Graph Representation of Semi-structured Data for Web Question
Answering [96.46484690047491]
本稿では、半構造化データとそれらの関係の構成要素の体系的分類に基づいて、Webテーブルとリストのグラフ表現を提案する。
本手法は,最先端のベースラインに対してF1スコアを3.90ポイント向上させる。
論文 参考訳(メタデータ) (2020-10-14T04:01:54Z) - GraPPa: Grammar-Augmented Pre-Training for Table Semantic Parsing [117.98107557103877]
テーブルセマンティック解析のための効果的な事前学習手法GraPPaを提案する。
我々は、同期文脈自由文法を用いて、高自由度テーブル上に合成質問ペアを構築する。
実世界のデータを表現できるモデルの能力を維持するため、マスキング言語モデリングも含んでいる。
論文 参考訳(メタデータ) (2020-09-29T08:17:58Z) - Identifying Table Structure in Documents using Conditional Generative
Adversarial Networks [0.0]
多くの産業や学術研究において、情報は主に構造化されていない文書の形で伝達される。
本稿では,まず,テーブルイメージを標準化されたスケルトンテーブル形式にマッピングするために,条件付き生成逆数ネットワークを用いたトップダウンアプローチを提案する。
次に、xy-cutプロジェクションと遺伝的アルゴリズムを用いた潜在テーブル構造を導出する。
論文 参考訳(メタデータ) (2020-01-13T20:42:40Z) - Table Structure Extraction with Bi-directional Gated Recurrent Unit
Networks [5.350788087718877]
本稿では,検出されたテーブルから行や列を高精度に抽出する,堅牢な深層学習手法を提案する。
我々は、現在利用可能なUNLVとICDAR 2013データセットのベンチマークを行い、最先端のテーブル構造抽出システムよりも大幅に性能を向上した。
論文 参考訳(メタデータ) (2020-01-08T13:17:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。