論文の概要: GridFormer: Towards Accurate Table Structure Recognition via Grid
Prediction
- arxiv url: http://arxiv.org/abs/2309.14962v1
- Date: Tue, 26 Sep 2023 14:29:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-27 13:21:41.945049
- Title: GridFormer: Towards Accurate Table Structure Recognition via Grid
Prediction
- Title(参考訳): GridFormer: グリッド予測による正確なテーブル構造認識を目指して
- Authors: Pengyuan Lyu, Weihong Ma, Hongyi Wang, Yuechen Yu, Chengquan Zhang,
Kun Yao, Yang Xue, Jingdong Wang
- Abstract要約: 制約のないテーブル構造を解釈する新しい手法であるGridFormerを提案する。
本稿では,MXNグリッドの形式でフレキシブルなテーブル表現を提案する。
そして,DTR型テーブル構造認識器を導入し,このグリッドの多目的情報を単一ショットで効率的に予測する。
- 参考スコア(独自算出の注目度): 35.15882175670814
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: All tables can be represented as grids. Based on this observation, we propose
GridFormer, a novel approach for interpreting unconstrained table structures by
predicting the vertex and edge of a grid. First, we propose a flexible table
representation in the form of an MXN grid. In this representation, the vertexes
and edges of the grid store the localization and adjacency information of the
table. Then, we introduce a DETR-style table structure recognizer to
efficiently predict this multi-objective information of the grid in a single
shot. Specifically, given a set of learned row and column queries, the
recognizer directly outputs the vertexes and edges information of the
corresponding rows and columns. Extensive experiments on five challenging
benchmarks which include wired, wireless, multi-merge-cell, oriented, and
distorted tables demonstrate the competitive performance of our model over
other methods.
- Abstract(参考訳): すべてのテーブルはグリッドとして表現できる。
この観測に基づいて,グリッドの頂点と辺を予測し,制約のないテーブル構造を解釈する新しい手法であるGridFormerを提案する。
まず、MXNグリッドの形式でフレキシブルなテーブル表現を提案する。
この表現では、グリッドの頂点とエッジはテーブルの局所化と隣接情報を格納する。
そして,DTR型テーブル構造認識器を導入し,このグリッドの多目的情報を単一ショットで効率的に予測する。
具体的には、学習された行と列のクエリのセットが与えられると、認識者は対応する行と列の頂点とエッジ情報を直接出力する。
有線、無線、マルチマージセル、指向性、歪んだテーブルを含む5つの挑戦的ベンチマーク実験は、我々のモデルが他の方法よりも優れていることを示す。
関連論文リスト
- LaTable: Towards Large Tabular Models [63.995130144110156]
タブラル生成基盤モデルは、異なるデータセットの不均一な特徴空間のために構築が困難である。
LaTableは、これらの課題に対処し、異なるデータセットでトレーニング可能な、新しい拡散モデルである。
LaTableは、分散生成のベースラインよりも優れており、微調整されたLaTableは、より少ないサンプルで分散データセットをより良く生成できる。
論文 参考訳(メタデータ) (2024-06-25T16:03:50Z) - TRACE: Table Reconstruction Aligned to Corner and Edges [7.536220920052911]
そこで我々は,テーブルがセルで構成され,各セルがエッジからなる境界で構成されているテーブルの自然特性を解析した。
ボトムアップ方式でテーブルを再構築する新しい手法を提案する。
シンプルな設計はモデルを訓練しやすくし、以前の2段階の手法よりも少ない計算を必要とする。
論文 参考訳(メタデータ) (2023-05-01T02:26:15Z) - SEMv2: Table Separation Line Detection Based on Instance Segmentation [96.36188168694781]
SEMv2(SEM: Split, Embed, Merge)と呼ばれるテーブル構造認識器を提案する。
本稿では,テーブル分離ラインのインスタンスレベルの識別問題に対処し,条件付き畳み込みに基づくテーブル分離ライン検出戦略を提案する。
SEMv2を包括的に評価するために、iFLYTABと呼ばれるテーブル構造認識のためのより困難なデータセットも提示する。
論文 参考訳(メタデータ) (2023-03-08T05:15:01Z) - TRUST: An Accurate and End-to-End Table structure Recognizer Using
Splitting-based Transformers [56.56591337457137]
本稿では,TRUSTと呼ばれるテーブル構造認識手法を提案する。
変換器は、大域的な計算、完全メモリ、並列計算のためにテーブル構造認識に適している。
我々はPubTabNetやSynthTableなど,いくつかの人気のあるベンチマークで実験を行い,新しい最先端の結果を得た。
論文 参考訳(メタデータ) (2022-08-31T08:33:36Z) - Split, embed and merge: An accurate table structure recognizer [42.579215135672094]
テーブル構造認識器としてSplit, Embed, Merge (SEM) を導入する。
SEM は SciTSR データセットで平均 F-Measure の 96.9% を達成できる。
論文 参考訳(メタデータ) (2021-07-12T06:26:19Z) - TGRNet: A Table Graph Reconstruction Network for Table Structure
Recognition [76.06530816349763]
本稿では,表構造認識のためのエンドツーエンドのトレーニング可能な表グラフ再構成ネットワーク(TGRNet)を提案する。
具体的には,異なる細胞の空間的位置と論理的位置を共同で予測するために,細胞検出枝と細胞論理的位置分岐の2つの主枝を有する。
論文 参考訳(メタデータ) (2021-06-20T01:57:05Z) - Retrieving Complex Tables with Multi-Granular Graph Representation
Learning [20.72341939868327]
自然言語テーブル検索の課題は,自然言語クエリに基づいて意味的に関連するテーブルを検索することである。
既存の学習システムは、テーブルがデータフレームとして構成されているという仮定に基づいて、テーブルをプレーンテキストとして扱う。
多粒グラフ表現学習を用いた一般化可能なNLTRフレームワークであるグラフベーステーブル検索(GTR)を提案する。
論文 参考訳(メタデータ) (2021-05-04T20:19:03Z) - TCN: Table Convolutional Network for Web Table Interpretation [52.32515851633981]
テーブル内情報とテーブル間情報の両方を考慮した新しいテーブル表現学習手法を提案する。
カラムタイプ予測ではf1の4.8%、カラム対関係予測ではf1の4.1%で競合ベースラインを上回ることができる。
論文 参考訳(メタデータ) (2021-02-17T02:18:10Z) - Identifying Table Structure in Documents using Conditional Generative
Adversarial Networks [0.0]
多くの産業や学術研究において、情報は主に構造化されていない文書の形で伝達される。
本稿では,まず,テーブルイメージを標準化されたスケルトンテーブル形式にマッピングするために,条件付き生成逆数ネットワークを用いたトップダウンアプローチを提案する。
次に、xy-cutプロジェクションと遺伝的アルゴリズムを用いた潜在テーブル構造を導出する。
論文 参考訳(メタデータ) (2020-01-13T20:42:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。