論文の概要: TRACE: Table Reconstruction Aligned to Corner and Edges
- arxiv url: http://arxiv.org/abs/2305.00630v1
- Date: Mon, 1 May 2023 02:26:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-02 14:10:07.328390
- Title: TRACE: Table Reconstruction Aligned to Corner and Edges
- Title(参考訳): TRACE:コーナーとエッジに対応したテーブル再構築
- Authors: Youngmin Baek, Daehyun Nam, Jaeheung Surh, Seung Shin, Seonghyeon Kim
- Abstract要約: そこで我々は,テーブルがセルで構成され,各セルがエッジからなる境界で構成されているテーブルの自然特性を解析した。
ボトムアップ方式でテーブルを再構築する新しい手法を提案する。
シンプルな設計はモデルを訓練しやすくし、以前の2段階の手法よりも少ない計算を必要とする。
- 参考スコア(独自算出の注目度): 7.536220920052911
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A table is an object that captures structured and informative content within
a document, and recognizing a table in an image is challenging due to the
complexity and variety of table layouts. Many previous works typically adopt a
two-stage approach; (1) Table detection(TD) localizes the table region in an
image and (2) Table Structure Recognition(TSR) identifies row- and column-wise
adjacency relations between the cells. The use of a two-stage approach often
entails the consequences of error propagation between the modules and raises
training and inference inefficiency. In this work, we analyze the natural
characteristics of a table, where a table is composed of cells and each cell is
made up of borders consisting of edges. We propose a novel method to
reconstruct the table in a bottom-up manner. Through a simple process, the
proposed method separates cell boundaries from low-level features, such as
corners and edges, and localizes table positions by combining the cells. A
simple design makes the model easier to train and requires less computation
than previous two-stage methods. We achieve state-of-the-art performance on the
ICDAR2013 table competition benchmark and Wired Table in the Wild(WTW) dataset.
- Abstract(参考訳): テーブルは、ドキュメント内の構造化された情報的コンテンツをキャプチャするオブジェクトであり、画像内のテーブルを認識することは、複雑で多様なテーブルレイアウトのために困難である。
1) 表検出(td) は画像内のテーブル領域を局在化し、(2) 表構造認識(tsr) はセル間の行と列間の隣接関係を識別する。
2段階のアプローチは、しばしばモジュール間のエラー伝播の結果を伴い、トレーニングと推論の非効率性を高める。
本研究では,テーブルがセルで構成され,各セルがエッジからなる境界で構成されているテーブルの自然特性を分析する。
ボトムアップ方式でテーブルを再構築する新しい手法を提案する。
提案手法は簡単なプロセスにより,角や縁などの低レベルの特徴から細胞境界を分離し,細胞を結合してテーブル位置を局在させる。
シンプルな設計はモデルを訓練しやすくし、以前の2段階の手法よりも少ない計算を必要とする。
ICDAR2013テーブル競合ベンチマークとWired Table in the Wild(WTW)データセットで最先端の性能を実現する。
関連論文リスト
- UniTabNet: Bridging Vision and Language Models for Enhanced Table Structure Recognition [55.153629718464565]
我々は、画像からテキストへのモデルに基づくテーブル構造解析のための新しいフレームワークUniTabNetを紹介する。
UniTabNetは、画像とテキストのモデルを使ってテーブルセルを分離し、物理デコーダと論理デコーダを統合して完全なテーブル構造を再構築する。
論文 参考訳(メタデータ) (2024-09-20T01:26:32Z) - SEMv2: Table Separation Line Detection Based on Instance Segmentation [96.36188168694781]
SEMv2(SEM: Split, Embed, Merge)と呼ばれるテーブル構造認識器を提案する。
本稿では,テーブル分離ラインのインスタンスレベルの識別問題に対処し,条件付き畳み込みに基づくテーブル分離ライン検出戦略を提案する。
SEMv2を包括的に評価するために、iFLYTABと呼ばれるテーブル構造認識のためのより困難なデータセットも提示する。
論文 参考訳(メタデータ) (2023-03-08T05:15:01Z) - TRUST: An Accurate and End-to-End Table structure Recognizer Using
Splitting-based Transformers [56.56591337457137]
本稿では,TRUSTと呼ばれるテーブル構造認識手法を提案する。
変換器は、大域的な計算、完全メモリ、並列計算のためにテーブル構造認識に適している。
我々はPubTabNetやSynthTableなど,いくつかの人気のあるベンチマークで実験を行い,新しい最先端の結果を得た。
論文 参考訳(メタデータ) (2022-08-31T08:33:36Z) - TSRFormer: Table Structure Recognition with Transformers [15.708108572696064]
本稿では,TSRFormerと呼ばれる新しいテーブル構造認識手法を提案する。
新たな2段階DETRに基づくセパレータ予測手法である textbfSeparator textbfREgression textbfTRansformer (SepRETR) を提案する。
我々は、SciTSR、PubTabNet、WTWなど、いくつかのベンチマークデータセットで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-08-09T17:36:13Z) - TGRNet: A Table Graph Reconstruction Network for Table Structure
Recognition [76.06530816349763]
本稿では,表構造認識のためのエンドツーエンドのトレーニング可能な表グラフ再構成ネットワーク(TGRNet)を提案する。
具体的には,異なる細胞の空間的位置と論理的位置を共同で予測するために,細胞検出枝と細胞論理的位置分岐の2つの主枝を有する。
論文 参考訳(メタデータ) (2021-06-20T01:57:05Z) - Multi-Type-TD-TSR -- Extracting Tables from Document Images using a
Multi-stage Pipeline for Table Detection and Table Structure Recognition:
from OCR to Structured Table Representations [63.98463053292982]
テーブルの認識は、テーブル検出とテーブル構造認識という2つの主要なタスクから構成される。
最近の研究は、テーブル構造認識のタスクにトランスファーラーニングを併用したディープラーニングアプローチへの明確な傾向を示している。
本稿では,テーブル認識問題に対するエンドツーエンドのソリューションを提供するMulti-Type-TD-TSRというマルチステージパイプラインを提案する。
論文 参考訳(メタデータ) (2021-05-23T21:17:18Z) - TCN: Table Convolutional Network for Web Table Interpretation [52.32515851633981]
テーブル内情報とテーブル間情報の両方を考慮した新しいテーブル表現学習手法を提案する。
カラムタイプ予測ではf1の4.8%、カラム対関係予測ではf1の4.1%で競合ベースラインを上回ることができる。
論文 参考訳(メタデータ) (2021-02-17T02:18:10Z) - Identifying Table Structure in Documents using Conditional Generative
Adversarial Networks [0.0]
多くの産業や学術研究において、情報は主に構造化されていない文書の形で伝達される。
本稿では,まず,テーブルイメージを標準化されたスケルトンテーブル形式にマッピングするために,条件付き生成逆数ネットワークを用いたトップダウンアプローチを提案する。
次に、xy-cutプロジェクションと遺伝的アルゴリズムを用いた潜在テーブル構造を導出する。
論文 参考訳(メタデータ) (2020-01-13T20:42:40Z) - Table Structure Extraction with Bi-directional Gated Recurrent Unit
Networks [5.350788087718877]
本稿では,検出されたテーブルから行や列を高精度に抽出する,堅牢な深層学習手法を提案する。
我々は、現在利用可能なUNLVとICDAR 2013データセットのベンチマークを行い、最先端のテーブル構造抽出システムよりも大幅に性能を向上した。
論文 参考訳(メタデータ) (2020-01-08T13:17:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。