論文の概要: Guided Table Structure Recognition through Anchor Optimization
- arxiv url: http://arxiv.org/abs/2104.10538v1
- Date: Wed, 21 Apr 2021 13:53:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-22 18:28:27.147122
- Title: Guided Table Structure Recognition through Anchor Optimization
- Title(参考訳): アンカー最適化によるテーブル構造認識
- Authors: Khurram Azeem Hashmi, Didier Stricker, Marcus Liwicki, Muhammad Noman
Afzal and Muhammad Zeshan Afzal
- Abstract要約: 本稿では,誘導アンカーを用いたテーブル構造認識への新しいアプローチを提案する。
この概念は、オブジェクト検出法を生かして適用するテーブル構造認識に対する現在の最先端のアプローチとは異なる。
ICDAR-2013データセットでは、行の平均F-Measureは95.05$%、列は96.32$%である。
- 参考スコア(独自算出の注目度): 13.046933515024264
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents the novel approach towards table structure recognition by
leveraging the guided anchors. The concept differs from current
state-of-the-art approaches for table structure recognition that naively apply
object detection methods. In contrast to prior techniques, first, we estimate
the viable anchors for table structure recognition. Subsequently, these anchors
are exploited to locate the rows and columns in tabular images. Furthermore,
the paper introduces a simple and effective method that improves the results by
using tabular layouts in realistic scenarios. The proposed method is
exhaustively evaluated on the two publicly available datasets of table
structure recognition i.e ICDAR-2013 and TabStructDB. We accomplished
state-of-the-art results on the ICDAR-2013 dataset with an average F-Measure of
95.05$\%$ (94.6$\%$ for rows and 96.32$\%$ for columns) and surpassed the
baseline results on the TabStructDB dataset with an average F-Measure of
94.17$\%$ (94.08$\%$ for rows and 95.06$\%$ for columns).
- Abstract(参考訳): 本稿では,誘導アンカーを用いたテーブル構造認識への新しいアプローチを提案する。
この概念は、オブジェクト検出法を生かして適用するテーブル構造認識に対する現在の最先端のアプローチとは異なる。
先行手法とは対照的に, まず, テーブル構造認識に使用可能なアンカーを推定する。
その後、これらのアンカーが表画像の行と列を見つけるために利用される。
さらに,現実的なシナリオにおいて表状レイアウトを用いることにより,結果を改善するための簡易かつ効果的な手法を提案する。
ICDAR-2013とTabStructDBの2つの表構造認識データセットに対して,提案手法を網羅的に評価した。
icdar-2013データセットでは,平均f-measureが95.05$\%$ (行が94.6$\%$,カラムが96.32$\%$$) であり,平均f-measureが94.17$\%$ (行が94.08$\%$,カラムが95.06$\$$$$) であった。
関連論文リスト
- UniTabNet: Bridging Vision and Language Models for Enhanced Table Structure Recognition [55.153629718464565]
我々は、画像からテキストへのモデルに基づくテーブル構造解析のための新しいフレームワークUniTabNetを紹介する。
UniTabNetは、画像とテキストのモデルを使ってテーブルセルを分離し、物理デコーダと論理デコーダを統合して完全なテーブル構造を再構築する。
論文 参考訳(メタデータ) (2024-09-20T01:26:32Z) - A Closer Look at Deep Learning on Tabular Data [52.50778536274327]
タブラルデータは、機械学習の様々な領域で広く使われている。
Deep Neural Network(DNN)ベースの手法は、ツリーベースに匹敵する有望なパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-07-01T04:24:07Z) - ClusterTabNet: Supervised clustering method for table detection and table structure recognition [0.0]
文書中の単語をクラスタリングする深層学習に基づく新しい手法を提案する。
表構造ボトムアップを一対の単語間の関係グラフとして解釈し、変圧器エンコーダモデルを用いてその隣接行列を予測する。
DETRやFaster R-CNNのような現在の最先端検出手法と比較して,本手法は比較的小さなモデルを必要とするが,類似性や精度が向上する。
論文 参考訳(メタデータ) (2024-02-12T09:10:24Z) - SEMv2: Table Separation Line Detection Based on Instance Segmentation [96.36188168694781]
SEMv2(SEM: Split, Embed, Merge)と呼ばれるテーブル構造認識器を提案する。
本稿では,テーブル分離ラインのインスタンスレベルの識別問題に対処し,条件付き畳み込みに基づくテーブル分離ライン検出戦略を提案する。
SEMv2を包括的に評価するために、iFLYTABと呼ばれるテーブル構造認識のためのより困難なデータセットも提示する。
論文 参考訳(メタデータ) (2023-03-08T05:15:01Z) - TRUST: An Accurate and End-to-End Table structure Recognizer Using
Splitting-based Transformers [56.56591337457137]
本稿では,TRUSTと呼ばれるテーブル構造認識手法を提案する。
変換器は、大域的な計算、完全メモリ、並列計算のためにテーブル構造認識に適している。
我々はPubTabNetやSynthTableなど,いくつかの人気のあるベンチマークで実験を行い,新しい最先端の結果を得た。
論文 参考訳(メタデータ) (2022-08-31T08:33:36Z) - Table Structure Recognition with Conditional Attention [13.976736586808308]
テーブル構造認識(TSR)問題は、テーブルの構造を認識し、非構造化テーブルを構造化および機械可読フォーマットに変換することを目的としている。
本研究では, 複雑なテーブル構造を, 頂点と辺がそれぞれ細胞を表し, 細胞間の関連を表わすグラフで表すことができると仮定する。
実験の結果,セル境界ボックスのアライメントは,マイクロ平均F1スコアが0.915から0.963に,マクロ平均F1スコアが0.787から0.923に向上することがわかった。
論文 参考訳(メタデータ) (2022-03-08T02:44:58Z) - Split, embed and merge: An accurate table structure recognizer [42.579215135672094]
テーブル構造認識器としてSplit, Embed, Merge (SEM) を導入する。
SEM は SciTSR データセットで平均 F-Measure の 96.9% を達成できる。
論文 参考訳(メタデータ) (2021-07-12T06:26:19Z) - TGRNet: A Table Graph Reconstruction Network for Table Structure
Recognition [76.06530816349763]
本稿では,表構造認識のためのエンドツーエンドのトレーニング可能な表グラフ再構成ネットワーク(TGRNet)を提案する。
具体的には,異なる細胞の空間的位置と論理的位置を共同で予測するために,細胞検出枝と細胞論理的位置分岐の2つの主枝を有する。
論文 参考訳(メタデータ) (2021-06-20T01:57:05Z) - Tab.IAIS: Flexible Table Recognition and Semantic Interpretation System [84.39812458417246]
完全テーブル認識処理を行い、最も頻繁なテーブル形式をサポートする2つのルールベースのアルゴリズムを開発する。
意味情報の抽出をテーブル認識プロセスに組み込むため,グラフに基づくテーブル解釈法を開発した。
我々のテーブル認識アプローチは、最先端のアプローチと競合する結果を得る。
論文 参考訳(メタデータ) (2021-05-25T12:31:02Z) - Table Structure Recognition using Top-Down and Bottom-Up Cues [28.65687982486627]
本稿では,細胞検出と相互作用モジュールを組み合わせたテーブル構造認識手法を提案する。
実際に利用可能な実世界のデータセット上で,我々の手法を実証的に検証する。
論文 参考訳(メタデータ) (2020-10-09T13:32:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。