論文の概要: Tabular Structure Detection from Document Images for Resource
Constrained Devices Using A Row Based Similarity Measure
- arxiv url: http://arxiv.org/abs/2008.11842v1
- Date: Wed, 26 Aug 2020 21:59:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-24 21:55:28.352053
- Title: Tabular Structure Detection from Document Images for Resource
Constrained Devices Using A Row Based Similarity Measure
- Title(参考訳): 列型類似度尺度を用いた資源制約機器用文書画像からの表構造検出
- Authors: Soumyadeep Dey, Jayanta Mukhopadhyay, Shamik Sural
- Abstract要約: タブラル構造は、構造的で明快な方法で重要な情報を示すために使用される。
既存の手法のほとんどは、テーブルの構造に関する事前の知識を用いて、文書画像からテーブルを検出する。
- 参考スコア(独自算出の注目度): 0.9814898713780167
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tabular structures are used to present crucial information in a structured
and crisp manner. Detection of such regions is of great importance for proper
understanding of a document. Tabular structures can be of various layouts and
types. Therefore, detection of these regions is a hard problem. Most of the
existing techniques detect tables from a document image by using prior
knowledge of the structures of the tables. However, these methods are not
applicable for generalized tabular structures. In this work, we propose a
similarity measure to find similarities between pairs of rows in a tabular
structure. This similarity measure is utilized to identify a tabular region.
Since the tabular regions are detected exploiting the similarities among all
rows, the method is inherently independent of layouts of the tabular regions
present in the training data. Moreover, the proposed similarity measure can be
used to identify tabular regions without using large sets of parameters
associated with recent deep learning based methods. Thus, the proposed method
can easily be used with resource constrained devices such as mobile devices
without much of an overhead.
- Abstract(参考訳): タブラル構造は、構造的で明快な方法で重要な情報を示すために使用される。
このような領域の検出は、文書の適切な理解において非常に重要である。
表構造は様々なレイアウトと型を持つことができる。
したがって、これらの領域の検出は難しい問題である。
既存の技術のほとんどは、テーブルの構造に関する事前の知識を用いて、ドキュメントイメージからテーブルを検出する。
しかし、これらの手法は一般化された表構造には適用できない。
本研究では,表構造における一対の行間の類似性を求めるための類似度尺度を提案する。
この類似度尺度を用いて表状領域を同定する。
表領域は全ての行間の類似性を利用して検出されるため、訓練データに存在する表領域のレイアウトとは本質的に無関係である。
さらに,近年の深層学習法に関連するパラメータ集合を用いることなく,類似度尺度を用いて表領域の同定を行うことができる。
提案手法は,モバイル機器などの資源制約されたデバイスで,オーバーヘッドを伴わずに容易に利用することができる。
関連論文リスト
- A Closer Look at Deep Learning on Tabular Data [52.50778536274327]
タブラルデータは、機械学習の様々な領域で広く使われている。
Deep Neural Network(DNN)ベースの手法は、ツリーベースに匹敵する有望なパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-07-01T04:24:07Z) - SEMv2: Table Separation Line Detection Based on Instance Segmentation [96.36188168694781]
SEMv2(SEM: Split, Embed, Merge)と呼ばれるテーブル構造認識器を提案する。
本稿では,テーブル分離ラインのインスタンスレベルの識別問題に対処し,条件付き畳み込みに基づくテーブル分離ライン検出戦略を提案する。
SEMv2を包括的に評価するために、iFLYTABと呼ばれるテーブル構造認識のためのより困難なデータセットも提示する。
論文 参考訳(メタデータ) (2023-03-08T05:15:01Z) - TRUST: An Accurate and End-to-End Table structure Recognizer Using
Splitting-based Transformers [56.56591337457137]
本稿では,TRUSTと呼ばれるテーブル構造認識手法を提案する。
変換器は、大域的な計算、完全メモリ、並列計算のためにテーブル構造認識に適している。
我々はPubTabNetやSynthTableなど,いくつかの人気のあるベンチマークで実験を行い,新しい最先端の結果を得た。
論文 参考訳(メタデータ) (2022-08-31T08:33:36Z) - Evaluating Table Structure Recognition: A New Perspective [2.1067139116005595]
テーブル構造認識アルゴリズムの評価に用いられる既存のメトリクスは、テキストと空のセルのアライメントのキャプチャに関して欠点がある。
本稿では,テキストの代わりにバウンディングボックスを用いたテーブル構造認識のための新しいメトリック-TEDSベースのIOU類似度(TEDS (IOU))を提案する。
論文 参考訳(メタデータ) (2022-07-31T07:48:36Z) - Split, embed and merge: An accurate table structure recognizer [42.579215135672094]
テーブル構造認識器としてSplit, Embed, Merge (SEM) を導入する。
SEM は SciTSR データセットで平均 F-Measure の 96.9% を達成できる。
論文 参考訳(メタデータ) (2021-07-12T06:26:19Z) - TGRNet: A Table Graph Reconstruction Network for Table Structure
Recognition [76.06530816349763]
本稿では,表構造認識のためのエンドツーエンドのトレーニング可能な表グラフ再構成ネットワーク(TGRNet)を提案する。
具体的には,異なる細胞の空間的位置と論理的位置を共同で予測するために,細胞検出枝と細胞論理的位置分岐の2つの主枝を有する。
論文 参考訳(メタデータ) (2021-06-20T01:57:05Z) - Multi-Type-TD-TSR -- Extracting Tables from Document Images using a
Multi-stage Pipeline for Table Detection and Table Structure Recognition:
from OCR to Structured Table Representations [63.98463053292982]
テーブルの認識は、テーブル検出とテーブル構造認識という2つの主要なタスクから構成される。
最近の研究は、テーブル構造認識のタスクにトランスファーラーニングを併用したディープラーニングアプローチへの明確な傾向を示している。
本稿では,テーブル認識問題に対するエンドツーエンドのソリューションを提供するMulti-Type-TD-TSRというマルチステージパイプラインを提案する。
論文 参考訳(メタデータ) (2021-05-23T21:17:18Z) - Table Structure Recognition using Top-Down and Bottom-Up Cues [28.65687982486627]
本稿では,細胞検出と相互作用モジュールを組み合わせたテーブル構造認識手法を提案する。
実際に利用可能な実世界のデータセット上で,我々の手法を実証的に検証する。
論文 参考訳(メタデータ) (2020-10-09T13:32:53Z) - A Comparative Study on Structural and Semantic Properties of Sentence
Embeddings [77.34726150561087]
本稿では,関係抽出に広く利用されている大規模データセットを用いた実験セットを提案する。
異なる埋め込み空間は、構造的および意味的特性に対して異なる強度を持つことを示す。
これらの結果は,埋め込み型関係抽出法の開発に有用な情報を提供する。
論文 参考訳(メタデータ) (2020-09-23T15:45:32Z) - Identifying Table Structure in Documents using Conditional Generative
Adversarial Networks [0.0]
多くの産業や学術研究において、情報は主に構造化されていない文書の形で伝達される。
本稿では,まず,テーブルイメージを標準化されたスケルトンテーブル形式にマッピングするために,条件付き生成逆数ネットワークを用いたトップダウンアプローチを提案する。
次に、xy-cutプロジェクションと遺伝的アルゴリズムを用いた潜在テーブル構造を導出する。
論文 参考訳(メタデータ) (2020-01-13T20:42:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。