論文の概要: Table Detection in the Wild: A Novel Diverse Table Detection Dataset and
Method
- arxiv url: http://arxiv.org/abs/2209.09207v1
- Date: Wed, 31 Aug 2022 14:20:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-25 17:48:05.902065
- Title: Table Detection in the Wild: A Novel Diverse Table Detection Dataset and
Method
- Title(参考訳): 野生におけるテーブル検出:新しい多様なテーブル検出データセットおよび方法
- Authors: Mrinal Haloi, Shashank Shekhar, Nikhil Fande, Siddhant Swaroop Dash,
Sanjay G
- Abstract要約: テーブル検出のための大規模データセットを7万以上のサンプルで紹介する。
また、文書中のテーブル構造を検出する畳み込みニューラルネットワークを用いたベースライン結果も提示する。
- 参考スコア(独自算出の注目度): 1.328815071846793
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent deep learning approaches in table detection achieved outstanding
performance and proved to be effective in identifying document layouts.
Currently, available table detection benchmarks have many limitations,
including the lack of samples diversity, simple table structure, the lack of
training cases, and samples quality. In this paper, we introduce a diverse
large-scale dataset for table detection with more than seven thousand samples
containing a wide variety of table structures collected from many diverse
sources. In addition to that, we also present baseline results using a
convolutional neural network-based method to detect table structure in
documents. Experimental results show the superiority of applying convolutional
deep learning methods over classical computer vision-based methods. The
introduction of this diverse table detection dataset will enable the community
to develop high throughput deep learning methods for understanding document
layout and tabular data processing.
- Abstract(参考訳): テーブル検出における近年の深層学習手法は優れた性能を達成し,文書レイアウトの同定に有効であることが証明された。
現在利用可能なテーブル検出ベンチマークには、サンプルの多様性の欠如、単純なテーブル構造、トレーニングケースの欠如、サンプル品質など、多くの制限がある。
本稿では,多種多様な情報源から収集したテーブル構造を含む7万以上のサンプルを用いて,テーブル検出のための多種多様な大規模データセットを提案する。
それに加えて,畳み込みニューラルネットワークを用いた文書の表構造検出手法によるベースライン結果も提示する。
実験の結果,古典的コンピュータビジョンに基づく手法よりも畳み込み型深層学習手法が優れていることがわかった。
この多様なテーブル検出データセットの導入により、コミュニティは文書レイアウトと表データ処理を理解するための高いスループットのディープラーニング手法を開発できるようになる。
関連論文リスト
- Latent Diffusion for Guided Document Table Generation [4.891597567642704]
本研究は,テーブル構造のための注釈付き画像を生成するための新しいアプローチを提案する。
提案手法は,物体検出モデルの訓練に使用される合成データの質を高めることを目的としている。
実験により, 提案手法は, 学習用合成データの品質を著しく向上させることを示した。
論文 参考訳(メタデータ) (2024-08-19T08:46:16Z) - A Closer Look at Deep Learning on Tabular Data [52.50778536274327]
タブラルデータは、機械学習の様々な領域で広く使われている。
Deep Neural Network(DNN)ベースの手法は、ツリーベースに匹敵する有望なパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-07-01T04:24:07Z) - An Automatic Prompt Generation System for Tabular Data Tasks [3.117741687220381]
大規模言語モデル(LLM)は、慎重に構築されたプロンプトを通じて、いくつかのタスクでその能力を実証している。
本稿では,複数のLDMに適した革新的オートプロンプト生成システムを提案する。
論文 参考訳(メタデータ) (2024-05-09T08:32:55Z) - Towards End-to-End Semi-Supervised Table Detection with Deformable
Transformer [11.648151981111436]
テーブル検出は、ドキュメントイメージ内のテーブルオブジェクトを分類し、ローカライズするタスクである。
多くの半教師付きアプローチが、大量のラベルデータの必要性を軽減するために導入されている。
本稿では,テーブルオブジェクトの検出にデフォルマブルトランスを用いた,エンド・ツー・エンドの半教師付きテーブル検出手法を提案する。
論文 参考訳(メタデータ) (2023-05-04T12:15:15Z) - SEMv2: Table Separation Line Detection Based on Instance Segmentation [96.36188168694781]
SEMv2(SEM: Split, Embed, Merge)と呼ばれるテーブル構造認識器を提案する。
本稿では,テーブル分離ラインのインスタンスレベルの識別問題に対処し,条件付き畳み込みに基づくテーブル分離ライン検出戦略を提案する。
SEMv2を包括的に評価するために、iFLYTABと呼ばれるテーブル構造認識のためのより困難なデータセットも提示する。
論文 参考訳(メタデータ) (2023-03-08T05:15:01Z) - STUNT: Few-shot Tabular Learning with Self-generated Tasks from
Unlabeled Tables [64.0903766169603]
我々は,Unlabeled Tables (STUNT) からの自己生成タスクを作成した,数発のセミ教師付き学習のためのフレームワークを提案する。
私たちのキーとなるアイデアは、ランダムに選択された列をターゲットラベルとして扱うことで、多様なショットタスクを自己生成することです。
次に、メタラーニング手法を用いて、構築されたタスクで一般化可能な知識を学習する。
論文 参考訳(メタデータ) (2023-03-02T02:37:54Z) - Deep learning for table detection and structure recognition: A survey [49.09628624903334]
本調査の目的は,テーブル検出の分野での大きな進展を深く理解することである。
この分野における古典的アプリケーションと新しいアプリケーションの両方について分析する。
既存のモデルのデータセットとソースコードは、読者にこの膨大な文献のコンパスを提供するために組織されている。
論文 参考訳(メタデータ) (2022-11-15T19:42:27Z) - Graph Neural Networks and Representation Embedding for Table Extraction
in PDF Documents [1.1859913430860336]
この研究の主な貢献は、グラフニューラルネットワークを利用したテーブル抽出の問題に取り組むことである。
PubLayNetおよびPubTables-1Mデータセットに提供される情報をマージして得られた新しいデータセットに対する提案手法を実験的に評価した。
論文 参考訳(メタデータ) (2022-08-23T21:36:01Z) - Detection Hub: Unifying Object Detection Datasets via Query Adaptation
on Language Embedding [137.3719377780593]
新しいデザイン(De Detection Hubという名前)は、データセット認識とカテゴリ整列である。
データセットの不整合を緩和し、検出器が複数のデータセットをまたいで学習するための一貫性のあるガイダンスを提供する。
データセット間のカテゴリは、ワンホットなカテゴリ表現を単語埋め込みに置き換えることで、意味的に統一された空間に整列される。
論文 参考訳(メタデータ) (2022-06-07T17:59:44Z) - Multi-Type-TD-TSR -- Extracting Tables from Document Images using a
Multi-stage Pipeline for Table Detection and Table Structure Recognition:
from OCR to Structured Table Representations [63.98463053292982]
テーブルの認識は、テーブル検出とテーブル構造認識という2つの主要なタスクから構成される。
最近の研究は、テーブル構造認識のタスクにトランスファーラーニングを併用したディープラーニングアプローチへの明確な傾向を示している。
本稿では,テーブル認識問題に対するエンドツーエンドのソリューションを提供するMulti-Type-TD-TSRというマルチステージパイプラインを提案する。
論文 参考訳(メタデータ) (2021-05-23T21:17:18Z) - TableNet: Deep Learning model for end-to-end Table detection and Tabular
data extraction from Scanned Document Images [18.016832803961165]
本稿では,テーブル検出と構造認識のための新しいエンドツーエンドディープラーニングモデルを提案する。
TableNetは、テーブル検出のツインタスクとテーブル構造認識の相互依存性を利用する。
提案手法は, ICDAR 2013 と Marmot Table のデータセットを用いて評価した。
論文 参考訳(メタデータ) (2020-01-06T10:25:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。