論文の概要: LORE: Logical Location Regression Network for Table Structure
Recognition
- arxiv url: http://arxiv.org/abs/2303.03730v1
- Date: Tue, 7 Mar 2023 08:42:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-08 15:57:43.258375
- Title: LORE: Logical Location Regression Network for Table Structure
Recognition
- Title(参考訳): LORE:テーブル構造認識のための論理的位置回帰ネットワーク
- Authors: Hangdi Xing, Feiyu Gao, Rujiao Long, Jiajun Bu, Qi Zheng, Liangcheng
Li, Cong Yao, Zhi Yu
- Abstract要約: テーブル構造認識は、画像中のテーブルを機械的に理解可能なフォーマットに抽出することを目的としている。
近年の方法では,検出されたセルボックスの隣接関係を予測してこの問題を解決している。
LOREと呼ばれる新しいTSRフレームワークを提案する。
- 参考スコア(独自算出の注目度): 24.45544796305824
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Table structure recognition (TSR) aims at extracting tables in images into
machine-understandable formats. Recent methods solve this problem by predicting
the adjacency relations of detected cell boxes, or learning to generate the
corresponding markup sequences from the table images. However, they either
count on additional heuristic rules to recover the table structures, or require
a huge amount of training data and time-consuming sequential decoders. In this
paper, we propose an alternative paradigm. We model TSR as a logical location
regression problem and propose a new TSR framework called LORE, standing for
LOgical location REgression network, which for the first time combines logical
location regression together with spatial location regression of table cells.
Our proposed LORE is conceptually simpler, easier to train and more accurate
than previous TSR models of other paradigms. Experiments on standard benchmarks
demonstrate that LORE consistently outperforms prior arts. Code is available at
https://
github.com/AlibabaResearch/AdvancedLiterateMachinery/tree/main/DocumentUnderstanding/LORE-TSR.
- Abstract(参考訳): テーブル構造認識(tsr)は、画像中のテーブルを機械理解可能なフォーマットに抽出することを目的としている。
近年の手法では,検出されたセルボックスの隣接関係を予測したり,テーブル画像から対応するマークアップシーケンスを生成することを学習することでこの問題を解決している。
しかし、テーブル構造を復元するために追加のヒューリスティックなルールをカウントするか、膨大なトレーニングデータと時間を要するシーケンシャルデコーダを必要とする。
本稿では,代替パラダイムを提案する。
我々は、論理的位置回帰問題としてTSRをモデル化し、論理的位置回帰とテーブルセルの空間的位置回帰を組み合わせた論理的位置回帰ネットワークであるLOREという新しいTSRフレームワークを提案する。
提案するloreは概念的にシンプルで、トレーニングが簡単で、他のパラダイムのtsrモデルよりも正確です。
標準ベンチマークによる実験は、loreが常に先行技術を上回ることを示している。
コードはhttps:// github.com/AlibabaResearch/AdvancedLiterateMachinery/tree/main/DocumentUnderstanding/LORE-TSRで公開されている。
関連論文リスト
- LORE++: Logical Location Regression Network for Table Structure
Recognition with Pre-training [45.80561537971478]
表構造認識(TSR)は、画像中のテーブルを機械で理解可能な形式に抽出することを目的としている。
我々は、論理的位置回帰問題としてTSRをモデル化し、LOREと呼ばれる新しいTSRフレームワークを提案する。
提案するLOREは概念的にシンプルで、訓練が容易で、TSRの他のパラダイムよりも正確です。
論文 参考訳(メタデータ) (2024-01-03T03:14:55Z) - Retrieval-Based Transformer for Table Augmentation [14.460363647772745]
我々は、自動データラングリングに対する新しいアプローチを導入する。
本研究の目的は,行数や列数,データ計算などのテーブル拡張タスクに対処することである。
我々のモデルは、教師付き統計手法と最先端のトランスフォーマーベースモデルの両方より一貫して、実質的に優れています。
論文 参考訳(メタデータ) (2023-06-20T18:51:21Z) - Robust Table Structure Recognition with Dynamic Queries Enhanced
Detection Transformer [15.708108572696062]
本稿では,TSRFormerと呼ばれる新しいテーブル構造認識手法を提案する。
これらの新しい手法により、我々のTSRFormerは、SciTSR、PubTabNet、WTW、FinTabNetなど、いくつかのベンチマークデータセットで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-03-21T06:20:49Z) - A Local-Pattern Related Look-Up Table [9.260657061050887]
Relevance-Zoneパターンテーブル(RZT)は、従来の転置テーブルを置き換えるために使用することができる。
RZSは、GoにおけるL&D問題の解決における現在の最先端技術である。
実際にルックアップ中にラディックスツリーをトラバースするオーバーヘッドは、テーブルに格納されているエントリの数に関して、対数的に平坦なままである。
論文 参考訳(メタデータ) (2022-12-22T06:02:13Z) - Learning Cross-view Geo-localization Embeddings via Dynamic Weighted
Decorrelation Regularization [52.493240055559916]
クロスビュージオローカライゼーションは、ドローンプラットフォームと衛星プラットフォームという2つのプラットフォームから撮影された同じ位置の画像を見つけることを目的としている。
既存の手法は、通常、特徴空間内の他のものとの埋め込み距離を最適化することに焦点を当てる。
本稿では、低冗長性も重要であり、モデルがより多様なパターンをマイニングする動機となっていると論じる。
論文 参考訳(メタデータ) (2022-11-10T02:13:10Z) - TSRFormer: Table Structure Recognition with Transformers [15.708108572696064]
本稿では,TSRFormerと呼ばれる新しいテーブル構造認識手法を提案する。
新たな2段階DETRに基づくセパレータ予測手法である textbfSeparator textbfREgression textbfTRansformer (SepRETR) を提案する。
我々は、SciTSR、PubTabNet、WTWなど、いくつかのベンチマークデータセットで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-08-09T17:36:13Z) - VQ-T: RNN Transducers using Vector-Quantized Prediction Network States [52.48566999668521]
本稿では,RNNトランスデューサの予測ネットワークにおけるベクトル量子化長短期記憶単位を提案する。
ASRネットワークと協調して離散表現を訓練することにより、格子生成のために仮説を積極的にマージすることができる。
提案するVQ RNNトランスデューサは,通常の予測ネットワークを持つトランスデューサよりもASR性能が向上することを示す。
論文 参考訳(メタデータ) (2022-08-03T02:45:52Z) - Autoregressive Search Engines: Generating Substrings as Document
Identifiers [53.0729058170278]
自動回帰言語モデルは、回答を生成するデファクト標準として現れています。
これまでの研究は、探索空間を階層構造に分割する方法を探究してきた。
本研究では,検索空間の任意の構造を強制しない代替として,経路内のすべてのngramを識別子として使用することを提案する。
論文 参考訳(メタデータ) (2022-04-22T10:45:01Z) - TGRNet: A Table Graph Reconstruction Network for Table Structure
Recognition [76.06530816349763]
本稿では,表構造認識のためのエンドツーエンドのトレーニング可能な表グラフ再構成ネットワーク(TGRNet)を提案する。
具体的には,異なる細胞の空間的位置と論理的位置を共同で予測するために,細胞検出枝と細胞論理的位置分岐の2つの主枝を有する。
論文 参考訳(メタデータ) (2021-06-20T01:57:05Z) - PredRNN: A Recurrent Neural Network for Spatiotemporal Predictive
Learning [109.84770951839289]
歴史的文脈からビジュアルダイナミクスを学習するための新しいリカレントネットワークであるPredRNNを紹介する。
本手法は,3つの標準データセット上で高い競争結果が得られることを示す。
論文 参考訳(メタデータ) (2021-03-17T08:28:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。