論文の概要: GriTS: Grid table similarity metric for table structure recognition
- arxiv url: http://arxiv.org/abs/2203.12555v3
- Date: Tue, 23 May 2023 18:47:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-26 03:29:50.961662
- Title: GriTS: Grid table similarity metric for table structure recognition
- Title(参考訳): GriTS:テーブル構造認識のためのグリッドテーブル類似度メトリック
- Authors: Brandon Smock and Rohith Pesala and Robin Abraham
- Abstract要約: 我々はグリッドテーブル類似度(GriTS)と呼ばれるテーブル構造認識(TSR)評価のための新しい尺度を提案する。
従来の測度とは異なり、GriTSは予測テーブルの正しさを、その自然な形で行列として直接評価する。
- 参考スコア(独自算出の注目度): 10.323063834827416
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we propose a new class of metric for table structure
recognition (TSR) evaluation, called grid table similarity (GriTS). Unlike
prior metrics, GriTS evaluates the correctness of a predicted table directly in
its natural form as a matrix. To create a similarity measure between matrices,
we generalize the two-dimensional largest common substructure (2D-LCS) problem,
which is NP-hard, to the 2D most similar substructures (2D-MSS) problem and
propose a polynomial-time heuristic for solving it. This algorithm produces
both an upper and a lower bound on the true similarity between matrices. We
show using evaluation on a large real-world dataset that in practice there is
almost no difference between these bounds. We compare GriTS to other metrics
and empirically validate that matrix similarity exhibits more desirable
behavior than alternatives for TSR performance evaluation. Finally, GriTS
unifies all three subtasks of cell topology recognition, cell location
recognition, and cell content recognition within the same framework, which
simplifies the evaluation and enables more meaningful comparisons across
different types of TSR approaches. Code will be released at
https://github.com/microsoft/table-transformer.
- Abstract(参考訳): 本稿では、グリッドテーブル類似性(grits)と呼ばれる、テーブル構造認識(tsr)評価のための新しいメトリクスのクラスを提案する。
従来の測度とは異なり、GriTSは予測表の正しさを、その自然な形で行列として直接評価する。
行列間の類似度尺度を作成するために、NPハードな2次元最大の共通部分構造(2D-LCS)問題を2次元最も類似した部分構造(2D-MSS)問題に一般化し、それを解く多項式時間ヒューリスティックを提案する。
このアルゴリズムは行列間の真の類似性に基づいて上界と下界の両方を生成する。
本研究では,実世界の大規模データセットの評価を用いて,その境界にほとんど差がないことを示す。
gritsを他の指標と比較し,マトリックス類似性がtsr性能評価の代替品よりも望ましい行動を示すことを実証的に検証した。
最後に、GriTSは、同じフレームワーク内で細胞トポロジ認識、細胞位置認識、細胞コンテンツ認識の3つのサブタスクをすべて統一し、評価を単純化し、異なるタイプのTSRアプローチ間でより有意義な比較を可能にする。
コードはhttps://github.com/microsoft/table-transformerでリリースされる。
関連論文リスト
- Doubly Stochastic Adaptive Neighbors Clustering via the Marcus Mapping [56.57574396804837]
クラスタリングは機械学習とデータサイエンスにおける基本的なタスクであり、類似性グラフベースのクラスタリングはこの領域において重要なアプローチである。
マーカスマッピングと最適輸送の関係について検討する。
マーカス写像が特定の種類の最適輸送問題を解くことを証明し、マーカス写像によるこの問題の解法が最適輸送法を直接適用するよりも効率的であることを証明した。
論文 参考訳(メタデータ) (2024-08-06T03:34:43Z) - DNNLasso: Scalable Graph Learning for Matrix-Variate Data [2.7195102129095003]
我々は,Kronecker-sum構造精度行列を推定するための,対角非負のグラフィカルラッソモデルを提案する。
DNNLassoは、最先端の手法を精度と計算時間の両方で大きなマージンで上回る。
論文 参考訳(メタデータ) (2024-03-05T02:49:00Z) - ClusterTabNet: Supervised clustering method for table detection and table structure recognition [0.0]
文書中の単語をクラスタリングする深層学習に基づく新しい手法を提案する。
表構造ボトムアップを一対の単語間の関係グラフとして解釈し、変圧器エンコーダモデルを用いてその隣接行列を予測する。
DETRやFaster R-CNNのような現在の最先端検出手法と比較して,本手法は比較的小さなモデルを必要とするが,類似性や精度が向上する。
論文 参考訳(メタデータ) (2024-02-12T09:10:24Z) - Classification of BCI-EEG based on augmented covariance matrix [0.0]
本稿では,運動画像分類の改善を目的とした自己回帰モデルから抽出した拡張共分散に基づく新しいフレームワークを提案する。
私たちはMOABBフレームワークを使って、いくつかのデータセットといくつかの主題でアプローチを検証します。
論文 参考訳(メタデータ) (2023-02-09T09:04:25Z) - TRUST: An Accurate and End-to-End Table structure Recognizer Using
Splitting-based Transformers [56.56591337457137]
本稿では,TRUSTと呼ばれるテーブル構造認識手法を提案する。
変換器は、大域的な計算、完全メモリ、並列計算のためにテーブル構造認識に適している。
我々はPubTabNetやSynthTableなど,いくつかの人気のあるベンチマークで実験を行い,新しい最先端の結果を得た。
論文 参考訳(メタデータ) (2022-08-31T08:33:36Z) - Instance-Dependent Label-Noise Learning with Manifold-Regularized
Transition Matrix Estimation [172.81824511381984]
遷移行列 T(x) は、インスタンス依存ノイズ(IDN)の下では特定できない
我々は、T(x) の幾何学について、「より近い2つのインスタンスは、それに対応する遷移行列がより類似している」という仮定を提案する。
本手法は,難解なIDNの下でのラベルノイズ学習において,最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2022-06-06T04:12:01Z) - Fast Differentiable Matrix Square Root and Inverse Square Root [65.67315418971688]
微分可能な行列平方根と逆平方根を計算するためのより効率的な2つの変種を提案する。
前方伝搬には, Matrix Taylor Polynomial (MTP) を用いる方法と, Matrix Pad'e Approximants (MPA) を使用する方法がある。
一連の数値実験により、両方の手法がSVDやNSの繰り返しと比較してかなりスピードアップすることが示された。
論文 参考訳(メタデータ) (2022-01-29T10:00:35Z) - Sublinear Time Approximation of Text Similarity Matrices [50.73398637380375]
一般的なNystr"om法を不確定な設定に一般化する。
我々のアルゴリズムは任意の類似性行列に適用でき、行列のサイズでサブ線形時間で実行される。
本手法は,CUR分解の単純な変種とともに,様々な類似性行列の近似において非常によく機能することを示す。
論文 参考訳(メタデータ) (2021-12-17T17:04:34Z) - On Path Integration of Grid Cells: Group Representation and Isotropic
Scaling [135.0473739504851]
格子セルによる経路積分の一般的な表現モデルの理論的解析を行う。
我々は、歯列脳の格子細胞の同様の性質を共有する六角形格子パターンを学習する。
学習したモデルは、正確な長距離経路積分を行うことができる。
論文 参考訳(メタデータ) (2020-06-18T03:44:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。