論文の概要: Evaluating Table Structure Recognition: A New Perspective
- arxiv url: http://arxiv.org/abs/2208.00385v1
- Date: Sun, 31 Jul 2022 07:48:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-02 13:13:03.569886
- Title: Evaluating Table Structure Recognition: A New Perspective
- Title(参考訳): テーブル構造認識の評価:新しい視点
- Authors: Tarun Kumar and Himanshu Sharad Bhatt
- Abstract要約: テーブル構造認識アルゴリズムの評価に用いられる既存のメトリクスは、テキストと空のセルのアライメントのキャプチャに関して欠点がある。
本稿では,テキストの代わりにバウンディングボックスを用いたテーブル構造認識のための新しいメトリック-TEDSベースのIOU類似度(TEDS (IOU))を提案する。
- 参考スコア(独自算出の注目度): 2.1067139116005595
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing metrics used to evaluate table structure recognition algorithms have
shortcomings with regard to capturing text and empty cells alignment. In this
paper, we build on prior work and propose a new metric - TEDS based IOU
similarity (TEDS (IOU)) for table structure recognition which uses bounding
boxes instead of text while simultaneously being robust against the above
disadvantages. We demonstrate the effectiveness of our metric against previous
metrics through various examples.
- Abstract(参考訳): テーブル構造認識アルゴリズムの評価に用いられる既存のメトリクスには、テキストのキャプチャと空のセルアライメントに関する欠点がある。
本稿では,先行研究に基づき,上述の欠点に対して頑健であると同時に,テキストの代わりにバウンディングボックスを使用するテーブル構造認識のための,tedsベースのiou類似度(teds(iou))を提案する。
様々な例を通して,過去の測定値に対する測定値の有効性を示す。
関連論文リスト
- ClusterTabNet: Supervised clustering method for table detection and
table structure recognition [0.0]
文書中の単語をクラスタリングする深層学習に基づく新しい手法を提案する。
表構造ボトムアップを一対の単語間の関係グラフとして解釈し、変圧器エンコーダモデルを用いてその隣接行列を予測する。
DETRやFaster R-CNNのような現在の最先端検出手法と比較して,本手法は比較的小さなモデルを必要とするが,類似性や精度が向上する。
論文 参考訳(メタデータ) (2024-02-12T09:10:24Z) - A Unified View of Evaluation Metrics for Structured Prediction [41.29492827464339]
本稿では,異なる予測タスクに対する評価指標を統一する概念的枠組みを提案する。
我々のフレームワークは、これらのタスクの出力を特定のデータ型のオブジェクトとして表現する必要があります。
出力構造に基づいたボトムアップ方式で,新しい指標を自然に導出できることが示される。
論文 参考訳(メタデータ) (2023-10-20T20:02:02Z) - SEMv2: Table Separation Line Detection Based on Instance Segmentation [96.36188168694781]
SEMv2(SEM: Split, Embed, Merge)と呼ばれるテーブル構造認識器を提案する。
本稿では,テーブル分離ラインのインスタンスレベルの識別問題に対処し,条件付き畳み込みに基づくテーブル分離ライン検出戦略を提案する。
SEMv2を包括的に評価するために、iFLYTABと呼ばれるテーブル構造認識のためのより困難なデータセットも提示する。
論文 参考訳(メタデータ) (2023-03-08T05:15:01Z) - SUN: Exploring Intrinsic Uncertainties in Text-to-SQL Parsers [61.48159785138462]
本稿では,ニューラルネットワークに基づくアプローチ(SUN)における本質的な不確かさを探索することにより,テキストから依存への変換性能を向上させることを目的とする。
5つのベンチマークデータセットの大規模な実験により、我々の手法は競合より大幅に優れ、新しい最先端の結果が得られた。
論文 参考訳(メタデータ) (2022-09-14T06:27:51Z) - TGRNet: A Table Graph Reconstruction Network for Table Structure
Recognition [76.06530816349763]
本稿では,表構造認識のためのエンドツーエンドのトレーニング可能な表グラフ再構成ネットワーク(TGRNet)を提案する。
具体的には,異なる細胞の空間的位置と論理的位置を共同で予測するために,細胞検出枝と細胞論理的位置分岐の2つの主枝を有する。
論文 参考訳(メタデータ) (2021-06-20T01:57:05Z) - Improving Text Generation Evaluation with Batch Centering and Tempered
Word Mover Distance [24.49032191669509]
類似度指標の符号化表現を改善するための2つの手法を提案する。
さまざまなBERTバックボーンの学習指標について結果を示し、複数のベンチマークでヒトのレーティングとアート相関の状態を達成した。
論文 参考訳(メタデータ) (2020-10-13T03:46:25Z) - Table Structure Recognition using Top-Down and Bottom-Up Cues [28.65687982486627]
本稿では,細胞検出と相互作用モジュールを組み合わせたテーブル構造認識手法を提案する。
実際に利用可能な実世界のデータセット上で,我々の手法を実証的に検証する。
論文 参考訳(メタデータ) (2020-10-09T13:32:53Z) - A Comparative Study on Structural and Semantic Properties of Sentence
Embeddings [77.34726150561087]
本稿では,関係抽出に広く利用されている大規模データセットを用いた実験セットを提案する。
異なる埋め込み空間は、構造的および意味的特性に対して異なる強度を持つことを示す。
これらの結果は,埋め込み型関係抽出法の開発に有用な情報を提供する。
論文 参考訳(メタデータ) (2020-09-23T15:45:32Z) - Tabular Structure Detection from Document Images for Resource
Constrained Devices Using A Row Based Similarity Measure [0.9814898713780167]
タブラル構造は、構造的で明快な方法で重要な情報を示すために使用される。
既存の手法のほとんどは、テーブルの構造に関する事前の知識を用いて、文書画像からテーブルを検出する。
論文 参考訳(メタデータ) (2020-08-26T21:59:27Z) - Towards Faithful Neural Table-to-Text Generation with Content-Matching
Constraints [63.84063384518667]
そこで本研究では,トランスフォーマーをベースとした新たな生成フレームワークを提案する。
忠実度を強制する手法の中核となる技術は、テーブル-テキストの最適トランスポート・マッチング・ロスである。
忠実度を評価するため,テーブル・ツー・テキスト生成問題に特化した新しい自動尺度を提案する。
論文 参考訳(メタデータ) (2020-05-03T02:54:26Z) - ToTTo: A Controlled Table-To-Text Generation Dataset [61.83159452483026]
ToTToはオープンドメインの英語のテーブル・トゥ・テキストのデータセットで、12万以上のトレーニングサンプルがある。
本稿では、ウィキペディアから既存の候補文を直接修正するデータセット構築プロセスを紹介する。
通常流動的であるが、既存の方法は多くの場合、表がサポートしていないフレーズを幻覚させる。
論文 参考訳(メタデータ) (2020-04-29T17:53:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。