論文の概要: Evaluating Table Structure Recognition: A New Perspective
- arxiv url: http://arxiv.org/abs/2208.00385v1
- Date: Sun, 31 Jul 2022 07:48:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-02 13:13:03.569886
- Title: Evaluating Table Structure Recognition: A New Perspective
- Title(参考訳): テーブル構造認識の評価:新しい視点
- Authors: Tarun Kumar and Himanshu Sharad Bhatt
- Abstract要約: テーブル構造認識アルゴリズムの評価に用いられる既存のメトリクスは、テキストと空のセルのアライメントのキャプチャに関して欠点がある。
本稿では,テキストの代わりにバウンディングボックスを用いたテーブル構造認識のための新しいメトリック-TEDSベースのIOU類似度(TEDS (IOU))を提案する。
- 参考スコア(独自算出の注目度): 2.1067139116005595
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing metrics used to evaluate table structure recognition algorithms have
shortcomings with regard to capturing text and empty cells alignment. In this
paper, we build on prior work and propose a new metric - TEDS based IOU
similarity (TEDS (IOU)) for table structure recognition which uses bounding
boxes instead of text while simultaneously being robust against the above
disadvantages. We demonstrate the effectiveness of our metric against previous
metrics through various examples.
- Abstract(参考訳): テーブル構造認識アルゴリズムの評価に用いられる既存のメトリクスには、テキストのキャプチャと空のセルアライメントに関する欠点がある。
本稿では,先行研究に基づき,上述の欠点に対して頑健であると同時に,テキストの代わりにバウンディングボックスを使用するテーブル構造認識のための,tedsベースのiou類似度(teds(iou))を提案する。
様々な例を通して,過去の測定値に対する測定値の有効性を示す。
関連論文リスト
- Using Similarity to Evaluate Factual Consistency in Summaries [2.7595794227140056]
抽象要約器は流動的な要約を生成するが、生成したテキストの事実性は保証されない。
本稿では,ゼロショット事実性評価尺度であるSBERTScoreを提案する。
実験の結果,SBERTScoreでは,各手法の強度が異なることが示唆された。
論文 参考訳(メタデータ) (2024-09-23T15:02:38Z) - UniTabNet: Bridging Vision and Language Models for Enhanced Table Structure Recognition [55.153629718464565]
我々は、画像からテキストへのモデルに基づくテーブル構造解析のための新しいフレームワークUniTabNetを紹介する。
UniTabNetは、画像とテキストのモデルを使ってテーブルセルを分離し、物理デコーダと論理デコーダを統合して完全なテーブル構造を再構築する。
論文 参考訳(メタデータ) (2024-09-20T01:26:32Z) - Revisiting Code Similarity Evaluation with Abstract Syntax Tree Edit Distance [6.164970071786899]
我々は、最近のコード類似度評価指標を再考し、特に抽象構文木(AST)編集距離の適用に焦点を当てた。
実験では、複雑なコード構造をキャプチャする際のAST編集距離の有効性を示し、既存のメトリクスと高い相関関係を示した。
すべてのテスト言語で有効性を示すメトリクスを提案し,最適化し,公開する。
論文 参考訳(メタデータ) (2024-04-12T21:28:18Z) - ClusterTabNet: Supervised clustering method for table detection and table structure recognition [0.0]
文書中の単語をクラスタリングする深層学習に基づく新しい手法を提案する。
表構造ボトムアップを一対の単語間の関係グラフとして解釈し、変圧器エンコーダモデルを用いてその隣接行列を予測する。
DETRやFaster R-CNNのような現在の最先端検出手法と比較して,本手法は比較的小さなモデルを必要とするが,類似性や精度が向上する。
論文 参考訳(メタデータ) (2024-02-12T09:10:24Z) - SEMv2: Table Separation Line Detection Based on Instance Segmentation [96.36188168694781]
SEMv2(SEM: Split, Embed, Merge)と呼ばれるテーブル構造認識器を提案する。
本稿では,テーブル分離ラインのインスタンスレベルの識別問題に対処し,条件付き畳み込みに基づくテーブル分離ライン検出戦略を提案する。
SEMv2を包括的に評価するために、iFLYTABと呼ばれるテーブル構造認識のためのより困難なデータセットも提示する。
論文 参考訳(メタデータ) (2023-03-08T05:15:01Z) - TGRNet: A Table Graph Reconstruction Network for Table Structure
Recognition [76.06530816349763]
本稿では,表構造認識のためのエンドツーエンドのトレーニング可能な表グラフ再構成ネットワーク(TGRNet)を提案する。
具体的には,異なる細胞の空間的位置と論理的位置を共同で予測するために,細胞検出枝と細胞論理的位置分岐の2つの主枝を有する。
論文 参考訳(メタデータ) (2021-06-20T01:57:05Z) - Table Structure Recognition using Top-Down and Bottom-Up Cues [28.65687982486627]
本稿では,細胞検出と相互作用モジュールを組み合わせたテーブル構造認識手法を提案する。
実際に利用可能な実世界のデータセット上で,我々の手法を実証的に検証する。
論文 参考訳(メタデータ) (2020-10-09T13:32:53Z) - A Comparative Study on Structural and Semantic Properties of Sentence
Embeddings [77.34726150561087]
本稿では,関係抽出に広く利用されている大規模データセットを用いた実験セットを提案する。
異なる埋め込み空間は、構造的および意味的特性に対して異なる強度を持つことを示す。
これらの結果は,埋め込み型関係抽出法の開発に有用な情報を提供する。
論文 参考訳(メタデータ) (2020-09-23T15:45:32Z) - Tabular Structure Detection from Document Images for Resource
Constrained Devices Using A Row Based Similarity Measure [0.9814898713780167]
タブラル構造は、構造的で明快な方法で重要な情報を示すために使用される。
既存の手法のほとんどは、テーブルの構造に関する事前の知識を用いて、文書画像からテーブルを検出する。
論文 参考訳(メタデータ) (2020-08-26T21:59:27Z) - Towards Faithful Neural Table-to-Text Generation with Content-Matching
Constraints [63.84063384518667]
そこで本研究では,トランスフォーマーをベースとした新たな生成フレームワークを提案する。
忠実度を強制する手法の中核となる技術は、テーブル-テキストの最適トランスポート・マッチング・ロスである。
忠実度を評価するため,テーブル・ツー・テキスト生成問題に特化した新しい自動尺度を提案する。
論文 参考訳(メタデータ) (2020-05-03T02:54:26Z) - ToTTo: A Controlled Table-To-Text Generation Dataset [61.83159452483026]
ToTToはオープンドメインの英語のテーブル・トゥ・テキストのデータセットで、12万以上のトレーニングサンプルがある。
本稿では、ウィキペディアから既存の候補文を直接修正するデータセット構築プロセスを紹介する。
通常流動的であるが、既存の方法は多くの場合、表がサポートしていないフレーズを幻覚させる。
論文 参考訳(メタデータ) (2020-04-29T17:53:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。