論文の概要: Tables to LaTeX: structure and content extraction from scientific tables
- arxiv url: http://arxiv.org/abs/2210.17246v1
- Date: Mon, 31 Oct 2022 12:08:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-01 16:16:51.054971
- Title: Tables to LaTeX: structure and content extraction from scientific tables
- Title(参考訳): LaTeXへのテーブル:科学表からの構造と内容抽出
- Authors: Pratik Kayal, Mrinal Anand, Harsh Desai and Mayank Singh
- Abstract要約: 我々は,トランスフォーマーに基づく言語モデリングパラダイムを,科学テーブル構造とコンテンツ抽出に適用する。
我々は, 表構造と内容抽出において, 70.35 と 49.69% の正確な一致精度を達成した。
- 参考スコア(独自算出の注目度): 0.848135258677752
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scientific documents contain tables that list important information in a
concise fashion. Structure and content extraction from tables embedded within
PDF research documents is a very challenging task due to the existence of
visual features like spanning cells and content features like mathematical
symbols and equations. Most existing table structure identification methods
tend to ignore these academic writing features. In this paper, we adapt the
transformer-based language modeling paradigm for scientific table structure and
content extraction. Specifically, the proposed model converts a tabular image
to its corresponding LaTeX source code. Overall, we outperform the current
state-of-the-art baselines and achieve an exact match accuracy of 70.35 and
49.69% on table structure and content extraction, respectively. Further
analysis demonstrates that the proposed models efficiently identify the number
of rows and columns, the alphanumeric characters, the LaTeX tokens, and
symbols.
- Abstract(参考訳): 科学文書には、簡潔な方法で重要な情報を一覧する表が含まれている。
pdf研究文書に埋め込まれたテーブルの構造とコンテンツ抽出は、スパンリングセルのような視覚的特徴や数学的記号や方程式のようなコンテンツ機能が存在するため、非常に難しい作業である。
既存の表構造同定手法のほとんどは、これらの学術的特徴を無視する傾向がある。
本稿では,科学テーブル構造とコンテンツ抽出のためのトランスフォーマーに基づく言語モデリングパラダイムを適用する。
特に,提案モデルでは,表形式の画像を対応するLaTeXソースコードに変換する。
全体として、現在最先端のベースラインより優れており、テーブル構造とコンテンツ抽出の精度は70.35と49.69%である。
さらに分析した結果,提案モデルでは行数,列数,アルファ数値文字数,LaTeXトークン数,シンボル数を効率的に識別できることがわかった。
関連論文リスト
- UniTabNet: Bridging Vision and Language Models for Enhanced Table Structure Recognition [55.153629718464565]
我々は、画像からテキストへのモデルに基づくテーブル構造解析のための新しいフレームワークUniTabNetを紹介する。
UniTabNetは、画像とテキストのモデルを使ってテーブルセルを分離し、物理デコーダと論理デコーダを統合して完全なテーブル構造を再構築する。
論文 参考訳(メタデータ) (2024-09-20T01:26:32Z) - Doc2SoarGraph: Discrete Reasoning over Visually-Rich Table-Text
Documents via Semantic-Oriented Hierarchical Graphs [79.0426838808629]
視覚的にリッチなテーブルテキスト文書に答えるTAT-DQAを提案する。
具体的には、離散推論機能を強化した新しいDoc2SoarGraphフレームワークを提案する。
我々は,TAT-DQAデータセットに関する広範な実験を行い,提案したフレームワークは,テストセット上でのエクサクティマッチ(EM)とF1スコアでそれぞれ17.73%,F1スコアで16.91%の最高のベースラインモデルを上回る結果を得た。
論文 参考訳(メタデータ) (2023-05-03T07:30:32Z) - Data augmentation on graphs for table type classification [1.1859913430860336]
グラフニューラルネットワークを用いてテーブルの分類を行い、使用中のメッセージパッシングアルゴリズムのテーブル構造を利用する。
我々は,グラフベースの表表現に適したデータ拡張手法を提案することで,有望な予備結果を実現する。
論文 参考訳(メタデータ) (2022-08-23T21:54:46Z) - DiSCoMaT: Distantly Supervised Composition Extraction from Tables in
Materials Science Articles [25.907266860321727]
材料科学論文の表から素材の組成を抽出する新しいNLPタスクを定義する。
遠隔操作型テーブル4,408、手動で注釈付けされた開発およびテストテーブル1,475からなるトレーニングデータセットをリリースする。
DisCOMATは最近のテーブル処理アーキテクチャよりも大幅に優れていることを示す。
論文 参考訳(メタデータ) (2022-07-03T17:11:17Z) - Table Retrieval May Not Necessitate Table-specific Model Design [83.27735758203089]
テーブル検索のタスクに焦点をあてて、"テーブル固有のモデル設計はテーブル検索に必要か?
自然質問データセット (NQ-table) の表に基づく分析の結果, 70%以上の症例では構造が無視できる役割を担っていることがわかった。
次に、テーブル構造、すなわち補助列/カラム埋め込み、ハードアテンションマスク、ソフトリレーションに基づくアテンションバイアスを明示的にエンコードする3つのモジュールを実験する。
いずれも大きな改善は得られず、テーブル固有のモデル設計がテーブル検索に不要である可能性が示唆された。
論文 参考訳(メタデータ) (2022-05-19T20:35:23Z) - TabLeX: A Benchmark Dataset for Structure and Content Information
Extraction from Scientific Tables [1.4115224153549193]
本稿では,学術論文から生成された表画像からなる大規模ベンチマークデータセットTabLeXを提案する。
堅牢なテーブルIEツールの開発を容易にするため、TabLeXにはさまざまなアスペクト比とさまざまなフォントのイメージが含まれている。
分析の結果,現状のテーブル抽出モデルの欠点が明らかとなり,単純なテーブル画像でも失敗することが判明した。
論文 参考訳(メタデータ) (2021-05-12T05:13:38Z) - A Graph Representation of Semi-structured Data for Web Question
Answering [96.46484690047491]
本稿では、半構造化データとそれらの関係の構成要素の体系的分類に基づいて、Webテーブルとリストのグラフ表現を提案する。
本手法は,最先端のベースラインに対してF1スコアを3.90ポイント向上させる。
論文 参考訳(メタデータ) (2020-10-14T04:01:54Z) - ToTTo: A Controlled Table-To-Text Generation Dataset [61.83159452483026]
ToTToはオープンドメインの英語のテーブル・トゥ・テキストのデータセットで、12万以上のトレーニングサンプルがある。
本稿では、ウィキペディアから既存の候補文を直接修正するデータセット構築プロセスを紹介する。
通常流動的であるが、既存の方法は多くの場合、表がサポートしていないフレーズを幻覚させる。
論文 参考訳(メタデータ) (2020-04-29T17:53:45Z) - GFTE: Graph-based Financial Table Extraction [66.26206038522339]
金融業界や他の多くの分野において、表は構造化されていないデジタルファイル、例えばポータブル文書フォーマット(PDF)や画像でしばしば開示される。
我々はFinTabという中国の標準データセットを公開しています。
今後の比較のためのベースラインとしてGFTEという新しいグラフベースの畳み込みネットワークモデルを提案する。
論文 参考訳(メタデータ) (2020-03-17T07:10:05Z) - Identifying Table Structure in Documents using Conditional Generative
Adversarial Networks [0.0]
多くの産業や学術研究において、情報は主に構造化されていない文書の形で伝達される。
本稿では,まず,テーブルイメージを標準化されたスケルトンテーブル形式にマッピングするために,条件付き生成逆数ネットワークを用いたトップダウンアプローチを提案する。
次に、xy-cutプロジェクションと遺伝的アルゴリズムを用いた潜在テーブル構造を導出する。
論文 参考訳(メタデータ) (2020-01-13T20:42:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。