論文の概要: From Surface to Semantics: Semantic Structure Parsing for Table-Centric Document Analysis
- arxiv url: http://arxiv.org/abs/2508.10311v1
- Date: Thu, 14 Aug 2025 03:29:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-15 22:24:48.171624
- Title: From Surface to Semantics: Semantic Structure Parsing for Table-Centric Document Analysis
- Title(参考訳): 表・表・表・表・表・表・表・表・表・表・表・表・表・表・表・表・表・表・表・表・表・表・表・表・表・表・表・表・表・表・表・表・表・表・
- Authors: Xuan Li, Jialiang Dong, Raymond Wong,
- Abstract要約: DOTABLERはテーブル中心のセマンティックドキュメント解析フレームワークである。
包括的テーブルアンカレッド意味解析と意味論的関連テーブルの正確な抽出を提供する。
実世界のPDFから1000以上のテーブルを持つ4000ページ近くで評価された。
- 参考スコア(独自算出の注目度): 9.526986293067576
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Documents are core carriers of information and knowl-edge, with broad applications in finance, healthcare, and scientific research. Tables, as the main medium for structured data, encapsulate key information and are among the most critical document components. Existing studies largely focus on surface-level tasks such as layout analysis, table detection, and data extraction, lacking deep semantic parsing of tables and their contextual associations. This limits advanced tasks like cross-paragraph data interpretation and context-consistent analysis. To address this, we propose DOTABLER, a table-centric semantic document parsing framework designed to uncover deep semantic links between tables and their context. DOTABLER leverages a custom dataset and domain-specific fine-tuning of pre-trained models, integrating a complete parsing pipeline to identify context segments semantically tied to tables. Built on this semantic understanding, DOTABLER implements two core functionalities: table-centric document structure parsing and domain-specific table retrieval, delivering comprehensive table-anchored semantic analysis and precise extraction of semantically relevant tables. Evaluated on nearly 4,000 pages with over 1,000 tables from real-world PDFs, DOTABLER achieves over 90% Precision and F1 scores, demonstrating superior performance in table-context semantic analysis and deep document parsing compared to advanced models such as GPT-4o.
- Abstract(参考訳): ドキュメントは情報とノウハウの核となるキャリアであり、金融、医療、科学研究に広く応用されている。
テーブルは構造化データの主要な媒体であり、キー情報をカプセル化し、最も重要なドキュメントコンポーネントの1つである。
既存の研究は、レイアウト分析、テーブル検出、データ抽出といった表面レベルのタスクに重点を置いており、テーブルの深いセマンティック解析とそれらのコンテキスト関連性を欠いている。
これにより、クロスパラグラフデータ解釈やコンテキスト一貫性分析といった高度なタスクが制限される。
そこで本研究では,テーブルとコンテキスト間の深いセマンティックリンクを明らかにするために,テーブル中心のセマンティックドキュメント解析フレームワークであるDOTABLERを提案する。
DOTABLERは、トレーニング済みモデルのカスタムデータセットとドメイン固有の微調整を活用し、完全な解析パイプラインを統合して、テーブルにセマンティックに結びついたコンテキストセグメントを識別する。
このセマンティック理解に基づいて、DOTABLERはテーブル中心の文書構造解析とドメイン固有のテーブル検索という2つのコア機能を実装している。
DOTABLERは、実世界のPDFから1000以上のテーブルを持つ4000ページ近くで評価され、90%以上の精度とF1スコアを達成し、GPT-4oのような先進的なモデルと比較して、テーブルコンテキストのセマンティック分析や深層文書解析において優れたパフォーマンスを示す。
関連論文リスト
- Bridging Queries and Tables through Entities in Table Retrieval [70.13748256886288]
エンティティは、テキスト検索の文脈でよく研究されているが、テーブル検索におけるその応用についての研究は、顕著に欠如している。
本稿では、実体表現に基づく相互作用パラダイムを設計し、エンティティ強化トレーニングフレームワークを提案する。
提案するフレームワークはプラグアンドプレイでフレキシブルで,既存のテーブルレトリバーのトレーニングプロセスに統合しやすくする。
論文 参考訳(メタデータ) (2025-04-09T03:16:33Z) - Better Think with Tables: Tabular Structures Enhance LLM Comprehension for Data-Analytics Requests [33.471112091886894]
大規模言語モデル(LLM)は、情報検索やデータ操作に関連するデータ分析要求に悩まされることが多い。
我々は、データ分析要求のために表構造をLCMに注入するThinking with Tablesを紹介した。
テーブルを提供すると平均的なパフォーマンスが40.29パーセント向上し、操作性やトークン効率が向上することを示す。
論文 参考訳(メタデータ) (2024-12-22T23:31:03Z) - Doc2SoarGraph: Discrete Reasoning over Visually-Rich Table-Text
Documents via Semantic-Oriented Hierarchical Graphs [79.0426838808629]
視覚的にリッチなテーブルテキスト文書に答えるTAT-DQAを提案する。
具体的には、離散推論機能を強化した新しいDoc2SoarGraphフレームワークを提案する。
我々は,TAT-DQAデータセットに関する広範な実験を行い,提案したフレームワークは,テストセット上でのエクサクティマッチ(EM)とF1スコアでそれぞれ17.73%,F1スコアで16.91%の最高のベースラインモデルを上回る結果を得た。
論文 参考訳(メタデータ) (2023-05-03T07:30:32Z) - CTE: A Dataset for Contextualized Table Extraction [1.1859913430860336]
データセットは、35k以上のテーブルを含む、75kの完全な注釈付き科学論文で構成されている。
PubMed Centralから収集されたデータは、PubTables-1MとPubLayNetデータセットのアノテーションによって提供される情報をマージする。
生成されたアノテーションは、ドキュメントレイアウト分析、テーブル検出、構造認識、機能解析など、さまざまなタスクのためのエンドツーエンドパイプラインの開発に使用することができる。
論文 参考訳(メタデータ) (2023-02-02T22:38:23Z) - Tab2KG: Semantic Table Interpretation with Lightweight Semantic Profiles [3.655021726150368]
本稿では,テーブルのセマンティック解釈を意図したTab2KGを提案する。
ドメインの概念と関係を豊かにする独自の意味プロファイルを導入し、ドメインとテーブルの特徴を表現する。
既存のセマンティックテーブルの解釈アプローチとは対照的に、Tab2KGはセマンティックプロファイルのみに依存しており、インスタンスのルックアップを必要としない。
論文 参考訳(メタデータ) (2023-02-02T15:12:30Z) - A Graph Representation of Semi-structured Data for Web Question
Answering [96.46484690047491]
本稿では、半構造化データとそれらの関係の構成要素の体系的分類に基づいて、Webテーブルとリストのグラフ表現を提案する。
本手法は,最先端のベースラインに対してF1スコアを3.90ポイント向上させる。
論文 参考訳(メタデータ) (2020-10-14T04:01:54Z) - GraPPa: Grammar-Augmented Pre-Training for Table Semantic Parsing [117.98107557103877]
テーブルセマンティック解析のための効果的な事前学習手法GraPPaを提案する。
我々は、同期文脈自由文法を用いて、高自由度テーブル上に合成質問ペアを構築する。
実世界のデータを表現できるモデルの能力を維持するため、マスキング言語モデリングも含んでいる。
論文 参考訳(メタデータ) (2020-09-29T08:17:58Z) - Identifying Table Structure in Documents using Conditional Generative
Adversarial Networks [0.0]
多くの産業や学術研究において、情報は主に構造化されていない文書の形で伝達される。
本稿では,まず,テーブルイメージを標準化されたスケルトンテーブル形式にマッピングするために,条件付き生成逆数ネットワークを用いたトップダウンアプローチを提案する。
次に、xy-cutプロジェクションと遺伝的アルゴリズムを用いた潜在テーブル構造を導出する。
論文 参考訳(メタデータ) (2020-01-13T20:42:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。