Fugu-MT 論文翻訳(概要): PulseBench-Tab: A Multilingual Benchmark for Table Extraction with Graph-Based Evaluation

論文の概要: PulseBench-Tab: A Multilingual Benchmark for Table Extraction with Graph-Based Evaluation

arxiv url: http://arxiv.org/abs/2606.07534v1
Date: Tue, 21 Apr 2026 18:19:44 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-22 00:18:43.351943
Title: PulseBench-Tab: A Multilingual Benchmark for Table Extraction with Graph-Based Evaluation
Title（参考訳）: PulseBench-Tab:グラフに基づくテーブル抽出のための多言語ベンチマーク
Authors: Ritvik Pandey, Sid Manchkanti, Mohammed Wazir Adain, Mohammed Hadi, Dushyanth Sekhar,
Abstract要約: 我々は、文書画像からテーブル抽出を評価するためのオープンな多言語ベンチマークであるPulseBench-Tabを紹介する。ベンチマークは、9つの言語と4つのスクリプトにまたがる1,820の人間アノテーションテーブルで構成されている。表は 2 から 1,183 の細胞で、48.1% は融合または分散した細胞を含む。
参考スコア（独自算出の注目度）: 0.41562334038629606
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We introduce PulseBench-Tab, an open multilingual benchmark for evaluating table extraction from document images. The benchmark comprises 1,820 human-annotated tables spanning 9 languages and 4 scripts (Latin, CJK, Arabic, Cyrillic), drawn from 380 real-world source documents including financial filings, government reports, and regulatory disclosures. Tables range from 2 to 1,183 cells, with 48.1% containing merged or spanning cells. Alongside the dataset, we propose T-LAG (Table Logical Adjacency Graph), a novel evaluation metric that models tables as directed graphs over cell adjacencies and computes structural and content fidelity in a single score via optimal bipartite matching. We evaluate 9 commercial and open-source table extraction systems across the benchmark and report per-language breakdowns. The full dataset, scoring code, and all provider outputs are publicly available.
Abstract（参考訳）: 我々は、文書画像からテーブル抽出を評価するためのオープンな多言語ベンチマークであるPulseBench-Tabを紹介する。ベンチマークは、9つの言語と4つのスクリプト(ラテン語、CJK、アラビア語、キリル語)にまたがる1,820の人称注釈テーブルで構成され、財務書類、政府報告、規制開示を含む380の現実世界のソース文書から作成されている。表は 2 から 1,183 の細胞で、48.1% は融合または分散した細胞を含む。本稿では,T-LAG(Table Logical Adjacency Graph)を提案する。T-LAG(Table Logical Adjacency Graph)は,T-LAG(Table Logical Adjacency Graph)とT-LAG(Table Logical Adjacency Graph)を併用し,テーブルをセルの隣接点上の有向グラフとしてモデル化し,最適二部マッチングにより単一スコアにおける構造的および内容的忠実度を算出する。ベンチマークを用いて,9つの商用およびオープンソースのテーブル抽出システムを評価し,言語ごとの分解を報告する。完全なデータセット、スコア付けコード、すべてのプロバイダ出力が公開されている。

関連論文リスト

The Structured Output Benchmark: A Multi-Source Benchmark for Evaluating Structured Output Quality in Large Language Models [0.23332469289621785]
SOB(Structured Output Benchmark)は3つのソースにまたがるマルチソースベンチマークである。すべてのモデルは、ソースのモダリティに関係なく、コンテキストのテキスト正規化表現を受け取る。モデルは、ほぼ完璧なスキーマコンプライアンスを実現するが、正確な葉値マッチングによって測定された最高の値精度は、テキスト上では83.0%にしか達しない。
論文参考訳（メタデータ） (2026-04-28T08:27:01Z)
DenTab: A Dataset for Table Recognition and Visual QA on Real-World Dental Estimates [2.7885016877286897]
DenTabは、高品質なHTMLアノテーションを備えた歯科用推定値から2000個のトリミングされたテーブルイメージのデータセットである。我々は、14の視覚言語エグゼキュータモデル(VLM)と2つのOCRベースラインを含む16のシステムをベンチマークした。本稿では,算術的質問を決定論的実行にルーティングするテーブルルータパイプラインを提案する。
論文参考訳（メタデータ） (2026-04-17T14:33:51Z)
T2R-bench: A Benchmark for Generating Article-Level Reports from Real World Industrial Tables [65.12524437711737]
本稿では,テーブル・ツー・レポーティングタスクを提案し,T2R-benchというバイリンガルベンチマークを構築した。ベンチマークは457の産業用テーブルで構成されており、すべて現実世界のシナリオから導かれ、19の産業ドメインを含んでいる。 25台のLLMでの実験では、Deepseek-R1のような最先端のモデルでさえ62.71のスコアでしかパフォーマンスが得られないことがわかった。
論文参考訳（メタデータ） (2025-08-27T11:55:40Z)
POLYCHARTQA: Benchmarking Large Vision-Language Models with Multilingual Chart Question Answering [69.52231076699756]
PolyChartQAは10の言語で22,606のチャートと26,151の質問応答ペアをカバーする最初の大規模多言語チャート回答ベンチマークである。我々は、最先端のLLMベースの翻訳を活用し、パイプラインにおける厳密な品質制御を適用し、生成された多言語チャートの言語的および意味的一貫性を確保する。
論文参考訳（メタデータ） (2025-07-16T06:09:02Z)
SPRINT: Script-agnostic Structure Recognition in Tables [20.394597266150534]
表構造認識(TSR)は、情報検索、テーブル再構築、文書理解など、さまざまな下流業務に不可欠である。言語に依存しないセル配置予測としてTSRを提案し,表にSPRINT, スクリプトに依存しない構造認識を導入する。我々は、PubTabNet、FinTabNet、PubTables-1Mを含むベンチマークTSRデータセットのパフォーマンスを実験的に評価した。
論文参考訳（メタデータ） (2025-03-15T00:43:53Z)
UniTabNet: Bridging Vision and Language Models for Enhanced Table Structure Recognition [55.153629718464565]
我々は、画像からテキストへのモデルに基づくテーブル構造解析のための新しいフレームワークUniTabNetを紹介する。 UniTabNetは、画像とテキストのモデルを使ってテーブルセルを分離し、物理デコーダと論理デコーダを統合して完全なテーブル構造を再構築する。
論文参考訳（メタデータ） (2024-09-20T01:26:32Z)
Statements: Universal Information Extraction from Tables with Large Language Models for ESG KPIs [18.401579353633807]
環境、社会、ガバナンス(ESG)は、気候変動などの問題において組織のパフォーマンスを評価する。 ESGレポートは、この貴重な量的情報をテーブルを通して伝達する。本稿では,量的事実や関連情報を抽出するドメインに依存しない新しいデータ構造であるステートメントを提案する。
論文参考訳（メタデータ） (2024-06-27T11:28:50Z)
ReTAG: Reasoning Aware Table to Analytic Text Generation [12.603569641254417]
ReTAGは、ベクトル量子化を用いて異なるタイプの解析的推論を出力に注入するテーブルおよび推論認識モデルである。私たちは、ToTTo、InfoTabsデータセットを参照文毎に推論カテゴリで拡張(そして、オープンソースの35.6K分析、55.9k記述インスタンス)します。
論文参考訳（メタデータ） (2023-05-19T17:03:09Z)
GraPPa: Grammar-Augmented Pre-Training for Table Semantic Parsing [117.98107557103877]
テーブルセマンティック解析のための効果的な事前学習手法GraPPaを提案する。我々は、同期文脈自由文法を用いて、高自由度テーブル上に合成質問ペアを構築する。実世界のデータを表現できるモデルの能力を維持するため、マスキング言語モデリングも含んでいる。
論文参考訳（メタデータ） (2020-09-29T08:17:58Z)
ToTTo: A Controlled Table-To-Text Generation Dataset [61.83159452483026]
ToTToはオープンドメインの英語のテーブル・トゥ・テキストのデータセットで、12万以上のトレーニングサンプルがある。本稿では、ウィキペディアから既存の候補文を直接修正するデータセット構築プロセスを紹介する。通常流動的であるが、既存の方法は多くの場合、表がサポートしていないフレーズを幻覚させる。
論文参考訳（メタデータ） (2020-04-29T17:53:45Z)
GFTE: Graph-based Financial Table Extraction [66.26206038522339]
金融業界や他の多くの分野において、表は構造化されていないデジタルファイル、例えばポータブル文書フォーマット(PDF)や画像でしばしば開示される。我々はFinTabという中国の標準データセットを公開しています。今後の比較のためのベースラインとしてGFTEという新しいグラフベースの畳み込みネットワークモデルを提案する。
論文参考訳（メタデータ） (2020-03-17T07:10:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。