論文の概要: TASER: Table Agents for Schema-guided Extraction and Recommendation
- arxiv url: http://arxiv.org/abs/2508.13404v3
- Date: Wed, 15 Oct 2025 00:51:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-16 20:13:28.28972
- Title: TASER: Table Agents for Schema-guided Extraction and Recommendation
- Title(参考訳): TASER: スキーマ誘導抽出・推薦用テーブルエージェント
- Authors: Nicole Cho, Kirsty Fielding, William Watson, Sumitra Ganesh, Manuela Veloso,
- Abstract要約: 実世界の金融文書は、ある企業の金融保有に関する重要な情報を報告する。
しかし、これらの詳細はしばしば散らかったマルチページの断片化されたテーブルに埋もれている。
本稿では,連続学習型エージェントテーブル抽出システムTASERを提案する。
- 参考スコア(独自算出の注目度): 15.964897805909402
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Real-world financial documents report essential information about an entity's financial holdings that can span millions of different financial instrument types. Yet, these details are often buried in messy, multi-page, fragmented tables - for example, 99.4% of the tables in our dataset have no bounding boxes with the maximum number of rows amounting to 426 per table across 44 pages. To tackle these unique challenges from real-world tables, we present a continuously learning, agentic table extraction system, TASER (Table Agents for Schema-guided Extraction and Recommendation) that extracts highly unstructured, multi-page, heterogeneous tables into normalized, schema-conforming outputs. Our table agents execute on table detection, classification, extraction, and recommendations by leveraging an initial schema. Then, our Recommender Agent reviews the outputs, recommends schema revisions, and decides on the final recommendations, enabling TASER to outperform existing table detection models such as Table Transformer by 10.1%. Within this continuous learning process, we highlight that larger batch sizes result in a 104.3% increase in schema recommendations that are actionable and utilized, resulting in a 9.8% increase in extracted holdings - highlighting the importance of a continuous learning process. To train TASER, we have manually labeled 22,584 pages (28,150,449 tokens), 3,213 tables for $731,685,511,687 of holdings culminating in one of the first real financial table datasets. We release our dataset TASERTab to enable the research community to access real-world financial tables and outputs. Our results highlight the promise of agentic, schema-guided extraction systems for robust understanding of real-world financial tables.
- Abstract(参考訳): 現実の金融文書は、数百万の異なる金融機器にまたがるエンティティの金融保有に関する重要な情報を報告します。
例えば、データセットの99.4%のテーブルには、44ページにわたってテーブル当たりの最大行数が426であるバウンディングボックスがありません。
実世界のテーブルからのこれらのユニークな課題に対処するため、我々は、高度に構造化されていない多ページ不均質なテーブルを正規化されたスキーマ変換出力に抽出するTASER(Table Agents for Schema-guided extract and Recommendation)を継続的に学習するエージェントテーブル抽出システムを提案する。
テーブルエージェントは、初期スキーマを利用してテーブルの検出、分類、抽出、レコメンデーションを実行します。
次に、Recommender Agentはアウトプットをレビューし、スキーマのリビジョンを推奨し、最終的なレコメンデーションを決定する。
この継続的学習プロセス内では、より大きなバッチサイズが実行可能で活用可能なスキーマレコメンデーションを104.3%増加させ、抽出されたホールドを9.8%増加させ、継続的学習プロセスの重要性を強調します。
TASERのトレーニングには、22,584ページ(28,150,449トークン)、3,213テーブルを731,685,511,687ドルで手作業でラベル付けしました。
我々は、研究コミュニティが現実世界の財務表やアウトプットにアクセスできるようにするために、データセットTASERTabをリリースした。
本結果は,現実の財務表の堅牢な理解を目的としたエージェント型,スキーマ誘導型抽出システムの実現性を強調した。
関連論文リスト
- T2R-bench: A Benchmark for Generating Article-Level Reports from Real World Industrial Tables [65.12524437711737]
本稿では,テーブル・ツー・レポーティングタスクを提案し,T2R-benchというバイリンガルベンチマークを構築した。
ベンチマークは457の産業用テーブルで構成されており、すべて現実世界のシナリオから導かれ、19の産業ドメインを含んでいる。
25台のLLMでの実験では、Deepseek-R1のような最先端のモデルでさえ62.71のスコアでしかパフォーマンスが得られないことがわかった。
論文 参考訳(メタデータ) (2025-08-27T11:55:40Z) - Multimodal Tabular Reasoning with Privileged Structured Information [67.40011423365712]
ブリッジインfOrmation (sc Turbo) を用いたタブウラー推論(TabUlar Reasoning)について紹介する。
sc TurboはDeepSeek-R1をベースにした構造対応の推論トレースジェネレータの恩恵を受ける。
sc Turboは、複数のデータセットで最先端のパフォーマンス(+7.2%対以前のSOTA)を達成する。
論文 参考訳(メタデータ) (2025-06-04T15:46:30Z) - RAPTOR: Refined Approach for Product Table Object Recognition [0.1516287840715525]
本研究は,テーブル抽出を改善するための最先端モデルを強化するために設計されたモジュール式後処理システムであるRAPTORを紹介する。
RAPTORは、TD(recurrent Table Detection)とTSR(Table Structure Recognition)の問題に対処し、両方の精度構造予測を改善した。
その結果、私たちのアプローチは製品表に優れていますが、様々なテーブル形式にまたがって適切なパフォーマンスを維持しています。
論文 参考訳(メタデータ) (2025-02-19T13:59:06Z) - SynFinTabs: A Dataset of Synthetic Financial Tables for Information and Table Extraction [1.0624606551524207]
既存のデータセットは、大量の学術論文のために科学的な表にフォーカスすることが多い。
現在のデータセットは、しばしば表に含まれる単語とその位置を欠いている。
SynFinTabsは、大規模にラベル付けされた合成財務表のデータセットである。
論文 参考訳(メタデータ) (2024-12-05T15:42:59Z) - TableGPT2: A Large Multimodal Model with Tabular Data Integration [22.77225649639725]
TableGPT2は、593.8K以上のテーブルと2.36Mの高品質なクエリテーブル出力を備えた、厳格に事前訓練および微調整されたモデルである。
TableGPT2の重要な革新の1つは、スキーマレベルとセルレベルの情報をキャプチャするために特別に設計されたテーブルエンコーダである。
論文 参考訳(メタデータ) (2024-11-04T13:03:13Z) - TableRAG: Million-Token Table Understanding with Language Models [53.039560091592215]
TableRAG(TableRAG)は、LMベースのテーブル理解用に特別に設計された検索拡張生成(RAG)フレームワークである。
TableRAGは、スキーマとセル検索を組み合わせたクエリ拡張を活用して、LMにそれを提供する前に重要な情報をピンポイントする。
以上の結果から,TableRAGは検索精度が向上し,大規模テーブル理解における最先端性能が向上することが示唆された。
論文 参考訳(メタデータ) (2024-10-07T04:15:02Z) - KET-QA: A Dataset for Knowledge Enhanced Table Question Answering [63.56707527868466]
本研究では,TableQAの外部知識源として知識ベース(KB)を用いることを提案する。
すべての質問は、答えるテーブルとサブグラフの両方からの情報を統合する必要がある。
我々は,膨大な知識サブグラフから関連する情報を抽出するために,レトリバー・レゾナー構造パイプラインモデルを設計する。
論文 参考訳(メタデータ) (2024-05-13T18:26:32Z) - Synthesizing Realistic Data for Table Recognition [4.500373384879752]
本稿では,テーブル認識に特化して設計されたアノテーションデータを合成する手法を提案する。
中国の金融発表から表の構造と内容を活用することで、我々は最初の広範囲な表アノテーションデータセットを開発した。
我々は、中国の金融発表領域における実世界の複合表の初歩的ベンチマークを確立し、このベンチマークを用いて、我々の合成データに基づいてトレーニングされたモデルの性能を評価する。
論文 参考訳(メタデータ) (2024-04-17T06:36:17Z) - TAP4LLM: Table Provider on Sampling, Augmenting, and Packing Semi-structured Data for Large Language Model Reasoning [55.33939289989238]
テーブルベースタスクにおいて,大規模言語モデル(LLM)を効果的に活用するための汎用プリプロセッサスイートとして,TAP4LLMを提案する。
1)大きなテーブルをクエリセマンティクスに基づいて管理可能なサブテーブルに分解するテーブルサンプリング、(2)外部ソースやモデルから追加の知識でテーブルを拡張するテーブル拡張、(3)テーブルパッキングとシリアライゼーションによりテーブルをLLMの理解に適したさまざまなフォーマットに変換する。
論文 参考訳(メタデータ) (2023-12-14T15:37:04Z) - Schema-Driven Information Extraction from Heterogeneous Tables [37.50854811537401]
本稿では、機械学習論文、化学文献、材料科学雑誌、ウェブページの4つの分野のテーブルからなるベンチマークを示す。
我々の実験は、タスク固有のパイプラインやラベルを必要とせずに、驚くほど競争力のあるパフォーマンスが達成できることを示した。
論文 参考訳(メタデータ) (2023-05-23T17:58:10Z) - Tab.IAIS: Flexible Table Recognition and Semantic Interpretation System [84.39812458417246]
完全テーブル認識処理を行い、最も頻繁なテーブル形式をサポートする2つのルールベースのアルゴリズムを開発する。
意味情報の抽出をテーブル認識プロセスに組み込むため,グラフに基づくテーブル解釈法を開発した。
我々のテーブル認識アプローチは、最先端のアプローチと競合する結果を得る。
論文 参考訳(メタデータ) (2021-05-25T12:31:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。