論文の概要: TASER: Table Agents for Schema-guided Extraction and Recommendation
- arxiv url: http://arxiv.org/abs/2508.13404v1
- Date: Mon, 18 Aug 2025 23:48:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-20 15:36:31.742063
- Title: TASER: Table Agents for Schema-guided Extraction and Recommendation
- Title(参考訳): TASER: スキーマ誘導抽出・推薦用テーブルエージェント
- Authors: Nicole Cho, Kirsty Fielding, William Watson, Sumitra Ganesh, Manuela Veloso,
- Abstract要約: 実世界の金融文書は、ある企業の金融保有に関する重要な情報を報告する。
しかし、これらの詳細はしばしば散らかったマルチページの断片化されたテーブルに埋もれている。
本稿では,連続学習型エージェントテーブル抽出システムTASERを提案する。
- 参考スコア(独自算出の注目度): 11.034299225171559
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Real-world financial documents report essential information about an entity's financial holdings that can span millions of different financial instrument types. Yet, these details are often buried in messy, multi-page, fragmented tables - for example, 99.4% of the tables in our dataset have no bounding boxes with the maximum number of rows amounting to 426 per table across 44 pages. To tackle these unique challenges from real-world tables, we present a continuously learning, agentic table extraction system, TASER (Table Agents for Schema-guided Extraction and Recommendation) that extracts highly unstructured, multi-page, heterogeneous tables into normalized, schema-conforming outputs. Our table agents execute on table detection, classification, extraction, and recommendations by leveraging an initial schema. Then, our Recommender Agent reviews the outputs, recommends schema revisions, and decides on the final recommendations, enabling TASER to outperform existing table detection models such as Table Transformer by 10.1%. Within this continuous learning process, we highlight that larger batch sizes result in a 104.3% increase in schema recommendations that are actionable and utilized, resulting in a 9.8% increase in extracted holdings - highlighting the importance of a continuous learning process. To train TASER, we have manually labeled 22,584 pages (28,150,449 tokens), 3,213 tables for $731,685,511,687 of holdings culminating in one of the first real financial table datasets. We release our dataset TASERTab to enable the research community to access real-world financial tables and outputs. Our results highlight the promise of agentic, schema-guided extraction systems for robust understanding of real-world financial tables.
- Abstract(参考訳): 現実の金融文書は、数百万の異なる金融機器にまたがるエンティティの金融保有に関する重要な情報を報告します。
例えば、データセットの99.4%のテーブルには、44ページにわたってテーブル当たりの最大行数が426であるバウンディングボックスがありません。
実世界のテーブルからのこれらのユニークな課題に対処するため、我々は、高度に構造化されていない多ページ不均質なテーブルを正規化されたスキーマ変換出力に抽出するTASER(Table Agents for Schema-guided extract and Recommendation)を継続的に学習するエージェントテーブル抽出システムを提案する。
テーブルエージェントは、初期スキーマを利用してテーブルの検出、分類、抽出、レコメンデーションを実行します。
次に、Recommender Agentはアウトプットをレビューし、スキーマのリビジョンを推奨し、最終的なレコメンデーションを決定する。
この継続的学習プロセス内では、より大きなバッチサイズが実行可能で活用可能なスキーマレコメンデーションを104.3%増加させ、抽出されたホールドを9.8%増加させ、継続的学習プロセスの重要性を強調します。
TASERのトレーニングには、22,584ページ(28,150,449トークン)、3,213テーブルを731,685,511,687ドルで手作業でラベル付けしました。
我々は、研究コミュニティが現実世界の財務表やアウトプットにアクセスできるようにするために、データセットTASERTabをリリースした。
本結果は,現実の財務表の堅牢な理解を目的としたエージェント型,スキーマ誘導型抽出システムの実現性を強調した。
関連論文リスト
- RAPTOR: Refined Approach for Product Table Object Recognition [0.1516287840715525]
本研究は,テーブル抽出を改善するための最先端モデルを強化するために設計されたモジュール式後処理システムであるRAPTORを紹介する。
RAPTORは、TD(recurrent Table Detection)とTSR(Table Structure Recognition)の問題に対処し、両方の精度構造予測を改善した。
その結果、私たちのアプローチは製品表に優れていますが、様々なテーブル形式にまたがって適切なパフォーマンスを維持しています。
論文 参考訳(メタデータ) (2025-02-19T13:59:06Z) - SynFinTabs: A Dataset of Synthetic Financial Tables for Information and Table Extraction [1.0624606551524207]
既存のデータセットは、大量の学術論文のために科学的な表にフォーカスすることが多い。
現在のデータセットは、しばしば表に含まれる単語とその位置を欠いている。
SynFinTabsは、大規模にラベル付けされた合成財務表のデータセットである。
論文 参考訳(メタデータ) (2024-12-05T15:42:59Z) - TableRAG: Million-Token Table Understanding with Language Models [53.039560091592215]
TableRAG(TableRAG)は、LMベースのテーブル理解用に特別に設計された検索拡張生成(RAG)フレームワークである。
TableRAGは、スキーマとセル検索を組み合わせたクエリ拡張を活用して、LMにそれを提供する前に重要な情報をピンポイントする。
以上の結果から,TableRAGは検索精度が向上し,大規模テーブル理解における最先端性能が向上することが示唆された。
論文 参考訳(メタデータ) (2024-10-07T04:15:02Z) - TAP4LLM: Table Provider on Sampling, Augmenting, and Packing Semi-structured Data for Large Language Model Reasoning [55.33939289989238]
テーブルベースタスクにおいて,大規模言語モデル(LLM)を効果的に活用するための汎用プリプロセッサスイートとして,TAP4LLMを提案する。
1)大きなテーブルをクエリセマンティクスに基づいて管理可能なサブテーブルに分解するテーブルサンプリング、(2)外部ソースやモデルから追加の知識でテーブルを拡張するテーブル拡張、(3)テーブルパッキングとシリアライゼーションによりテーブルをLLMの理解に適したさまざまなフォーマットに変換する。
論文 参考訳(メタデータ) (2023-12-14T15:37:04Z) - Schema-Driven Information Extraction from Heterogeneous Tables [37.50854811537401]
本稿では、機械学習論文、化学文献、材料科学雑誌、ウェブページの4つの分野のテーブルからなるベンチマークを示す。
我々の実験は、タスク固有のパイプラインやラベルを必要とせずに、驚くほど競争力のあるパフォーマンスが達成できることを示した。
論文 参考訳(メタデータ) (2023-05-23T17:58:10Z) - Tab.IAIS: Flexible Table Recognition and Semantic Interpretation System [84.39812458417246]
完全テーブル認識処理を行い、最も頻繁なテーブル形式をサポートする2つのルールベースのアルゴリズムを開発する。
意味情報の抽出をテーブル認識プロセスに組み込むため,グラフに基づくテーブル解釈法を開発した。
我々のテーブル認識アプローチは、最先端のアプローチと競合する結果を得る。
論文 参考訳(メタデータ) (2021-05-25T12:31:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。