論文の概要: ST-Raptor: An Agentic System for Semi-Structured Table QA
- arxiv url: http://arxiv.org/abs/2602.07034v1
- Date: Tue, 03 Feb 2026 09:06:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:24.384064
- Title: ST-Raptor: An Agentic System for Semi-Structured Table QA
- Title(参考訳): ST-Raptor: 半構造化テーブルQAのためのエージェントシステム
- Authors: Jinxiu Qu, Zirui Tang, Hongzhang Huang, Boyu Niu, Wei Zhou, Jiannan Wang, Yitong Song, Guoliang Li, Xuanhe Zhou, Fan Wu,
- Abstract要約: 半構造化テーブル質問応答(QA)のためのエージェントシステムST-Raptorを提案する。
ST-Raptorは、ビジュアル編集、ツリーベースの構造モデリング、エージェント駆動クエリ解決を組み合わせたインタラクティブな分析環境を提供し、正確でユーザフレンドリなテーブル理解をサポートする。
- 参考スコア(独自算出の注目度): 16.18235560779917
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semi-structured table question answering (QA) is a challenging task that requires (1) precise extraction of cell contents and positions and (2) accurate recovery of key implicit logical structures, hierarchical relationships, and semantic associations encoded in table layouts. In practice, such tables are often interpreted manually by human experts, which is labor-intensive and time-consuming. However, automating this process remains difficult. Existing Text-to-SQL methods typically require converting semi-structured tables into structured formats, inevitably leading to information loss, while approaches like Text-to-Code and multimodal LLM-based QA struggle with complex layouts and often yield inaccurate answers. To address these limitations, we present ST-Raptor, an agentic system for semi-structured table QA. ST-Raptor offers an interactive analysis environment that combines visual editing, tree-based structural modeling, and agent-driven query resolution to support accurate and user-friendly table understanding. Experimental results on both benchmark and real-world datasets demonstrate that ST-Raptor outperforms existing methods in both accuracy and usability. The code is available at https://github.com/weAIDB/ST-Raptor, and a demonstration video is available at https://youtu.be/9GDR-94Cau4.
- Abstract(参考訳): 半構造化テーブル質問応答 (QA) は,(1) 細胞の内容と位置の正確な抽出,(2) 重要な暗黙的論理構造,階層的関係,およびテーブルレイアウトに符号化された意味的関連性の正確な回復を必要とする課題である。
実際には、このような表は人間の専門家によって手動で解釈されることが多く、それは労働集約的で時間を要する。
しかし、このプロセスの自動化は依然として困難である。
既存のText-to-SQLメソッドでは、半構造化テーブルを構造化形式に変換する必要があり、必然的に情報損失につながる。
これらの制約に対処するため、半構造化テーブルQAのためのエージェントシステムST-Raptorを提案する。
ST-Raptorは、ビジュアル編集、ツリーベースの構造モデリング、エージェント駆動クエリ解決を組み合わせたインタラクティブな分析環境を提供し、正確でユーザフレンドリなテーブル理解をサポートする。
ベンチマークと実世界の両方のデータセットの実験結果から、ST-Raptorは既存の手法よりも精度とユーザビリティの両方で優れていることが示された。
コードはhttps://github.com/weAIDB/ST-Raptorで、デモビデオはhttps://youtu.be/9GDR-94Cau4で公開されている。
関連論文リスト
- MonkeyOCR v1.5 Technical Report: Unlocking Robust Document Parsing for Complex Patterns [80.05126590825121]
MonkeyOCR v1.5は、レイアウト理解とコンテンツ認識の両方を強化する統合ビジョン言語フレームワークである。
複雑なテーブル構造に対処するために,視覚的整合性に基づく強化学習手法を提案する。
2つの特別なモジュール、Image-Decoupled Table ParsingとType-Guided Table Mergingを導入し、テーブルの信頼性の高いパースを可能にする。
論文 参考訳(メタデータ) (2025-11-13T15:12:17Z) - Same Content, Different Representations: A Controlled Study for Table QA [15.896655757672441]
リアルタイム設定におけるテーブル質問回答(Table QA)は、構造化されたデータベースとテキストフィールドを含む半構造化されたテーブルの両方で操作する必要がある。
既存のベンチマークは固定データ形式に結びついており、表現自体がモデルパフォーマンスに与える影響を体系的に検討していない。
コンテント定数を一定に保ちながら構造を変化させることによりテーブル表現の役割を分離する最初の制御された研究について述べる。
論文 参考訳(メタデータ) (2025-09-26T22:33:19Z) - ST-Raptor: LLM-Powered Semi-Structured Table Question Answering [17.807768747239205]
現実世界のアプリケーションで広く使われている半構造化テーブルは、フレキシブルで複雑なレイアウトを含むことが多い。
これらのテーブルは、テーブルレイアウトを解釈し、関連する自然言語の質問に答えるために、人間アナリストに依存している。
大規模言語モデルを用いた半構造化テーブル質問応答のための木ベースのフレームワークST-Raptorを提案する。
論文 参考訳(メタデータ) (2025-08-25T16:48:51Z) - TabularGSM: Understanding the Limitations of LLMs in Tabular Math Reasoning [26.230588166759706]
本稿では,算術語問題をスケーラブルかつ検証可能な表型推論タスクに変換する,ニューロシンボリックなフレームワークであるAutoT2Tを提案する。
3つの段階的に複雑なサブセットと2つの相補的な評価設定を持つトラップサブセットからなるベンチマークであるTabularを開発した。
論文 参考訳(メタデータ) (2025-05-26T06:24:31Z) - Mixed-modality Representation Learning and Pre-training for Joint
Table-and-Text Retrieval in OpenQA [85.17249272519626]
最適化された OpenQA Table-Text Retriever (OTTeR) を提案する。
検索中心の混合モード合成事前学習を行う。
OTTeRはOTT-QAデータセット上でのテーブル・アンド・テキスト検索の性能を大幅に改善する。
論文 参考訳(メタデータ) (2022-10-11T07:04:39Z) - OmniTab: Pretraining with Natural and Synthetic Data for Few-shot
Table-based Question Answering [106.73213656603453]
最小限のアノテーションによるテーブルベースのQAモデルを構築した。
本稿では、自然データと合成データの両方を消費する全能事前学習手法を提案する。
論文 参考訳(メタデータ) (2022-07-08T01:23:45Z) - Table Retrieval May Not Necessitate Table-specific Model Design [83.27735758203089]
テーブル検索のタスクに焦点をあてて、"テーブル固有のモデル設計はテーブル検索に必要か?
自然質問データセット (NQ-table) の表に基づく分析の結果, 70%以上の症例では構造が無視できる役割を担っていることがわかった。
次に、テーブル構造、すなわち補助列/カラム埋め込み、ハードアテンションマスク、ソフトリレーションに基づくアテンションバイアスを明示的にエンコードする3つのモジュールを実験する。
いずれも大きな改善は得られず、テーブル固有のモデル設計がテーブル検索に不要である可能性が示唆された。
論文 参考訳(メタデータ) (2022-05-19T20:35:23Z) - Parameter-Efficient Abstractive Question Answering over Tables or Text [60.86457030988444]
QAシステムを求める情報の長期的な野望は、マルチモーダルなコンテキストを推論し、ユーザクエリに対する自然な回答を生成することである。
メモリ集約型事前学習言語モデルは、構造化されていないテキストや構造化テーブルのような特定のモードでQAデータ上のモデルを微調整することで、QAのような下流タスクに適応する。
パラメータ効率の良いアダプタは、トランス層間の小さなタスク固有のボトルネック層を加算し、訓練する。
論文 参考訳(メタデータ) (2022-04-07T10:56:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。