論文の概要: SheetBrain: A Neuro-Symbolic Agent for Accurate Reasoning over Complex and Large Spreadsheets
- arxiv url: http://arxiv.org/abs/2510.19247v1
- Date: Wed, 22 Oct 2025 05:09:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:15.130693
- Title: SheetBrain: A Neuro-Symbolic Agent for Accurate Reasoning over Complex and Large Spreadsheets
- Title(参考訳): SheetBrain: 複雑で大規模なスプレッドシート上での高精度推論のための神経シンボリックエージェント
- Authors: Ziwei Wang, Jiayuan Su, Mengyu Zhou, Huaxing Zeng, Mengni Jia, Xiao Lv, Haoyu Dong, Xiaojun Ma, Shi Han, Dongmei Zhang,
- Abstract要約: SheetBrainは、スプレッドシート上の推論のための神経シンボリックな二重エージェントフレームワークである。
スプレッドシートの質問応答と操作タスクの両方をサポートする。
SheetBenchは、大規模で、マルチテーブルで、構造的に複雑なスプレッドシートをターゲットにした、新しいベンチマークである。
- 参考スコア(独自算出の注目度): 37.47629183214491
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding and reasoning over complex spreadsheets remain fundamental challenges for large language models (LLMs), which often struggle with accurately capturing the complex structure of tables and ensuring reasoning correctness. In this work, we propose SheetBrain, a neuro-symbolic dual workflow agent framework designed for accurate reasoning over tabular data, supporting both spreadsheet question answering and manipulation tasks. SheetBrain comprises three core modules: an understanding module, which produces a comprehensive overview of the spreadsheet - including sheet summary and query-based problem insight to guide reasoning; an execution module, which integrates a Python sandbox with preloaded table-processing libraries and an Excel helper toolkit for effective multi-turn reasoning; and a validation module, which verifies the correctness of reasoning and answers, triggering re-execution when necessary. We evaluate SheetBrain on multiple public tabular QA and manipulation benchmarks, and introduce SheetBench, a new benchmark targeting large, multi-table, and structurally complex spreadsheets. Experimental results show that SheetBrain significantly improves accuracy on both existing benchmarks and the more challenging scenarios presented in SheetBench. Our code is publicly available at https://github.com/microsoft/SheetBrain.
- Abstract(参考訳): 複雑なスプレッドシートに対する理解と推論は、テーブルの複雑な構造を正確に把握し、推論の正確性を確保するためにしばしば苦労する大きな言語モデル(LLM)の基本的な課題である。
本研究では,表層データに対する正確な推論を行うために設計された,ニューロシンボリックなデュアルワークフローエージェントフレームワークであるSheetBrainを提案し,表層質問応答と操作タスクの両方をサポートする。
SheetBrainは3つのコアモジュールで構成されており、スプレッドシートの包括的な概要を生成する理解モジュール(シートの要約とクエリベースの問題洞察による推論のガイドを含む)、Pythonサンドボックスとプリロードされたテーブル処理ライブラリ、効果的なマルチターン推論のためのExcelヘルパーツールキットを統合する実行モジュール、推論と回答の正しさを検証する検証モジュール、必要に応じて再実行をトリガーする検証モジュールである。
SheetBrainを複数の公開表形式QAおよび操作ベンチマークで評価し,大規模でマルチテーブル,構造的に複雑なスプレッドシートを対象とした新しいベンチマークである SheetBench を紹介した。
実験結果から, SheetBrainは既存のベンチマークと, SheetBenchで提示されるより困難なシナリオの両方において,精度を著しく向上することが示された。
私たちのコードはhttps://github.com/microsoft/SheetBrain.comで公開されています。
関連論文リスト
- SpreadsheetBench: Towards Challenging Real World Spreadsheet Manipulation [34.8332394229927]
SpreadsheetBenchは,現在の大規模言語モデル(LLM)を,スプレッドシートユーザのワークフローにマージするように設計されている。
合成クエリと単純化されたスプレッドシートファイルに依存する既存のベンチマークとは異なり、SpreadsheetBenchはオンラインExcelフォーラムから収集された912の質問から作られている。
単一ラウンドおよび複数ラウンドの推論条件下での各種LLMの総合評価は,最先端モデル(SOTA)と人為的性能との間に大きなギャップがあることを示唆している。
論文 参考訳(メタデータ) (2024-06-21T09:06:45Z) - SheetAgent: Towards A Generalist Agent for Spreadsheet Reasoning and Manipulation via Large Language Models [45.930510174309845]
大規模言語モデル(LLM)は,最近,スプレッドシートの自動操作のために試みられている。
SheetAgentはPlanner、Informer、Retrieverの3つの共同モジュールで構成されている。
SheetAgentはベースラインよりも複数のベンチマークで20~40%のパスレート改善を実現している。
論文 参考訳(メタデータ) (2024-03-06T11:48:08Z) - TAP4LLM: Table Provider on Sampling, Augmenting, and Packing Semi-structured Data for Large Language Model Reasoning [55.33939289989238]
テーブルベースタスクにおいて,大規模言語モデル(LLM)を効果的に活用するための汎用プリプロセッサスイートとして,TAP4LLMを提案する。
1)大きなテーブルをクエリセマンティクスに基づいて管理可能なサブテーブルに分解するテーブルサンプリング、(2)外部ソースやモデルから追加の知識でテーブルを拡張するテーブル拡張、(3)テーブルパッキングとシリアライゼーションによりテーブルをLLMの理解に適したさまざまなフォーマットに変換する。
論文 参考訳(メタデータ) (2023-12-14T15:37:04Z) - MultiTabQA: Generating Tabular Answers for Multi-Table Question
Answering [61.48881995121938]
実世界のクエリは本質的に複雑で、リレーショナルデータベースやWebページ内の複数のテーブルにまたがることが多い。
我々のモデルであるMultiTabQAは、複数のテーブル上の質問に答えるだけでなく、表形式の回答を生成するために一般化する。
論文 参考訳(メタデータ) (2023-05-22T08:25:15Z) - SpreadsheetCoder: Formula Prediction from Semi-structured Context [70.41579328458116]
行ベースと列ベースの両方のフォーマットで表されるコンテキストを表現するために,BERTベースのモデルアーキテクチャを提案する。
我々はスプレッドシートの大きなデータセットでモデルをトレーニングし、SpreadsheetCoderが42.51%の予測精度でトップ1の予測を達成できることを実証した。
ルールベースのシステムと比較すると、SpreadsheetCoder 82%は、Google Sheetsで公式を作成する上で、より多くのユーザを支援する。
論文 参考訳(メタデータ) (2021-06-26T11:26:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。