論文の概要: SheetBrain: A Neuro-Symbolic Agent for Accurate Reasoning over Complex and Large Spreadsheets
- arxiv url: http://arxiv.org/abs/2510.19247v1
- Date: Wed, 22 Oct 2025 05:09:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:15.130693
- Title: SheetBrain: A Neuro-Symbolic Agent for Accurate Reasoning over Complex and Large Spreadsheets
- Title(参考訳): SheetBrain: 複雑で大規模なスプレッドシート上での高精度推論のための神経シンボリックエージェント
- Authors: Ziwei Wang, Jiayuan Su, Mengyu Zhou, Huaxing Zeng, Mengni Jia, Xiao Lv, Haoyu Dong, Xiaojun Ma, Shi Han, Dongmei Zhang,
- Abstract要約: SheetBrainは、スプレッドシート上の推論のための神経シンボリックな二重エージェントフレームワークである。
スプレッドシートの質問応答と操作タスクの両方をサポートする。
SheetBenchは、大規模で、マルチテーブルで、構造的に複雑なスプレッドシートをターゲットにした、新しいベンチマークである。
- 参考スコア(独自算出の注目度): 37.47629183214491
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding and reasoning over complex spreadsheets remain fundamental challenges for large language models (LLMs), which often struggle with accurately capturing the complex structure of tables and ensuring reasoning correctness. In this work, we propose SheetBrain, a neuro-symbolic dual workflow agent framework designed for accurate reasoning over tabular data, supporting both spreadsheet question answering and manipulation tasks. SheetBrain comprises three core modules: an understanding module, which produces a comprehensive overview of the spreadsheet - including sheet summary and query-based problem insight to guide reasoning; an execution module, which integrates a Python sandbox with preloaded table-processing libraries and an Excel helper toolkit for effective multi-turn reasoning; and a validation module, which verifies the correctness of reasoning and answers, triggering re-execution when necessary. We evaluate SheetBrain on multiple public tabular QA and manipulation benchmarks, and introduce SheetBench, a new benchmark targeting large, multi-table, and structurally complex spreadsheets. Experimental results show that SheetBrain significantly improves accuracy on both existing benchmarks and the more challenging scenarios presented in SheetBench. Our code is publicly available at https://github.com/microsoft/SheetBrain.
- Abstract(参考訳): 複雑なスプレッドシートに対する理解と推論は、テーブルの複雑な構造を正確に把握し、推論の正確性を確保するためにしばしば苦労する大きな言語モデル(LLM)の基本的な課題である。
本研究では,表層データに対する正確な推論を行うために設計された,ニューロシンボリックなデュアルワークフローエージェントフレームワークであるSheetBrainを提案し,表層質問応答と操作タスクの両方をサポートする。
SheetBrainは3つのコアモジュールで構成されており、スプレッドシートの包括的な概要を生成する理解モジュール(シートの要約とクエリベースの問題洞察による推論のガイドを含む)、Pythonサンドボックスとプリロードされたテーブル処理ライブラリ、効果的なマルチターン推論のためのExcelヘルパーツールキットを統合する実行モジュール、推論と回答の正しさを検証する検証モジュール、必要に応じて再実行をトリガーする検証モジュールである。
SheetBrainを複数の公開表形式QAおよび操作ベンチマークで評価し,大規模でマルチテーブル,構造的に複雑なスプレッドシートを対象とした新しいベンチマークである SheetBench を紹介した。
実験結果から, SheetBrainは既存のベンチマークと, SheetBenchで提示されるより困難なシナリオの両方において,精度を著しく向上することが示された。
私たちのコードはhttps://github.com/microsoft/SheetBrain.comで公開されています。
関連論文リスト
- SQuARE: Structured Query & Adaptive Retrieval Engine For Tabular Formats [0.0]
SQuAREはシートレベルの複雑なルーティングを備えたハイブリッド検索フレームワークである。
ヘッダの深さとマージ密度に基づいて連続的なスコアを計算する。
SQuAREは、検索精度とエンドツーエンドの回答精度の両方において、シングルストラテジーベースラインとChatGPT-4oを一貫して上回る。
論文 参考訳(メタデータ) (2025-12-03T22:11:45Z) - General Table Question Answering via Answer-Formula Joint Generation [48.004786816436116]
テーブル質問応答(TableQA)メソッドは、大きな言語モデル(LLM)に応答テキストやPythonコードを生成する。
これらの方法には、特定の質問タイプやテーブル構造を扱うための汎用性がない。
複数種類のテーブル上で複数のタスクを同時に解決する汎用テーブル応答フレームワークである textttTabAF を提案する。
同じモデルサイズで、textttTabAFはWikiTable、HiTab、TabFactで最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-03-16T03:51:06Z) - SpreadsheetBench: Towards Challenging Real World Spreadsheet Manipulation [34.8332394229927]
SpreadsheetBenchは,現在の大規模言語モデル(LLM)を,スプレッドシートユーザのワークフローにマージするように設計されている。
合成クエリと単純化されたスプレッドシートファイルに依存する既存のベンチマークとは異なり、SpreadsheetBenchはオンラインExcelフォーラムから収集された912の質問から作られている。
単一ラウンドおよび複数ラウンドの推論条件下での各種LLMの総合評価は,最先端モデル(SOTA)と人為的性能との間に大きなギャップがあることを示唆している。
論文 参考訳(メタデータ) (2024-06-21T09:06:45Z) - SheetAgent: Towards A Generalist Agent for Spreadsheet Reasoning and Manipulation via Large Language Models [45.930510174309845]
大規模言語モデル(LLM)は,最近,スプレッドシートの自動操作のために試みられている。
SheetAgentはPlanner、Informer、Retrieverの3つの共同モジュールで構成されている。
SheetAgentはベースラインよりも複数のベンチマークで20~40%のパスレート改善を実現している。
論文 参考訳(メタデータ) (2024-03-06T11:48:08Z) - TAP4LLM: Table Provider on Sampling, Augmenting, and Packing Semi-structured Data for Large Language Model Reasoning [55.33939289989238]
テーブルベースタスクにおいて,大規模言語モデル(LLM)を効果的に活用するための汎用プリプロセッサスイートとして,TAP4LLMを提案する。
1)大きなテーブルをクエリセマンティクスに基づいて管理可能なサブテーブルに分解するテーブルサンプリング、(2)外部ソースやモデルから追加の知識でテーブルを拡張するテーブル拡張、(3)テーブルパッキングとシリアライゼーションによりテーブルをLLMの理解に適したさまざまなフォーマットに変換する。
論文 参考訳(メタデータ) (2023-12-14T15:37:04Z) - MultiTabQA: Generating Tabular Answers for Multi-Table Question
Answering [61.48881995121938]
実世界のクエリは本質的に複雑で、リレーショナルデータベースやWebページ内の複数のテーブルにまたがることが多い。
我々のモデルであるMultiTabQAは、複数のテーブル上の質問に答えるだけでなく、表形式の回答を生成するために一般化する。
論文 参考訳(メタデータ) (2023-05-22T08:25:15Z) - Enhanced Spreadsheet Computing with Finite-Domain Constraint
Satisfaction [1.6244541005112747]
視覚環境において有限領域制約解決を十分にサポートした拡張スプレッドシートシステムを提案する。
一般ユーザがデータセル間の制約を指定するために,スプレッドシート固有の制約言語を構築する。
新しいスプレッドシートシステムは、多くの制約ベースのアプリケーションの開発を著しく単純化する。
論文 参考訳(メタデータ) (2022-02-22T17:58:08Z) - Spreadsheet computing with Finite Domain Constraint Enhancements [0.0]
本稿では,有限制約解法をスプレッドシート計算パラダイムにシームレスに組み込んだフレームワークを提案する。
このフレームワークは制約解決のためのインターフェースを提供し、スプレッドシートコンピューティングパラダイムをさらに強化する。
論文 参考訳(メタデータ) (2022-02-22T17:50:48Z) - SpreadsheetCoder: Formula Prediction from Semi-structured Context [70.41579328458116]
行ベースと列ベースの両方のフォーマットで表されるコンテキストを表現するために,BERTベースのモデルアーキテクチャを提案する。
我々はスプレッドシートの大きなデータセットでモデルをトレーニングし、SpreadsheetCoderが42.51%の予測精度でトップ1の予測を達成できることを実証した。
ルールベースのシステムと比較すると、SpreadsheetCoder 82%は、Google Sheetsで公式を作成する上で、より多くのユーザを支援する。
論文 参考訳(メタデータ) (2021-06-26T11:26:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。