論文の概要: SheetMind: An End-to-End LLM-Powered Multi-Agent Framework for Spreadsheet Automation
- arxiv url: http://arxiv.org/abs/2506.12339v1
- Date: Sat, 14 Jun 2025 04:22:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-17 17:28:45.890228
- Title: SheetMind: An End-to-End LLM-Powered Multi-Agent Framework for Spreadsheet Automation
- Title(参考訳): SheetMind: スプレッドシート自動化のためのLLM駆動マルチエージェントフレームワーク
- Authors: Ruiyan Zhu, Xi Cheng, Ke Liu, Brian Zhu, Daniel Jin, Neeraj Parihar, Zhoutian Xu, Oliver Gao,
- Abstract要約: SheetMindは、自然言語によるスプレッドシート自動化のためのフレームワークである。
スクリプティングや公式知識を必要とせずにリアルタイムインタラクションをサポートする。
本結果は,マルチエージェント分解と文法に基づく実行の有効性を強調した。
- 参考スコア(独自算出の注目度): 6.369724723888092
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present SheetMind, a modular multi-agent framework powered by large language models (LLMs) for spreadsheet automation via natural language instructions. The system comprises three specialized agents: a Manager Agent that decomposes complex user instructions into subtasks; an Action Agent that translates these into structured commands using a Backus Naur Form (BNF) grammar; and a Reflection Agent that validates alignment between generated actions and the user's original intent. Integrated into Google Sheets via a Workspace extension, SheetMind supports real-time interaction without requiring scripting or formula knowledge. Experiments on benchmark datasets demonstrate an 80 percent success rate on single step tasks and approximately 70 percent on multi step instructions, outperforming ablated and baseline variants. Our results highlight the effectiveness of multi agent decomposition and grammar based execution for bridging natural language and spreadsheet functionalities.
- Abstract(参考訳): SheetMindは,大規模言語モデル(LLM)を利用した,自然言語命令によるスプレッドシート自動化のためのモジュール型マルチエージェントフレームワークである。
システムは、複雑なユーザ命令をサブタスクに分解するマネージャエージェント、これらをバックスナーフォーム(BNF)文法を使用して構造化されたコマンドに変換するアクションエージェント、生成されたアクションとユーザの本来の意図との整合性を検証するリフレクションエージェントの3つの特殊エージェントから構成される。
Workspace拡張を通じてGoogle Sheetsに統合されたSheetMindは、スクリプティングや公式知識を必要とせずに、リアルタイムインタラクションをサポートする。
ベンチマークデータセットの実験では、シングルステップのタスクで80%の成功率、マルチステップの命令で約70%の成功率を示し、改善とベースラインのバリエーションよりも優れています。
本結果は,多エージェント分解と文法に基づく実行が,自然言語とスプレッドシートの機能のブリッジ化に有効であることを示す。
関連論文リスト
- PC-Agent: A Hierarchical Multi-Agent Collaboration Framework for Complex Task Automation on PC [98.82146219495792]
本稿では,PC-Agentという階層型エージェントフレームワークを提案する。
認識の観点からは,現在のMLLMのスクリーンショットコンテンツに対する認識能力の不十分さを克服するために,アクティブ知覚モジュール(APM)を考案する。
意思決定の観点から、複雑なユーザ命令や相互依存サブタスクをより効果的に扱うために、階層的なマルチエージェント協調アーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-02-20T05:41:55Z) - TableTalk: Scaffolding Spreadsheet Development with a Language Agent [20.560984872689414]
TableTalkは、プログラマが会話でスプレッドシートを構築するのを助ける言語エージェントである。
その設計は、スキャフォールディング、柔軟性、漸進性の3つの設計原則を再定義する。
20人のプログラマによるユーザ調査によると、TableTalkは2.3倍のスプレッドシートが好まれる傾向にある。
論文 参考訳(メタデータ) (2025-02-13T21:43:51Z) - HELPER-X: A Unified Instructable Embodied Agent to Tackle Four Interactive Vision-Language Domains with Memory-Augmented Language Models [13.963676467274109]
我々は、より広い例とプロンプトでメモリを拡張することで、HELPERの機能を拡張する。
この単純なHELPERの共有メモリへの拡張により、エージェントは対話、自然言語の命令、アクティブな質問、一般的な部屋の再編成から計画を実行するドメイン間で作業することができる。
本稿では,AChRED,TAA,DialFRED,Tidy Taskの4種類の対話型視覚言語エンボディエージェントについて評価を行った。
論文 参考訳(メタデータ) (2024-04-29T19:12:42Z) - SheetAgent: Towards A Generalist Agent for Spreadsheet Reasoning and Manipulation via Large Language Models [45.930510174309845]
大規模言語モデル(LLM)は,最近,スプレッドシートの自動操作のために試みられている。
SheetAgentはPlanner、Informer、Retrieverの3つの共同モジュールで構成されている。
SheetAgentはベースラインよりも複数のベンチマークで20~40%のパスレート改善を実現している。
論文 参考訳(メタデータ) (2024-03-06T11:48:08Z) - Executable Code Actions Elicit Better LLM Agents [76.95566120678787]
この研究は、Pythonコードを使用して、Large Language Model(LLM)エージェントのアクションを統一されたアクション空間(CodeAct)に統合することを提案する。
Pythonインタプリタと統合されたCodeActは、コードアクションを実行し、事前アクションを動的に修正したり、マルチターンインタラクションを通じて新しい観察に新しいアクションを発行することができる。
CodeActのパフォーマンス向上は、解釈可能なコードを実行し、自然言語を使ってユーザとコラボレーションすることで、環境と対話するオープンソースのLLMエージェントを構築する動機となります。
論文 参考訳(メタデータ) (2024-02-01T21:38:58Z) - Recommender AI Agent: Integrating Large Language Models for Interactive
Recommendations [53.76682562935373]
我々は,LLMを脳として,レコメンダモデルをツールとして使用する,textbfInteRecAgentという効率的なフレームワークを紹介した。
InteRecAgentは会話レコメンデーションシステムとして満足度を達成し、汎用LLMよりも優れる。
論文 参考訳(メタデータ) (2023-08-31T07:36:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。