論文の概要: TableTalk: Scaffolding Spreadsheet Development with a Language Agent
- arxiv url: http://arxiv.org/abs/2502.09787v1
- Date: Thu, 13 Feb 2025 21:43:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-17 14:48:04.013317
- Title: TableTalk: Scaffolding Spreadsheet Development with a Language Agent
- Title(参考訳): TableTalk: 言語エージェントによるスプレッドシート開発
- Authors: Jenny T. Liang, Aayush Kumar, Yasharth Bajpai, Sumit Gulwani, Vu Le, Chris Parnin, Arjun Radhakrishna, Ashish Tiwari, Emerson Murphy-Hill, Guastavo Soares,
- Abstract要約: TableTalkは、プログラマが会話でスプレッドシートを構築するのを助ける言語エージェントである。
その設計は、スキャフォールディング、柔軟性、漸進性の3つの設計原則を再定義する。
20人のプログラマによるユーザ調査によると、TableTalkは2.3倍のスプレッドシートが好まれる傾向にある。
- 参考スコア(独自算出の注目度): 20.560984872689414
- License:
- Abstract: Despite its ubiquity in the workforce, spreadsheet programming remains challenging as programmers need both spreadsheet-specific knowledge (e.g., APIs to write formulas) and problem-solving skills to create complex spreadsheets. Large language models (LLMs) can help automate aspects of this process, and recent advances in planning and reasoning have enabled language agents, which dynamically plan, use tools, and take iterative actions to complete complex tasks. These agents observe, plan, and act, making them well-suited to scaffold spreadsheet programming by following expert processes. We present TableTalk, a language agent that helps programmers build spreadsheets conversationally. Its design reifies three design principles -- scaffolding, flexibility, and incrementality -- which we derived from two studies of seven programmers and 62 Excel templates. TableTalk structures spreadsheet development by generating step-by-step plans and suggesting three next steps users can choose from. It also integrates tools that enable incremental spreadsheet construction. A user study with 20 programmers shows that TableTalk produces spreadsheets 2.3 times more likely to be preferred over a baseline agent, while reducing cognitive load and time spent reasoning about spreadsheet actions by 12.6%. TableTalk's approach has implications for human-agent collaboration. This includes providing persistent direct manipulation interfaces for stopping or undoing agent actions, while ensuring that such interfaces for accepting actions can be deactivated.
- Abstract(参考訳): 労働力の多様さにもかかわらず、スプレッドシートプログラミングは、プログラマが複雑なスプレッドシートを作成するのに、スプレッドシート固有の知識(例えば、公式を書くためのAPI)と問題解決スキルの両方を必要とするため、依然として困難である。
大規模言語モデル(LLM)は、このプロセスの側面を自動化するのに役立つ。計画と推論の最近の進歩により、動的に計画し、ツールを使用し、複雑なタスクを完了するために反復的なアクションを取る言語エージェントが有効になった。
これらのエージェントは観察し、計画し、行動し、専門家のプロセスに従うことでスプレッドシートプログラミングに適している。
プログラマが会話でスプレッドシートを構築するのを支援する言語エージェントであるTableTalkを提示する。
その設計は、スキャフォールディング、柔軟性、インクリメンタル性の3つの設計原則を再定義し、7人のプログラマと62のExcelテンプレートの2つの研究から導き出した。
TableTalkは、ステップバイステップのプランを生成し、ユーザが選択できる次の3つのステップを提案することで、スプレッドシートの開発を構成します。
また、インクリメンタルなスプレッドシートの構築を可能にするツールも統合されている。
20人のプログラマによるユーザ調査によると、TableTalkはスプレッドシートをベースラインエージェントよりも好まれる確率が2.3倍高く、認知負荷とスプレッドシートアクションの推論に要する時間を12.6%削減している。
TableTalkのアプローチは、人間とエージェントのコラボレーションに影響を及ぼす。
これには、エージェントアクションを停止または解除するための永続的な直接操作インターフェースの提供と、アクションを受け入れるためのそのようなインターフェースの無効化の保証が含まれる。
関連論文リスト
- Unlocking Reasoning Potential in Large Langauge Models by Scaling Code-form Planning [94.76546523689113]
CodePlanは、テキストコード形式の計画を生成し、追跡するフレームワークで、高いレベルの構造化された推論プロセスの概要を擬似コードで示します。
CodePlanは、洗練された推論タスク固有のリッチなセマンティクスと制御フローを効果的にキャプチャする。
反応を直接生成するのに比べて25.1%の相対的な改善が達成されている。
論文 参考訳(メタデータ) (2024-09-19T04:13:58Z) - TART: An Open-Source Tool-Augmented Framework for Explainable Table-based Reasoning [61.14586098005874]
現在のLarge Language Models (LLM) は、テーブル構造を理解し、正確な数値推論を適用する能力に制限がある。
LLMと特殊なツールを統合するTART(Tool-Augmented Reasoning framework for Tables)を紹介した。
TARTには、正確なデータ表現を保証するテーブルフォーマッター、特定の計算ツールを開発するツールメーカー、説明可能性を維持するための説明ジェネレータの3つの重要なコンポーネントが含まれている。
論文 参考訳(メタデータ) (2024-09-18T06:19:59Z) - SpreadsheetLLM: Encoding Spreadsheets for Large Language Models [44.08092362611575]
SpreadsheetLLMは、スプレッドシート上の大きな言語モデル(LLM)を解き放つために設計された効率的な符号化手法である。
LLMのスプレッドシートを効果的に圧縮する革新的な符号化フレームワークである SheetCompressor を開発した。
SheetCompressor による微調整 LLM の圧縮率は平均 25 倍であるが、最先端の 78.9% の F1 スコアを達成し、既存のモデルでは 12.3% を上回っている。
論文 参考訳(メタデータ) (2024-07-12T06:34:21Z) - Ask-before-Plan: Proactive Language Agents for Real-World Planning [68.08024918064503]
プロアクティブエージェントプランニングでは、ユーザエージェントの会話とエージェント環境のインタラクションに基づいて、言語エージェントが明確化のニーズを予測する必要がある。
本稿では,明確化,実行,計画の3つのエージェントからなる新しいマルチエージェントフレームワーク,Clarification-Execution-Planning(textttCEP)を提案する。
論文 参考訳(メタデータ) (2024-06-18T14:07:28Z) - NL2Formula: Generating Spreadsheet Formulas from Natural Language
Queries [29.33149993368329]
本稿では,NL2Formulaと呼ばれる新しいベンチマークタスクを紹介する。
目的は、自然言語(NL)クエリを入力として、スプレッドシートテーブル上にグラウンドされた実行可能な式を生成することである。
我々は,70,799対のNLクエリと対応するスプレッドシート公式からなる包括的データセットを構築し,21,670のテーブルと37種類の公式関数を網羅した。
論文 参考訳(メタデータ) (2024-02-20T05:58:05Z) - ADaPT: As-Needed Decomposition and Planning with Language Models [131.063805299796]
As-Needed Decomposition and Planning for Complex Tasks (ADaPT)について紹介する。
ADaPTは、Large Language Modelsがそれらを実行できない場合、複雑なサブタスクを明示的に計画し、分解する。
以上の結果から,ADaPTは強いベースラインを確立した。
論文 参考訳(メタデータ) (2023-11-08T17:59:15Z) - SheetCopilot: Bringing Software Productivity to the Next Level through
Large Language Models [60.171444066848856]
本研究では,スプレッドシートの要求を満たすために自然言語処理と制御を行うスプレッドシートコパイロットエージェントを提案する。
221のスプレッドシート制御タスクを含む代表データセットをキュレートし,完全自動評価パイプラインを構築した。
当社の SheetCopilot は1世代で44.3% のタスクを正しく完了し、強力なコード生成ベースラインを広いマージンで上回っている。
論文 参考訳(メタデータ) (2023-05-30T17:59:30Z) - Enhanced Spreadsheet Computing with Finite-Domain Constraint
Satisfaction [1.6244541005112747]
視覚環境において有限領域制約解決を十分にサポートした拡張スプレッドシートシステムを提案する。
一般ユーザがデータセル間の制約を指定するために,スプレッドシート固有の制約言語を構築する。
新しいスプレッドシートシステムは、多くの制約ベースのアプリケーションの開発を著しく単純化する。
論文 参考訳(メタデータ) (2022-02-22T17:58:08Z) - Spreadsheet computing with Finite Domain Constraint Enhancements [0.0]
本稿では,有限制約解法をスプレッドシート計算パラダイムにシームレスに組み込んだフレームワークを提案する。
このフレームワークは制約解決のためのインターフェースを提供し、スプレッドシートコンピューティングパラダイムをさらに強化する。
論文 参考訳(メタデータ) (2022-02-22T17:50:48Z) - SpreadsheetCoder: Formula Prediction from Semi-structured Context [70.41579328458116]
行ベースと列ベースの両方のフォーマットで表されるコンテキストを表現するために,BERTベースのモデルアーキテクチャを提案する。
我々はスプレッドシートの大きなデータセットでモデルをトレーニングし、SpreadsheetCoderが42.51%の予測精度でトップ1の予測を達成できることを実証した。
ルールベースのシステムと比較すると、SpreadsheetCoder 82%は、Google Sheetsで公式を作成する上で、より多くのユーザを支援する。
論文 参考訳(メタデータ) (2021-06-26T11:26:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。