論文の概要: Experimenting with ChatGPT for Spreadsheet Formula Generation: Evidence
of Risk in AI Generated Spreadsheets
- arxiv url: http://arxiv.org/abs/2309.00095v1
- Date: Thu, 31 Aug 2023 19:31:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 11:45:27.032025
- Title: Experimenting with ChatGPT for Spreadsheet Formula Generation: Evidence
of Risk in AI Generated Spreadsheets
- Title(参考訳): スプレッドシートフォーミュラ生成のためのChatGPTによる実験:AI生成スプレッドシートのリスクの証拠
- Authors: Simon Thorne
- Abstract要約: LLM(Large Language Models)は、平易な英語文の解釈によって複雑なコンピュータプログラムを作成できるほど高度になった。
本稿では,ChatGPTを用いて,有効なスプレッドシート式を作成するためのツールの能力について検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large Language Models (LLM) have become sophisticated enough that complex
computer programs can be created through interpretation of plain English
sentences and implemented in a variety of modern languages such as Python, Java
Script, C++ and Spreadsheets. These tools are powerful and relatively accurate
and therefore provide broad access to computer programming regardless of the
background or knowledge of the individual using them. This paper presents a
series of experiments with ChatGPT to explore the tool's ability to produce
valid spreadsheet formulae and related computational outputs in situations
where ChatGPT has to deduce, infer and problem solve the answer. The results
show that in certain circumstances, ChatGPT can produce correct spreadsheet
formulae with correct reasoning, deduction and inference. However, when
information is limited, uncertain or the problem is too complex, the accuracy
of ChatGPT breaks down as does its ability to reason, infer and deduce. This
can also result in false statements and "hallucinations" that all subvert the
process of creating spreadsheet formulae.
- Abstract(参考訳): LLM(Large Language Models)は、Python、Java Script、C++、Spreadsheetsといったモダンな言語で実装された、平易な英語文の解釈によって複雑なコンピュータプログラムを作成できるほど高度になった。
これらのツールは強力で比較的正確であるため、個人が使っている背景や知識に関係なく、コンピュータプログラミングに幅広いアクセスを提供する。
本稿では,ChatGPTを用いた一連の実験を行い,ChatGPTが解答を推論し,推論し,問題の解答を行う状況下で,有効なスプレッドシート式と関連する計算結果を生成するツールの能力について検討する。
以上の結果から,ChatGPTは正しい推論,推論,推論で正しいスプレッドシートを生成できることがわかった。
しかし、情報が限られている場合、不確実である場合、あるいは問題が複雑すぎる場合、ChatGPTの精度が低下し、推論、推論の能力が低下する。
これはまた、表計算式を作成する過程を全て覆す虚偽のステートメントと「幻覚」をもたらす。
関連論文リスト
- NL2Formula: Generating Spreadsheet Formulas from Natural Language
Queries [29.33149993368329]
本稿では,NL2Formulaと呼ばれる新しいベンチマークタスクを紹介する。
目的は、自然言語(NL)クエリを入力として、スプレッドシートテーブル上にグラウンドされた実行可能な式を生成することである。
我々は,70,799対のNLクエリと対応するスプレッドシート公式からなる包括的データセットを構築し,21,670のテーブルと37種類の公式関数を網羅した。
論文 参考訳(メタデータ) (2024-02-20T05:58:05Z) - Can ChatGPT support software verification? [0.9668407688201361]
ループ不変量で106個のCプログラムにアノテートするようChatGPTに依頼する。
本稿では,Frama-C と CPA Checker の2つの検証器に渡すことで,生成した不変量の妥当性と有用性を確認する。
評価の結果,ChatGPTはFrama-Cがこれまで解決できなかったタスクを検証できる有効かつ有用な不変量を生成することができることがわかった。
論文 参考訳(メタデータ) (2023-11-04T15:25:18Z) - ChatGPT and Excel -- trust, but verify [0.0]
本稿では、ChatGPTに対する批判的なアプローチを採用し、その膨大なリーチが、単純な要件を持つ人々にとって有用なツールであることを示している。
システムとユーザプロンプトを備えたExcelscriptボタンを、Excelデスクトップ環境にChatGPT APIに追加する実践的なガイドで締めくくっている。
論文 参考訳(メタデータ) (2023-08-31T20:21:02Z) - Unmasking the giant: A comprehensive evaluation of ChatGPT's proficiency in coding algorithms and data structures [0.6990493129893112]
本稿では,ChatGPTが入力した問題に対する正しい解を生成する能力,コード品質,コードによってスローされる実行時エラーの性質を評価する。
この種の状況において、ChatGPTコードがいかに間違っているか、いくつかの洞察を得るために、パスされたテストケースのパターンを調べます。
論文 参考訳(メタデータ) (2023-07-10T08:20:34Z) - Fact-Checking Complex Claims with Program-Guided Reasoning [99.7212240712869]
Program-Guided Fact-Checking (ProgramFC)は、複雑なクレームを単純なサブタスクに分解する新しいファクトチェックモデルである。
まず,大規模言語モデルの文脈内学習能力を活用して推論プログラムを生成する。
我々は,各サブタスクを対応するサブタスクハンドラに委譲することでプログラムを実行する。
論文 参考訳(メタデータ) (2023-05-22T06:11:15Z) - ChatGPT Beyond English: Towards a Comprehensive Evaluation of Large
Language Models in Multilingual Learning [70.57126720079971]
大規模言語モデル(LLM)は、自然言語処理(NLP)において最も重要なブレークスルーとして登場した。
本稿では,高,中,低,低リソースの37言語を対象として,ChatGPTを7つのタスクで評価する。
従来のモデルと比較すると,様々なNLPタスクや言語に対するChatGPTの性能は低下していた。
論文 参考訳(メタデータ) (2023-04-12T05:08:52Z) - When do you need Chain-of-Thought Prompting for ChatGPT? [87.45382888430643]
CoT(Chain-of-Thought)は,大規模言語モデル(LLM)から複雑な多段階推論を効果的に引き出すことができる
CoT がChatGPT などの最近の命令微調整 (IFT) LLM に対してまだ有効であるかどうかは不明である。
論文 参考訳(メタデータ) (2023-04-06T17:47:29Z) - How Generative AI models such as ChatGPT can be (Mis)Used in SPC
Practice, Education, and Research? An Exploratory Study [2.0841728192954663]
生成人工知能(AI)モデルは、統計的プロセス制御(SPC)の実践、学習、研究に革命をもたらす可能性がある。
これらのツールは開発の初期段階にあり、簡単に誤用されるか、誤解される可能性がある。
コードを提供し、基本的な概念を説明し、SPCの実践、学習、研究に関する知識を創造するChatGPTの能力を探求する。
論文 参考訳(メタデータ) (2023-02-17T15:48:37Z) - A Multitask, Multilingual, Multimodal Evaluation of ChatGPT on
Reasoning, Hallucination, and Interactivity [79.12003701981092]
8種類の共通NLPアプリケーションタスクをカバーする23のデータセットを用いてChatGPTの広範な技術的評価を行う。
これらのデータセットと、新たに設計されたマルチモーダルデータセットに基づいて、ChatGPTのマルチタスク、マルチリンガル、マルチモーダルの側面を評価する。
ChatGPTの精度は平均63.41%で、論理的推論、非テキスト的推論、コモンセンス推論の10の異なる推論カテゴリで正確である。
論文 参考訳(メタデータ) (2023-02-08T12:35:34Z) - Is ChatGPT a General-Purpose Natural Language Processing Task Solver? [113.22611481694825]
大規模言語モデル(LLM)は、さまざまな自然言語処理(NLP)タスクをゼロショットで実行できることを実証している。
近年、ChatGPTのデビューは自然言語処理(NLP)コミュニティから大きな注目を集めている。
ChatGPTが多くのNLPタスクをゼロショットで実行できるジェネラリストモデルとして機能するかどうかはまだ分かっていない。
論文 参考訳(メタデータ) (2023-02-08T09:44:51Z) - Explaining Patterns in Data with Language Models via Interpretable
Autoprompting [143.4162028260874]
本稿では,データを説明する自然言語文字列を生成するアルゴリズムである,解釈可能なオートプロンプト(iPrompt)を提案する。
iPromptは、基盤となるデータセット記述を正確に見つけることで、意味のある洞察を得ることができる。
fMRIデータセットを用いた実験は、iPromptが科学的発見に役立つ可能性を示している。
論文 参考訳(メタデータ) (2022-10-04T18:32:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。