Fugu-MT 論文翻訳(概要): AI and the FCI: Can ChatGPT Project an Understanding of Introductory Physics?

論文の概要: AI and the FCI: Can ChatGPT Project an Understanding of Introductory Physics?

arxiv url: http://arxiv.org/abs/2303.01067v2
Date: Sun, 26 Mar 2023 18:18:17 GMT
ステータス: 翻訳完了
システム内更新日: 2023-03-29 00:16:43.598969
Title: AI and the FCI: Can ChatGPT Project an Understanding of Introductory Physics?
Title（参考訳）: AIとFCI:ChatGPTは導入物理を理解することができるか?
Authors: Colin G. West
Abstract要約: ChatGPTは大きな言語モデルに基づいて構築された画期的なAIインターフェースで、人間の会話をエミュレートする巨大なテキストコーパスに基づいてトレーニングされた。本稿では,第1学期におけるChatGPTの2つのバージョンについて,予備的な分析を行った。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: ChatGPT is a groundbreaking ``chatbot"--an AI interface built on a large language model that was trained on an enormous corpus of human text to emulate human conversation. Beyond its ability to converse in a plausible way, it has attracted attention for its ability to competently answer questions from the bar exam and from MBA coursework, and to provide useful assistance in writing computer code. These apparent abilities have prompted discussion of ChatGPT as both a threat to the integrity of higher education and conversely as a powerful teaching tool. In this work we present a preliminary analysis of how two versions of ChatGPT (ChatGPT3.5 and ChatGPT4) fare in the field of first-semester university physics, using a modified version of the Force Concept Inventory (FCI) to assess whether it can give correct responses to conceptual physics questions about kinematics and Newtonian dynamics. We demonstrate that, by some measures, ChatGPT3.5 can match or exceed the median performance of a university student who has completed one semester of college physics, though its performance is notably uneven and the results are nuanced. By these same measures, we find that ChatGPT4's performance is approaching the point of being indistinguishable from that of an expert physicist when it comes to introductory mechanics topics. After the completion of our work we became aware of Ref [1], which preceded us to publication and which completes an extensive analysis of the abilities of ChatGPT3.5 in a physics class, including a different modified version of the FCI. We view this work as confirming that portion of their results, and extending the analysis to ChatGPT4, which shows rapid and notable improvement in most, but not all respects.
Abstract（参考訳）: ChatGPTは、大規模な言語モデル上に構築されたAIインターフェースで、人間の会話をエミュレートする巨大なテキストコーパスに基づいてトレーニングされている。もっともらしい方法での会話能力以外にも、バーの試験やMBAのコースワークからの質問に答える能力や、コンピュータコードを書く上で有用な支援を提供する能力に注目が集まっている。これらの明らかな能力は、ChatGPTを高等教育の完全性への脅威であり、逆に強力な教育ツールであるとの議論を引き起こしている。本研究は,第1世代の大学物理学におけるChatGPT(ChatGPT3.5とChatGPT4)の2つのバージョンについて,FCI(Force Concept Inventory)の修正版を用いて,運動学とニュートン力学に関する概念物理学問題に対する正しい応答を与えることができるかどうかを予備分析する。実験の結果,ChatGPT3.5は1学期を修了した大学生の中央値と一致または上回ることができるが,その性能は明らかに不均一であり,その結果は曖昧であることがわかった。これらの測定により、ChatGPT4の性能は、入門力学のトピックに関して専門家物理学者のパフォーマンスと区別できない点に近づいていることがわかった。研究が完了した後、我々は出版に先立つRef [1]を認識し、異なる修正バージョンのFCIを含む物理学クラスにおけるChatGPT3.5の能力の広範な解析を完了した。この研究は、結果の一部を確認し、分析をChatGPT4に拡張したものだと考えています。

関連論文リスト

Exploring ChatGPT's Capabilities on Vulnerability Management [56.4403395100589]
我々は、70,346のサンプルを含む大規模なデータセットを用いて、完全な脆弱性管理プロセスを含む6つのタスクでChatGPTの機能を探求する。注目すべき例として、ChatGPTのソフトウェアバグレポートのタイトル生成などのタスクにおける熟練度がある。以上の結果から,ChatGPTが抱える障害が明らかとなり,将来的な方向性に光を当てた。
論文参考訳（メタデータ） (2023-11-11T11:01:13Z)
Uncovering the Potential of ChatGPT for Discourse Analysis in Dialogue: An Empirical Study [51.079100495163736]
本稿では、トピックセグメンテーションと談話解析という2つの談話分析タスクにおけるChatGPTの性能を体系的に検証する。 ChatGPTは、一般的なドメイン間会話においてトピック構造を特定する能力を示すが、特定のドメイン間会話ではかなり困難である。我々のより深い調査は、ChatGPTは人間のアノテーションよりも合理的なトピック構造を提供するが、階層的なレトリック構造を線形に解析することしかできないことを示唆している。
論文参考訳（メタデータ） (2023-05-15T07:14:41Z)
Can ChatGPT Pass An Introductory Level Functional Language Programming Course? [2.3456295046913405]
本稿では,ChatGPTが導入レベルの関数型言語プログラミングコースでどの程度うまく機能するかを検討することを目的とする。総合的な評価は、ChatGPTが学生とインストラクターの両方に与える影響についての貴重な洞察を提供する。
論文参考訳（メタデータ） (2023-04-29T20:30:32Z)
ChatGPT-Crawler: Find out if ChatGPT really knows what it's talking about [15.19126287569545]
本研究では,異なる対話型QAコーパスからChatGPTが生成する応答について検討する。この研究はBERT類似度スコアを用いて、これらの回答を正しい回答と比較し、自然言語推論(NLI)ラベルを得る。調査では、ChatGPTが質問に対する誤った回答を提供し、モデルがエラーを起こしやすい領域について洞察を与えている事例を特定した。
論文参考訳（メタデータ） (2023-04-06T18:42:47Z)
To ChatGPT, or not to ChatGPT: That is the question! [78.407861566006]
本研究は,ChatGPT検出における最新の手法を包括的かつ現代的に評価するものである。我々は、ChatGPTと人間からのプロンプトからなるベンチマークデータセットをキュレートし、医療、オープンQ&A、ファイナンスドメインからの多様な質問を含む。評価の結果,既存の手法ではChatGPT生成内容を効果的に検出できないことがわかった。
論文参考訳（メタデータ） (2023-04-04T03:04:28Z)
Advances in apparent conceptual physics reasoning in GPT-4 [0.0]
ChatGPTは、人間の会話をエミュレートする巨大なテキストコーパスに基づいて訓練された大きな言語モデルに基づいて構築されている。最近の研究は、GPT-3.5が何らかの名目レベルで入門物理学のコースをパスし、ニュートン力学のフォース・コンセプト・インベントリへの最小限の理解に近づいたものを登録できることを実証している。この研究はこれらの結果を再現し、最新バージョンのGPT-4が後者の文脈ではるかに高いスコアに達したことを証明した。
論文参考訳（メタデータ） (2023-03-29T20:32:40Z)
On the Educational Impact of ChatGPT: Is Artificial Intelligence Ready to Obtain a University Degree? [0.0]
大学教育におけるChatGPTの効果を評価する。コンピュータサイエンスの高等教育は、ChatGPTのようなツールにどのように適応すべきかについて議論する。
論文参考訳（メタデータ） (2023-03-20T14:27:37Z)
Analyzing ChatGPT's Aptitude in an Introductory Computer Engineering Course [6.531546527140474]
ChatGPTは、様々な質問に対して可塑性で人間に聞こえるテキストを生成できるツールである。この研究は、初歩的なコンピュータ工学コースにおいて、クイズ、宿題、試験、実験室の質問に答えることにおけるChatGPTの適性を評価する。
論文参考訳（メタデータ） (2023-03-13T16:22:43Z)
Can ChatGPT Understand Too? A Comparative Study on ChatGPT and Fine-tuned BERT [103.57103957631067]
チャットGPTは、人間の質問に対する流動的で高品質な応答を生成できるため、大きな注目を集めている。そこで我々は,ChatGPTの理解能力を,最も人気のあるGLUEベンチマークで評価し,より詳細な4種類のBERTスタイルのモデルと比較した。 2)ChatGPTは,感情分析や質問応答タスクにおいて,BERTと同等のパフォーマンスを達成している。
論文参考訳（メタデータ） (2023-02-19T12:29:33Z)
Is ChatGPT a General-Purpose Natural Language Processing Task Solver? [113.22611481694825]
大規模言語モデル(LLM)は、さまざまな自然言語処理(NLP)タスクをゼロショットで実行できることを実証している。近年、ChatGPTのデビューは自然言語処理(NLP)コミュニティから大きな注目を集めている。 ChatGPTが多くのNLPタスクをゼロショットで実行できるジェネラリストモデルとして機能するかどうかはまだ分かっていない。
論文参考訳（メタデータ） (2023-02-08T09:44:51Z)
A Categorical Archive of ChatGPT Failures [47.64219291655723]
OpenAIが開発したChatGPTは、大量のデータを使って訓練され、人間の会話をシミュレートしている。それは、広範囲の人間の問い合わせに効果的に答える能力のために、大きな注目を集めている。しかし、ChatGPTの失敗の包括的分析は欠落しており、これが本研究の焦点となっている。
論文参考訳（メタデータ） (2023-02-06T04:21:59Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。