論文の概要: Advances in apparent conceptual physics reasoning in GPT-4
- arxiv url: http://arxiv.org/abs/2303.17012v3
- Date: Sun, 16 Apr 2023 17:49:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-18 20:25:50.025032
- Title: Advances in apparent conceptual physics reasoning in GPT-4
- Title(参考訳): GPT-4における概念物理推論の進歩
- Authors: Colin G. West
- Abstract要約: ChatGPTは、人間の会話をエミュレートする巨大なテキストコーパスに基づいて訓練された大きな言語モデルに基づいて構築されている。
最近の研究は、GPT-3.5が何らかの名目レベルで入門物理学のコースをパスし、ニュートン力学のフォース・コンセプト・インベントリへの最小限の理解に近づいたものを登録できることを実証している。
この研究はこれらの結果を再現し、最新バージョンのGPT-4が後者の文脈ではるかに高いスコアに達したことを証明した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: ChatGPT is built on a large language model trained on an enormous corpus of
human text to emulate human conversation. Despite lacking any explicit
programming regarding the laws of physics, recent work has demonstrated that
GPT-3.5 could pass an introductory physics course at some nominal level and
register something close to a minimal understanding of Newtonian Mechanics on
the Force Concept Inventory. This work replicates those results and also
demonstrates that the latest version, GPT-4, has reached a much higher mark in
the latter context. Indeed, its responses come quite close to perfectly
demonstrating expert-level competence, with a few very notable exceptions and
limitations. We briefly comment on the implications of this for the future of
physics education and pedagogy.
- Abstract(参考訳): ChatGPTは、人間の会話をエミュレートする巨大なテキストコーパスに基づいて訓練された大きな言語モデルに基づいて構築されている。
物理学の法則に関する明確なプログラミングが欠如しているにもかかわらず、最近の研究はGPT-3.5が何らかの名目レベルで入門物理学のコースをパスし、ニュートン力学の力の概念に関する最小限の理解に近いものを登録できることを示した。
この研究はこれらの結果を再現し、最新バージョンの GPT-4 が後者の文脈ではるかに高いスコアに達したことを示す。
実際、その反応は、非常に顕著な例外と制限を含む、専門家レベルの能力の完全な証明に非常に近い。
物理学教育と教育学の将来への影響について、簡単にコメントする。
関連論文リスト
- Towards World Simulator: Crafting Physical Commonsense-Based Benchmark for Video Generation [51.750634349748736]
テキスト・ツー・ビデオ(T2V)モデルは複雑なプロンプトの可視化に大きく貢献している。
しかし、直感的な物理を正確に表現するこれらのモデルの能力はほとんど解明されていない。
本稿では,T2V生成における物理コモンセンスの正しさを評価するためにPhyGenBenchを導入する。
論文 参考訳(メタデータ) (2024-10-07T17:56:04Z) - PhyGrasp: Generalizing Robotic Grasping with Physics-informed Large
Multimodal Models [58.33913881592706]
人間は、自分の直感的な物理学を巧みに把握し、これまで見たことのない物体であっても、効率的に把握を変更できる。
この研究は、そのような物理的常識的推論をロボット操作に注入することに注力している。
自然言語と3次元点雲の2つのモードからの入力を利用するマルチモーダル大モデルであるPhyGraspを紹介する。
論文 参考訳(メタデータ) (2024-02-26T18:57:52Z) - Assessing Large Language Models in Mechanical Engineering Education: A
Study on Mechanics-Focused Conceptual Understanding [25.769293445579816]
本研究では,機械工学の領域における概念問題に対するLLM(Large Language Models)の能力について,メカニクスに焦点をあてて検討する。
ChatGPT(GPT-3.5)、ChatGPT(GPT-4)、Claude(Claude-2.1)の3つのLCMは、機械工学のバックグラウンドの有無にかかわらず、工学の能力や学生に対して評価された。
その結果, GPT-4 は他の2つの LLM およびヒトコホートよりも優れた性能を示し, 連続力学を除く様々な力学分野の質問に答えることができた。
論文 参考訳(メタデータ) (2024-01-13T19:19:04Z) - GRASP: A novel benchmark for evaluating language GRounding And Situated Physics understanding in multimodal language models [4.354672867211922]
本稿では,ビデオベースマルチモーダル大言語モデル(LLM)の言語基盤と物理的理解能力を評価するための新しいベンチマークGRASPを提案する。
我々は、最先端のマルチモーダルLCMの評価にそれを用いている。
評価の結果,これらのモデルの言語基盤化や直感的な物理能力に重大な欠陥があることが判明した。
論文 参考訳(メタデータ) (2023-11-15T15:38:28Z) - X-VoE: Measuring eXplanatory Violation of Expectation in Physical Events [75.94926117990435]
本研究では,AIエージェントによる直感的な物理の把握を評価するベンチマークデータセットであるX-VoEを紹介する。
X-VoEは直感的な物理モデルの説明能力を高めるためのより高いバーを確立する。
本稿では、物理力学を捉え、隠蔽対象状態を推定する説明に基づく学習システムを提案する。
論文 参考訳(メタデータ) (2023-08-21T03:28:23Z) - Sparks of Artificial General Intelligence: Early experiments with GPT-4 [66.1188263570629]
OpenAIが開発したGPT-4は、前例のない規模の計算とデータを使って訓練された。
我々は, GPT-4が数学, コーディング, ビジョン, 医学, 法学, 心理学などにまたがる, 新規で困難な課題を解くことを実証した。
我々は、GPT-4を人工知能(AGI)システムの早期(まだ未完成)版と見なすことができると信じている。
論文 参考訳(メタデータ) (2023-03-22T16:51:28Z) - AI and the FCI: Can ChatGPT Project an Understanding of Introductory
Physics? [0.0]
ChatGPTは大きな言語モデルに基づいて構築された画期的なAIインターフェースで、人間の会話をエミュレートする巨大なテキストコーパスに基づいてトレーニングされた。
本稿では,第1学期におけるChatGPTの2つのバージョンについて,予備的な分析を行った。
論文 参考訳(メタデータ) (2023-03-02T08:43:11Z) - Dynamic Visual Reasoning by Learning Differentiable Physics Models from
Video and Language [92.7638697243969]
視覚概念を協調的に学習し,映像や言語から物体の物理モデルを推定する統合フレームワークを提案する。
これは視覚認識モジュール、概念学習モジュール、微分可能な物理エンジンの3つのコンポーネントをシームレスに統合することで実現される。
論文 参考訳(メタデータ) (2021-10-28T17:59:13Z) - Lectures on quantum supreme matter [0.0]
ノートは、2021年秋にオランダのデルタ理論物理学研究所(Delta Institute of Theory Physics)の上級大学院教育のための講義に基づいている。
ゴールは、非特殊主義者によって量子情報の非常に最近の進歩によって理解される言語で説明することである。
弦理論で発見されたホログラフィック双対性は、そのような物質の観測可能な性質を計算できる数学的機械であるように見える。
論文 参考訳(メタデータ) (2021-10-03T09:34:36Z) - Machine-Learning Non-Conservative Dynamics for New-Physics Detection [69.45430691069974]
未知の力によって支配される軌道を考えると、ニューラル・ニュー物理検出器(NNPhD)は新しい物理を検出することを目的としています。
我々はNNPhDが、力場を保守的かつ非保守的成分に分解することで、新しい物理学の発見に成功したことを実証する。
また,NNPhDと積分器の結合が,減衰二重振り子の将来を予測する従来の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-05-31T18:00:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。