論文の概要: Limits of an AI program for solving college math problems
- arxiv url: http://arxiv.org/abs/2208.06906v1
- Date: Sun, 14 Aug 2022 20:10:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-16 13:40:34.629503
- Title: Limits of an AI program for solving college math problems
- Title(参考訳): 大学数学の問題解決のためのAIプログラムの限界
- Authors: Ernest Davis
- Abstract要約: ニューラルネットワークは、人間のレベルでのプログラム合成と少数ショット学習によって、大学の数学問題を解き、説明し、生成する。
彼らが記述したシステムは確かに印象的だが、上記の記述は非常に過大評価されている。
問題を解決する作業はニューラルネットワークではなく、シンボリック代数パッケージSympyによって行われる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Drori et al. (2022) report that "A neural network solves, explains, and
generates university math problems by program synthesis and few-shot learning
at human level ... [It] automatically answers 81\% of university-level
mathematics problems." The system they describe is indeed impressive; however,
the above description is very much overstated. The work of solving the problems
is done, not by a neural network, but by the symbolic algebra package Sympy.
Problems of various formats are excluded from consideration. The so-called
"explanations" are just rewordings of lines of code. Answers are marked as
correct that are not in the form specified in the problem. Most seriously, it
seems that in many cases the system uses the correct answer given in the test
corpus to guide its path to solving the problem.
- Abstract(参考訳): drori et al. (2022) は「ニューラルネットワークは、プログラム合成と人間のレベルでの数少ない学習によって、大学の数学問題を解き、説明し、生成する... [it]大学レベルの数学問題の81\%に自動的に答える。
「それらが記述するシステムは実に印象的であるが、上記の記述は非常に過大評価されている。この問題を解決する作業はニューラルネットワークではなく、記号代数学のパッケージSympyによって行われる。様々な形式の問題は考慮外である。いわゆる「説明」は単なるコード行の言い換えである。
答えは問題で特定されていない形で正しいとマークされる。
真面目な話として、多くの場合、システムはテストコーパスで与えられた正しい答えを使用して、問題解決への道筋を導いているようだ。
関連論文リスト
- FrontierMath: A Benchmark for Evaluating Advanced Mathematical Reasoning in AI [2.0608396919601493]
FrontierMath(フロンティアマス、フロンティアマス、FrontierMath)は、数学者が考案し検証した何百もの数学問題のベンチマークである。
現在の最先端のAIモデルは、問題の2%未満を解決し、AI能力と数学的コミュニティの長所との間に大きなギャップが浮かび上がっている。
AIシステムが専門家レベルの数学的能力に向かって進むにつれ、FrontierMathは彼らの進歩を定量化する厳格なテストベッドを提供する。
論文 参考訳(メタデータ) (2024-11-07T17:07:35Z) - Explaining Math Word Problem Solvers [2.792030485253753]
本稿では,解を生成するために,数学用語の問題解決者が使用する情報について検討する。
本結果から,本モデルでは,入力から多くの単語を除去することには敏感ではないことが明らかとなった。
このことは、自動解法が数学語問題の意味論理に従わず、特定の単語の存在に過度に適合していることを示している。
論文 参考訳(メタデータ) (2023-07-24T21:05:47Z) - Machine Learning Meets The Herbrand Universe [1.5984927623688914]
ヘルブランドの定理は、一階問題のインスタンス化による命題問題への還元を可能にする。
我々は,このタスクを対象とする最初の機械学習システムを開発した。
トレーニングされたシステムは、正しいインスタンスを予測する際に高い精度を達成できることを示す。
論文 参考訳(メタデータ) (2022-10-07T14:46:32Z) - JiuZhang: A Chinese Pre-trained Language Model for Mathematical Problem
Understanding [74.12405417718054]
本稿では,中国初の数学的事前学習言語モデル(PLM)を提示することにより,機械の数学的知性向上を目指す。
他の標準のNLPタスクとは異なり、数学的テキストは問題文に数学的用語、記号、公式を含むため理解が難しい。
基礎課程と上級課程の両方からなる数学PLMの学習を改善するための新しいカリキュラム事前学習手法を設計する。
論文 参考訳(メタデータ) (2022-06-13T17:03:52Z) - Least-to-Most Prompting Enables Complex Reasoning in Large Language
Models [52.59923418570378]
本稿では, 難解な一般化の課題を克服するために, 最小限のプロンプト戦略を提案する。
最小限のプロンプトは、プロンプトで見られるものよりも難しい問題に一般化可能であることを示す。
SCANの解決を専門とする文献におけるニューラルシンボリックモデルは、15,000以上のサンプルを含むトレーニングセット全体をトレーニングする。
論文 参考訳(メタデータ) (2022-05-21T15:34:53Z) - End-to-end Algorithm Synthesis with Recurrent Networks: Logical
Extrapolation Without Overthinking [52.05847268235338]
機械学習システムが問題を過度に考えずに論理的外挿を行う方法を示す。
本稿では,問題インスタンスの明示的なコピーをメモリに保持して,それを忘れないようにするリコールアーキテクチャを提案する。
また、モデルが数に固有の行動を学ぶのを防ぎ、無期限に繰り返される行動を学ぶためにモデルをプッシュするプログレッシブトレーニングルーチンも採用しています。
論文 参考訳(メタデータ) (2022-02-11T18:43:28Z) - A Neural Network Solves and Generates Mathematics Problems by Program
Synthesis: Calculus, Differential Equations, Linear Algebra, and More [8.437319139670116]
質問をプログラミングタスクに変換し、プログラムを自動的に生成し、実行します。
これは、大学レベルの数学コースの質問を自動的に解き、評価し、生成する最初の作品である。
論文 参考訳(メタデータ) (2021-12-31T18:57:31Z) - Solving Linear Algebra by Program Synthesis [1.0660480034605238]
我々は、MITのLinear Algebra 18.06コースとコロンビア大学のComputational Linear Algebra COMS3251コースを、インタラクティブなプログラム合成によって完全な精度で解決する。
この驚くほど強い結果は、コース質問をプログラミングタスクに変換し、プログラムを実行して正しい回答を生成することで達成されます。
論文 参考訳(メタデータ) (2021-11-16T01:16:43Z) - GeoQA: A Geometric Question Answering Benchmark Towards Multimodal
Numerical Reasoning [172.36214872466707]
我々は、テキスト記述、視覚図、定理知識の包括的理解を必要とする幾何学的問題を解くことに注力する。
そこで本研究では,5,010の幾何学的問題を含む幾何学的質問応答データセットGeoQAを提案する。
論文 参考訳(メタデータ) (2021-05-30T12:34:17Z) - SMART: A Situation Model for Algebra Story Problems via Attributed
Grammar [74.1315776256292]
本稿では, 問題解決における人間の精神状態を表現する心理学研究から生まれた, emphsituation modelの概念を紹介する。
提案モデルでは,より優れた解釈性を保ちながら,従来のすべてのニューラルソルバを大きなマージンで上回る結果が得られた。
論文 参考訳(メタデータ) (2020-12-27T21:03:40Z) - Machine Number Sense: A Dataset of Visual Arithmetic Problems for
Abstract and Relational Reasoning [95.18337034090648]
文法モデルを用いて自動生成される視覚的算術問題からなるデータセット、MNS(Machine Number Sense)を提案する。
これらの視覚的算術問題は幾何学的フィギュアの形をしている。
我々は、この視覚的推論タスクのベースラインとして、4つの主要なニューラルネットワークモデルを用いて、MNSデータセットをベンチマークする。
論文 参考訳(メタデータ) (2020-04-25T17:14:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。